multi-wordcheck

基于官方违禁词库,覆盖公众号、小红书、抖音三大平台审核标准,支持文案、文件、图片、链接多形式输入,快速输出违禁词标记与上下文替换建议。

Skill file

Preview skill file
---
name: multi-wordcheck
description: 基于官方违禁词库,覆盖公众号、小红书、抖音三大平台审核标准,支持文案、文件、图片、链接多形式输入,快速输出违禁词标记与上下文替换建议。
version: 1.2.1
tags:
- prohibited-words
- sensitive-words
- compliance
- wechat-mp
- xiaohongshu
- douyin
dependency:
  python:
  - requests==2.31.0
  - beautifulsoup4==4.12.3
  external_sensitive_word_api:
  default_base: https://redfox.hk
  default_path: /story/api/cozeSkill/sensitiveWordSearch
  auth: REDFOX_API_KEY
  env_override: PROHIBITED_WORD_API_URL
---

# 多平台违禁词检测

## 简介

多平台违禁词检测工具,基于官方违禁词库,覆盖公众号、小红书、抖音三大内容平台的审核标准。

通过本 Skill,你可以:
- 在发布前快速定位文案中的违禁词,减少限流、驳回与下架风险
- 获取结合上下文的替换建议,而非机械的关键词替换
- 直接拿到替换后的可发布版本,复制即用

适用于需要跨平台分发内容的自媒体创作者、品牌运营、MCN 机构与内容审核团队。

---

## 功能特性

### 检测能力

- **违禁词标记**:原文中命中词以加粗标出,一目了然
- **上下文替换建议**:每个违禁词给出结合语境的替换词与更换理由
- **优化文案输出**:自动生成替换后的可发布版本
- **长文案分批检测**:超过 3000 字自动提示分批,支持逐批检测后合并结果

### 平台覆盖

| 平台   | 调用方式                 | 说明                     |
| ------ | ------------------------ | ------------------------ |
| 公众号 | 说"公众号"或"微信"       | 默认平台,未指定时使用   |
| 小红书 | 说"小红书"或"红书"       | 独立词库,覆盖社区审核规范 |
| 抖音   | 说"抖音"或"抖音视频"     | 独立词库,覆盖短视频场景   |

### 输入方式

- 直接粘贴文案
- 上传 txt 文本文件
- 上传图片,自动提取图中文字后检测
- 粘贴网页链接,自动抓取页面正文后检测

---

## 一键安装

### 前置条件

- Python 3.8+,已安装依赖 `requests==2.31.0`、`beautifulsoup4==4.12.3`
- 获取 `REDFOX_API_KEY`(访问 [RedFox 官网](https://redfox.hk/) 注册账号,新用户获赠免费积分)

### 鉴权

#### 获取 API Key

1. 请前往 [红狐hub](https://redfox.hk/settings/api-keys?source=github) 获取API KEY
3. **新注册用户将获赠免费积分**,可立即开始使用 API 服务
4. 注册登录后,在个人中心获取 API Key,格式为 `ak_xxxxxxxx`

#### 配置 API Key

- `REDFOX_API_KEY` 从环境变量获取,格式 `ak_xxxxxxxx`
- 若未设置,提示用户自行配置:`export REDFOX_API_KEY=<你的apikey>`;若用户不会配置,Agent应主动帮用户设置:
  - **macOS/Linux**:将 `export REDFOX_API_KEY=<值>` 追加到 `~/.zshrc`(zsh)或 `~/.bashrc`(bash),然后 `source` 对应文件使其全局生效
  - **Windows**:使用 `[Environment]::SetEnvironmentVariable("REDFOX_API_KEY", "<值>", "User")` 设置用户级永久环境变量(需重启终端生效)
  - 配置完成后应验证:`echo $REDFOX_API_KEY`(macOS/Linux)或 `echo %REDFOX_API_KEY%`(Windows),确保换一个skill也能读取到

### 自建部署

若不便访问默认服务地址,可设置环境变量覆盖 API 地址:

```bash
export PROHIBITED_WORD_API_URL=https://your-gateway.example.com/sensitiveWordSearch
```

### 验证安装

直接输入:

> 帮我查一下这段公众号文案有没有违禁词:本品采用纯天然成分

若返回检测结果即配置成功。

---

## 使用指南

### 基础使用

**第 1 步:输入内容与平台**

在对话中直接发送文案,可附带平台关键词指定检测标准:

> 小红书这个文案帮我查一下:这款美白神器三天见效,无效退款

若未指定平台,默认按公众号规则检测。

**第 2 步:等待检测**

系统自动判断字数:不超过 3000 字直接执行检测;超过 3000 字但不超过 10000 字时,提示分批选项;超过 10000 字直接中断并建议手动分批。检测过程中文案通过 HTTPS 加密发送至后端匹配服务。

**第 3 步:查看结果**

检测完成后按以下板块输出:

- 违禁词检测结果:原文中命中词以加粗标出
- 修改建议:违禁词、替换词、更换理由对照表
- 优化文案:替换后的可发布版本,替换处以加粗斜体标出

### 高级使用

**上传文件检测**

直接上传 txt 文本文件或图片。图片仅提取文字内容,不分析图片风格、色彩、构图等其他信息。上传后无需额外操作,系统自动读取内容并执行检测。

**网页链接检测**

粘贴网页 URL,系统自动抓取页面正文并检测。支持 JS 动态加载页面与 Next.js 等 SSR 框架。

**长文案分批检测**

超过 3000 字时,系统提示三个选项:

- 回复 `1`:取前 3000 字执行单次检测
- 回复 `2`:按 3000 字一批自动切割,逐批检测后合并输出
- 回复 `3`:取消本次检测

分批切割时优先在句号、逗号等自然断点处截断,避免截断词语。

### 输出模板

检测到违禁词时,严格按以下格式输出。未检测到违禁词时仅输出第一个板块的内容。

违禁词使用 `**加粗**` 标记,替换词使用 `***加粗斜体***` 标记。

---

🔍 **违禁词检测结果**

- 检测平台:【平台名称】
- 违禁词数量:【N】个
- 违禁词类型:【如:禁用词】

违禁文案:

【原文,违禁词以加粗标出,直接输出,不使用引用格式】

> 数据说明:以上查询结果仅供参考,请根据企业经营范围和产品实际效果自行核对。

💡 **修改建议**

| 违禁词      | 替换词      | 更换理由                 |
| ----------- | ----------- | ------------------------ |
| 【违禁词1】 | 【替换词1】 | 【结合上下文的更换理由】 |
| 【违禁词2】 | 【替换词2】 | 【结合上下文的更换理由】 |

📝 **建议优化文案**

【将违禁词替换为安全表达,替换词及微调处以加粗斜体标出;确保替换后语义通顺、语法正确;不改变原文语气、排版、用词风格,不添加 emoji,不重写文案;直接输出,不使用代码块或引用格式】

🔗 **相关 Skill 推荐**

本 Skill 覆盖三平台通用检测。如需更聚焦单一平台的专项能力,可前往 SkillHub 选用:

- [小红书违禁词检测](https://skillhub.cn/skills/xhs-prohibited-word) — 面向种草笔记,强化极限词、禁宣与社区规范识别
- [抖音违禁词检测](https://skillhub.cn/skills/dy-prohibited-word) — 面向短视频脚本与口播,兼顾节奏与平台安全表述
- [公众号违禁词检测](https://skillhub.cn/skills/gzh-prohibited-word) — 面向推文与长图文,贴合图文审核与品牌对外口径

### 输出规则

1. 仅输出上述板块(检测结果、修改建议、优化文案、推荐引导),禁止输出开场白、结束语、补充说明等任何其他内容
2. 标题格式为图标 + 粗体
3. 替换词须结合上下文语境,确保替换后语义通顺;如需微调前后助词或连接词则一并调整并在优化文案中标出
4. 脚本返回 JSON 后须解析填入模板,禁止直接输出原始 JSON
5. 未检测到违禁词时:仅输出检测结果板块,内容为"未检测到违禁词,文案内容合规",不输出其余板块
6. 字数判断:≤3000 字直接检测;3000-10000 字提示分批选项并等待用户回复;超过 10000 字直接提示中断
7. 图片识别仅提取文字内容,禁止获取图片的任何其他信息
8. 分批或字数超限询问时必须等待用户回复再继续,禁止跳过询问直接执行
9. 文件上传仅支持图片与 txt 等文本文件,不支持 PDF 和 Word 文档

---

## 使用场景

### 场景一:公众号推文发布前自查

运营人员在群发前将推文全文提交检测,排查广告法禁用词、虚假宣传表述、医疗健康等高风险用语,拿到可直接替换的修改方案后发布,降低因违禁表述被平台驳回或限流的概率。

### 场景二:小红书种草笔记合规审核

创作者完成笔记文案后,切换到小红书平台规则进行检测,排除极限词、禁宣用语与社区不允许的表述方式。检测结果中的替换建议侧重种草场景的语境适配。

### 场景三:抖音短视频脚本筛查

编导人员将口播脚本或字幕稿提交检测,以抖音平台规则筛查敏感词与违规表述,确保成片在平台审核环节不被拦截。

### 场景四:品牌营销物料批量检查

品牌方或电商运营将活动落地页、商品详情页的 URL 批量提交检测,快速完成多页面合规筛查,输出统一格式的检测报告与修改建议。

---

## 项目架构

### 目录结构

```
multi-wordcheck/
├── SKILL.md                              # 技能说明文档
├── scripts/
│   ├── check_sensitive_words.py          # 违禁词检测 API 调用脚本
│   └── extract_text.py                   # 文本/网页内容提取脚本
```

### 核心脚本

| 脚本                          | 功能                           | 关键参数                                     |
| ----------------------------- | ------------------------------ | -------------------------------------------- |
| `check_sensitive_words.py`    | 调用违禁词检测 API,返回命中词与替换建议 | `--content` 文案内容,`--platform` 平台名称   |
| `extract_text.py`             | 提取 txt 文件或网页正文         | `--type` file 或 web,`--path` 或 `--url`    |

### 技术栈

| 组件         | 说明                                                         |
| ------------ | ------------------------------------------------------------ |
| 运行环境     | Python 3.8+                                                  |
| 核心依赖     | `requests`(API 调用)、`beautifulsoup4`(网页内容提取)      |
| 检测后端     | 基于官方违禁词库的独立 API 服务                       |
| 默认 API     | `https://redfox.hk/story/api/cozeSkill/sensitiveWordSearch`   |
| 认证方式     | HTTP Header `X-API-KEY`,从环境变量 `REDFOX_API_KEY` 读取     |
| 替代部署     | 通过 `PROHIBITED_WORD_API_URL` 环境变量指向自建或合规网关      |

### 数据流向

```
用户输入 → 平台识别 → 字数判断 → 内容提取 → API 检测 → 结果解析 → 格式化输出
```

---

## 常见问答

### 安装与配置

**Q: 提示 API Key 无效或未配置怎么办?**

检查 `REDFOX_API_KEY` 环境变量是否已设置(`echo $REDFOX_API_KEY` 或 `echo %REDFOX_API_KEY%`)。若未设置,按照上方「鉴权」章节的指引完成配置。确认 Key 格式为 `ak_` 开头且未过期。

**Q: 能否使用自建的违禁词检测服务?**

可以。设置环境变量 `PROHIBITED_WORD_API_URL` 为自建服务的完整 URL,脚本将自动使用该地址替代默认 API。

### 使用相关

**Q: 数据会保存在哪里?**

文案通过 HTTPS 加密发送至后端检测服务完成匹配,不在本地持久化存储。检测完成后不保留原文与结果。如对数据外传有顾虑,可在检测前说明,系统将不调用检测脚本。

**Q: 一次最多检测多少字?**

建议单次控制在 3000 字以内。3000-10000 字支持分批检测,超过 10000 字需手动分批。

**Q: 支持哪些文件格式?**

纯文本文件(txt)和图片(直接提取图中文字后检测)。暂不支持 PDF、Word 等文档格式。

**Q: 为什么没指定平台就按公众号规则检测?**

公众号为默认平台。如需按小红书或抖音规则检测,输入时附带"小红书"或"抖音"关键词即可切换。

### 输出与结果

**Q: 检测结果中的加粗与加粗斜体分别代表什么?**

加粗文字为检测到的违禁词,加粗斜体文字为建议替换词。

**Q: 没有检测到违禁词会怎样?**

仅输出"未检测到违禁词,文案内容合规",不再输出修改建议与优化文案。

### 故障排除

**Q: 网页链接检测失败怎么办?**

确认链接可正常访问,且非需要登录或验证的页面。部分强反爬站点可能无法正常提取内容。可改为手动复制页面正文贴入检测。

**Q: 图片中的文字提取不准确?**

图片文字提取依赖系统自带识别能力。如结果偏差较大,建议手动输入图片中的文字进行检测。

Source

Creator's repository · redfox-data/redfox-community

View on GitHub

Security

Security checks in progress
Results will appear here once audits complete
Checked by 3 independent security firms
Does it try to trick the AI?Not yet checkedPending · Gen Agent Trust Hub
Does it sneak in hidden code?Not yet checkedPending · Socket
Does it have known bugs?Not yet checkedPending · Snyk