multi-wordcheck

基于官方违禁词库，覆盖公众号、小红书、抖音三大平台审核标准，支持文案、文件、图片、链接多形式输入，快速输出违禁词标记与上下文替换建议。
Skill file

Preview skill file↓↑
---
name: multi-wordcheck
description: 基于官方违禁词库，覆盖公众号、小红书、抖音三大平台审核标准，支持文案、文件、图片、链接多形式输入，快速输出违禁词标记与上下文替换建议。
version: 1.2.1
tags:
- prohibited-words
- sensitive-words
- compliance
- wechat-mp
- xiaohongshu
- douyin
dependency:
  python:
  - requests==2.31.0
  - beautifulsoup4==4.12.3
  external_sensitive_word_api:
  default_base: https://redfox.hk
  default_path: /story/api/cozeSkill/sensitiveWordSearch
  auth: REDFOX_API_KEY
  env_override: PROHIBITED_WORD_API_URL
---

# 多平台违禁词检测

## 简介

多平台违禁词检测工具，基于官方违禁词库，覆盖公众号、小红书、抖音三大内容平台的审核标准。

通过本 Skill，你可以：
- 在发布前快速定位文案中的违禁词，减少限流、驳回与下架风险
- 获取结合上下文的替换建议，而非机械的关键词替换
- 直接拿到替换后的可发布版本，复制即用

适用于需要跨平台分发内容的自媒体创作者、品牌运营、MCN 机构与内容审核团队。

---

## 功能特性

### 检测能力

- **违禁词标记**：原文中命中词以加粗标出，一目了然
- **上下文替换建议**：每个违禁词给出结合语境的替换词与更换理由
- **优化文案输出**：自动生成替换后的可发布版本
- **长文案分批检测**：超过 3000 字自动提示分批，支持逐批检测后合并结果

### 平台覆盖

| 平台   | 调用方式                 | 说明                     |
| ------ | ------------------------ | ------------------------ |
| 公众号 | 说"公众号"或"微信"       | 默认平台，未指定时使用   |
| 小红书 | 说"小红书"或"红书"       | 独立词库，覆盖社区审核规范 |
| 抖音   | 说"抖音"或"抖音视频"     | 独立词库，覆盖短视频场景   |

### 输入方式

- 直接粘贴文案
- 上传 txt 文本文件
- 上传图片，自动提取图中文字后检测
- 粘贴网页链接，自动抓取页面正文后检测

---

## 一键安装

### 前置条件

- Python 3.8+，已安装依赖 `requests==2.31.0`、`beautifulsoup4==4.12.3`
- 获取 `REDFOX_API_KEY`（访问 [RedFox 官网](https://redfox.hk/) 注册账号，新用户获赠免费积分）

### 鉴权

#### 获取 API Key

1. 请前往 [红狐hub](https://redfox.hk/settings/api-keys?source=github) 获取API KEY
3. **新注册用户将获赠免费积分**，可立即开始使用 API 服务
4. 注册登录后，在个人中心获取 API Key，格式为 `ak_xxxxxxxx`

#### 配置 API Key

- `REDFOX_API_KEY` 从环境变量获取，格式 `ak_xxxxxxxx`
- 若未设置，提示用户自行配置：`export REDFOX_API_KEY=<你的apikey>`；若用户不会配置，Agent应主动帮用户设置：
  - **macOS/Linux**：将 `export REDFOX_API_KEY=<值>` 追加到 `~/.zshrc`（zsh）或 `~/.bashrc`（bash），然后 `source` 对应文件使其全局生效
  - **Windows**：使用 `[Environment]::SetEnvironmentVariable("REDFOX_API_KEY", "<值>", "User")` 设置用户级永久环境变量（需重启终端生效）
  - 配置完成后应验证：`echo $REDFOX_API_KEY`（macOS/Linux）或 `echo %REDFOX_API_KEY%`（Windows），确保换一个skill也能读取到

### 自建部署

若不便访问默认服务地址，可设置环境变量覆盖 API 地址：

```bash
export PROHIBITED_WORD_API_URL=https://your-gateway.example.com/sensitiveWordSearch
```

### 验证安装

直接输入：

> 帮我查一下这段公众号文案有没有违禁词：本品采用纯天然成分

若返回检测结果即配置成功。

---

## 使用指南

### 基础使用

**第 1 步：输入内容与平台**

在对话中直接发送文案，可附带平台关键词指定检测标准：

> 小红书这个文案帮我查一下：这款美白神器三天见效，无效退款

若未指定平台，默认按公众号规则检测。

**第 2 步：等待检测**

系统自动判断字数：不超过 3000 字直接执行检测；超过 3000 字但不超过 10000 字时，提示分批选项；超过 10000 字直接中断并建议手动分批。检测过程中文案通过 HTTPS 加密发送至后端匹配服务。

**第 3 步：查看结果**

检测完成后按以下板块输出：

- 违禁词检测结果：原文中命中词以加粗标出
- 修改建议：违禁词、替换词、更换理由对照表
- 优化文案：替换后的可发布版本，替换处以加粗斜体标出

### 高级使用

**上传文件检测**

直接上传 txt 文本文件或图片。图片仅提取文字内容，不分析图片风格、色彩、构图等其他信息。上传后无需额外操作，系统自动读取内容并执行检测。

**网页链接检测**

粘贴网页 URL，系统自动抓取页面正文并检测。支持 JS 动态加载页面与 Next.js 等 SSR 框架。

**长文案分批检测**

超过 3000 字时，系统提示三个选项：

- 回复 `1`：取前 3000 字执行单次检测
- 回复 `2`：按 3000 字一批自动切割，逐批检测后合并输出
- 回复 `3`：取消本次检测

分批切割时优先在句号、逗号等自然断点处截断，避免截断词语。

### 输出模板

检测到违禁词时，严格按以下格式输出。未检测到违禁词时仅输出第一个板块的内容。

违禁词使用 `**加粗**` 标记，替换词使用 `***加粗斜体***` 标记。

---

🔍 **违禁词检测结果**

- 检测平台：【平台名称】
- 违禁词数量：【N】个
- 违禁词类型：【如：禁用词】

违禁文案：

【原文，违禁词以加粗标出，直接输出，不使用引用格式】

> 数据说明：以上查询结果仅供参考，请根据企业经营范围和产品实际效果自行核对。

💡 **修改建议**

| 违禁词      | 替换词      | 更换理由                 |
| ----------- | ----------- | ------------------------ |
| 【违禁词1】 | 【替换词1】 | 【结合上下文的更换理由】 |
| 【违禁词2】 | 【替换词2】 | 【结合上下文的更换理由】 |

📝 **建议优化文案**

【将违禁词替换为安全表达，替换词及微调处以加粗斜体标出；确保替换后语义通顺、语法正确；不改变原文语气、排版、用词风格，不添加 emoji，不重写文案；直接输出，不使用代码块或引用格式】

🔗 **相关 Skill 推荐**

本 Skill 覆盖三平台通用检测。如需更聚焦单一平台的专项能力，可前往 SkillHub 选用：

- [小红书违禁词检测](https://skillhub.cn/skills/xhs-prohibited-word) — 面向种草笔记，强化极限词、禁宣与社区规范识别
- [抖音违禁词检测](https://skillhub.cn/skills/dy-prohibited-word) — 面向短视频脚本与口播，兼顾节奏与平台安全表述
- [公众号违禁词检测](https://skillhub.cn/skills/gzh-prohibited-word) — 面向推文与长图文，贴合图文审核与品牌对外口径

### 输出规则

1. 仅输出上述板块（检测结果、修改建议、优化文案、推荐引导），禁止输出开场白、结束语、补充说明等任何其他内容
2. 标题格式为图标 + 粗体
3. 替换词须结合上下文语境，确保替换后语义通顺；如需微调前后助词或连接词则一并调整并在优化文案中标出
4. 脚本返回 JSON 后须解析填入模板，禁止直接输出原始 JSON
5. 未检测到违禁词时：仅输出检测结果板块，内容为"未检测到违禁词，文案内容合规"，不输出其余板块
6. 字数判断：≤3000 字直接检测；3000-10000 字提示分批选项并等待用户回复；超过 10000 字直接提示中断
7. 图片识别仅提取文字内容，禁止获取图片的任何其他信息
8. 分批或字数超限询问时必须等待用户回复再继续，禁止跳过询问直接执行
9. 文件上传仅支持图片与 txt 等文本文件，不支持 PDF 和 Word 文档

---

## 使用场景

### 场景一：公众号推文发布前自查

运营人员在群发前将推文全文提交检测，排查广告法禁用词、虚假宣传表述、医疗健康等高风险用语，拿到可直接替换的修改方案后发布，降低因违禁表述被平台驳回或限流的概率。

### 场景二：小红书种草笔记合规审核

创作者完成笔记文案后，切换到小红书平台规则进行检测，排除极限词、禁宣用语与社区不允许的表述方式。检测结果中的替换建议侧重种草场景的语境适配。

### 场景三：抖音短视频脚本筛查

编导人员将口播脚本或字幕稿提交检测，以抖音平台规则筛查敏感词与违规表述，确保成片在平台审核环节不被拦截。

### 场景四：品牌营销物料批量检查

品牌方或电商运营将活动落地页、商品详情页的 URL 批量提交检测，快速完成多页面合规筛查，输出统一格式的检测报告与修改建议。

---

## 项目架构

### 目录结构

```
multi-wordcheck/
├── SKILL.md                              # 技能说明文档
├── scripts/
│   ├── check_sensitive_words.py          # 违禁词检测 API 调用脚本
│   └── extract_text.py                   # 文本/网页内容提取脚本
```

### 核心脚本

| 脚本                          | 功能                           | 关键参数                                     |
| ----------------------------- | ------------------------------ | -------------------------------------------- |
| `check_sensitive_words.py`    | 调用违禁词检测 API，返回命中词与替换建议 | `--content` 文案内容，`--platform` 平台名称   |
| `extract_text.py`             | 提取 txt 文件或网页正文         | `--type` file 或 web，`--path` 或 `--url`    |

### 技术栈

| 组件         | 说明                                                         |
| ------------ | ------------------------------------------------------------ |
| 运行环境     | Python 3.8+                                                  |
| 核心依赖     | `requests`（API 调用）、`beautifulsoup4`（网页内容提取）      |
| 检测后端     | 基于官方违禁词库的独立 API 服务                       |
| 默认 API     | `https://redfox.hk/story/api/cozeSkill/sensitiveWordSearch`   |
| 认证方式     | HTTP Header `X-API-KEY`，从环境变量 `REDFOX_API_KEY` 读取     |
| 替代部署     | 通过 `PROHIBITED_WORD_API_URL` 环境变量指向自建或合规网关      |

### 数据流向

```
用户输入 → 平台识别 → 字数判断 → 内容提取 → API 检测 → 结果解析 → 格式化输出
```

---

## 常见问答

### 安装与配置

**Q: 提示 API Key 无效或未配置怎么办？**

检查 `REDFOX_API_KEY` 环境变量是否已设置（`echo $REDFOX_API_KEY` 或 `echo %REDFOX_API_KEY%`）。若未设置，按照上方「鉴权」章节的指引完成配置。确认 Key 格式为 `ak_` 开头且未过期。

**Q: 能否使用自建的违禁词检测服务？**

可以。设置环境变量 `PROHIBITED_WORD_API_URL` 为自建服务的完整 URL，脚本将自动使用该地址替代默认 API。

### 使用相关

**Q: 数据会保存在哪里？**

文案通过 HTTPS 加密发送至后端检测服务完成匹配，不在本地持久化存储。检测完成后不保留原文与结果。如对数据外传有顾虑，可在检测前说明，系统将不调用检测脚本。

**Q: 一次最多检测多少字？**

建议单次控制在 3000 字以内。3000-10000 字支持分批检测，超过 10000 字需手动分批。

**Q: 支持哪些文件格式？**

纯文本文件（txt）和图片（直接提取图中文字后检测）。暂不支持 PDF、Word 等文档格式。

**Q: 为什么没指定平台就按公众号规则检测？**

公众号为默认平台。如需按小红书或抖音规则检测，输入时附带"小红书"或"抖音"关键词即可切换。

### 输出与结果

**Q: 检测结果中的加粗与加粗斜体分别代表什么？**

加粗文字为检测到的违禁词，加粗斜体文字为建议替换词。

**Q: 没有检测到违禁词会怎样？**

仅输出"未检测到违禁词，文案内容合规"，不再输出修改建议与优化文案。

### 故障排除

**Q: 网页链接检测失败怎么办？**

确认链接可正常访问，且非需要登录或验证的页面。部分强反爬站点可能无法正常提取内容。可改为手动复制页面正文贴入检测。

**Q: 图片中的文字提取不准确？**

图片文字提取依赖系统自带识别能力。如结果偏差较大，建议手动输入图片中的文字进行检测。
Source

Creator's repository · redfox-data/redfox-community
View on GitHub ↗
Security

Security checks in progress
Results will appear here once audits complete
Checked by 3 independent security firms
Does it try to trick the AI?Not yet checkedPending · Gen Agent Trust Hub
Does it sneak in hidden code?Not yet checkedPending · Socket
Does it have known bugs?Not yet checkedPending · Snyk