基于官方违禁词库,覆盖公众号、小红书、抖音三大平台审核标准,支持文案、文件、图片、链接多形式输入,快速输出违禁词标记与上下文替换建议。
---
name: multi-wordcheck
description: 基于官方违禁词库,覆盖公众号、小红书、抖音三大平台审核标准,支持文案、文件、图片、链接多形式输入,快速输出违禁词标记与上下文替换建议。
version: 1.2.1
tags:
- prohibited-words
- sensitive-words
- compliance
- wechat-mp
- xiaohongshu
- douyin
dependency:
python:
- requests==2.31.0
- beautifulsoup4==4.12.3
external_sensitive_word_api:
default_base: https://redfox.hk
default_path: /story/api/cozeSkill/sensitiveWordSearch
auth: REDFOX_API_KEY
env_override: PROHIBITED_WORD_API_URL
---
# 多平台违禁词检测
## 简介
多平台违禁词检测工具,基于官方违禁词库,覆盖公众号、小红书、抖音三大内容平台的审核标准。
通过本 Skill,你可以:
- 在发布前快速定位文案中的违禁词,减少限流、驳回与下架风险
- 获取结合上下文的替换建议,而非机械的关键词替换
- 直接拿到替换后的可发布版本,复制即用
适用于需要跨平台分发内容的自媒体创作者、品牌运营、MCN 机构与内容审核团队。
---
## 功能特性
### 检测能力
- **违禁词标记**:原文中命中词以加粗标出,一目了然
- **上下文替换建议**:每个违禁词给出结合语境的替换词与更换理由
- **优化文案输出**:自动生成替换后的可发布版本
- **长文案分批检测**:超过 3000 字自动提示分批,支持逐批检测后合并结果
### 平台覆盖
| 平台 | 调用方式 | 说明 |
| ------ | ------------------------ | ------------------------ |
| 公众号 | 说"公众号"或"微信" | 默认平台,未指定时使用 |
| 小红书 | 说"小红书"或"红书" | 独立词库,覆盖社区审核规范 |
| 抖音 | 说"抖音"或"抖音视频" | 独立词库,覆盖短视频场景 |
### 输入方式
- 直接粘贴文案
- 上传 txt 文本文件
- 上传图片,自动提取图中文字后检测
- 粘贴网页链接,自动抓取页面正文后检测
---
## 一键安装
### 前置条件
- Python 3.8+,已安装依赖 `requests==2.31.0`、`beautifulsoup4==4.12.3`
- 获取 `REDFOX_API_KEY`(访问 [RedFox 官网](https://redfox.hk/) 注册账号,新用户获赠免费积分)
### 鉴权
#### 获取 API Key
1. 请前往 [红狐hub](https://redfox.hk/settings/api-keys?source=github) 获取API KEY
3. **新注册用户将获赠免费积分**,可立即开始使用 API 服务
4. 注册登录后,在个人中心获取 API Key,格式为 `ak_xxxxxxxx`
#### 配置 API Key
- `REDFOX_API_KEY` 从环境变量获取,格式 `ak_xxxxxxxx`
- 若未设置,提示用户自行配置:`export REDFOX_API_KEY=<你的apikey>`;若用户不会配置,Agent应主动帮用户设置:
- **macOS/Linux**:将 `export REDFOX_API_KEY=<值>` 追加到 `~/.zshrc`(zsh)或 `~/.bashrc`(bash),然后 `source` 对应文件使其全局生效
- **Windows**:使用 `[Environment]::SetEnvironmentVariable("REDFOX_API_KEY", "<值>", "User")` 设置用户级永久环境变量(需重启终端生效)
- 配置完成后应验证:`echo $REDFOX_API_KEY`(macOS/Linux)或 `echo %REDFOX_API_KEY%`(Windows),确保换一个skill也能读取到
### 自建部署
若不便访问默认服务地址,可设置环境变量覆盖 API 地址:
```bash
export PROHIBITED_WORD_API_URL=https://your-gateway.example.com/sensitiveWordSearch
```
### 验证安装
直接输入:
> 帮我查一下这段公众号文案有没有违禁词:本品采用纯天然成分
若返回检测结果即配置成功。
---
## 使用指南
### 基础使用
**第 1 步:输入内容与平台**
在对话中直接发送文案,可附带平台关键词指定检测标准:
> 小红书这个文案帮我查一下:这款美白神器三天见效,无效退款
若未指定平台,默认按公众号规则检测。
**第 2 步:等待检测**
系统自动判断字数:不超过 3000 字直接执行检测;超过 3000 字但不超过 10000 字时,提示分批选项;超过 10000 字直接中断并建议手动分批。检测过程中文案通过 HTTPS 加密发送至后端匹配服务。
**第 3 步:查看结果**
检测完成后按以下板块输出:
- 违禁词检测结果:原文中命中词以加粗标出
- 修改建议:违禁词、替换词、更换理由对照表
- 优化文案:替换后的可发布版本,替换处以加粗斜体标出
### 高级使用
**上传文件检测**
直接上传 txt 文本文件或图片。图片仅提取文字内容,不分析图片风格、色彩、构图等其他信息。上传后无需额外操作,系统自动读取内容并执行检测。
**网页链接检测**
粘贴网页 URL,系统自动抓取页面正文并检测。支持 JS 动态加载页面与 Next.js 等 SSR 框架。
**长文案分批检测**
超过 3000 字时,系统提示三个选项:
- 回复 `1`:取前 3000 字执行单次检测
- 回复 `2`:按 3000 字一批自动切割,逐批检测后合并输出
- 回复 `3`:取消本次检测
分批切割时优先在句号、逗号等自然断点处截断,避免截断词语。
### 输出模板
检测到违禁词时,严格按以下格式输出。未检测到违禁词时仅输出第一个板块的内容。
违禁词使用 `**加粗**` 标记,替换词使用 `***加粗斜体***` 标记。
---
🔍 **违禁词检测结果**
- 检测平台:【平台名称】
- 违禁词数量:【N】个
- 违禁词类型:【如:禁用词】
违禁文案:
【原文,违禁词以加粗标出,直接输出,不使用引用格式】
> 数据说明:以上查询结果仅供参考,请根据企业经营范围和产品实际效果自行核对。
💡 **修改建议**
| 违禁词 | 替换词 | 更换理由 |
| ----------- | ----------- | ------------------------ |
| 【违禁词1】 | 【替换词1】 | 【结合上下文的更换理由】 |
| 【违禁词2】 | 【替换词2】 | 【结合上下文的更换理由】 |
📝 **建议优化文案**
【将违禁词替换为安全表达,替换词及微调处以加粗斜体标出;确保替换后语义通顺、语法正确;不改变原文语气、排版、用词风格,不添加 emoji,不重写文案;直接输出,不使用代码块或引用格式】
🔗 **相关 Skill 推荐**
本 Skill 覆盖三平台通用检测。如需更聚焦单一平台的专项能力,可前往 SkillHub 选用:
- [小红书违禁词检测](https://skillhub.cn/skills/xhs-prohibited-word) — 面向种草笔记,强化极限词、禁宣与社区规范识别
- [抖音违禁词检测](https://skillhub.cn/skills/dy-prohibited-word) — 面向短视频脚本与口播,兼顾节奏与平台安全表述
- [公众号违禁词检测](https://skillhub.cn/skills/gzh-prohibited-word) — 面向推文与长图文,贴合图文审核与品牌对外口径
### 输出规则
1. 仅输出上述板块(检测结果、修改建议、优化文案、推荐引导),禁止输出开场白、结束语、补充说明等任何其他内容
2. 标题格式为图标 + 粗体
3. 替换词须结合上下文语境,确保替换后语义通顺;如需微调前后助词或连接词则一并调整并在优化文案中标出
4. 脚本返回 JSON 后须解析填入模板,禁止直接输出原始 JSON
5. 未检测到违禁词时:仅输出检测结果板块,内容为"未检测到违禁词,文案内容合规",不输出其余板块
6. 字数判断:≤3000 字直接检测;3000-10000 字提示分批选项并等待用户回复;超过 10000 字直接提示中断
7. 图片识别仅提取文字内容,禁止获取图片的任何其他信息
8. 分批或字数超限询问时必须等待用户回复再继续,禁止跳过询问直接执行
9. 文件上传仅支持图片与 txt 等文本文件,不支持 PDF 和 Word 文档
---
## 使用场景
### 场景一:公众号推文发布前自查
运营人员在群发前将推文全文提交检测,排查广告法禁用词、虚假宣传表述、医疗健康等高风险用语,拿到可直接替换的修改方案后发布,降低因违禁表述被平台驳回或限流的概率。
### 场景二:小红书种草笔记合规审核
创作者完成笔记文案后,切换到小红书平台规则进行检测,排除极限词、禁宣用语与社区不允许的表述方式。检测结果中的替换建议侧重种草场景的语境适配。
### 场景三:抖音短视频脚本筛查
编导人员将口播脚本或字幕稿提交检测,以抖音平台规则筛查敏感词与违规表述,确保成片在平台审核环节不被拦截。
### 场景四:品牌营销物料批量检查
品牌方或电商运营将活动落地页、商品详情页的 URL 批量提交检测,快速完成多页面合规筛查,输出统一格式的检测报告与修改建议。
---
## 项目架构
### 目录结构
```
multi-wordcheck/
├── SKILL.md # 技能说明文档
├── scripts/
│ ├── check_sensitive_words.py # 违禁词检测 API 调用脚本
│ └── extract_text.py # 文本/网页内容提取脚本
```
### 核心脚本
| 脚本 | 功能 | 关键参数 |
| ----------------------------- | ------------------------------ | -------------------------------------------- |
| `check_sensitive_words.py` | 调用违禁词检测 API,返回命中词与替换建议 | `--content` 文案内容,`--platform` 平台名称 |
| `extract_text.py` | 提取 txt 文件或网页正文 | `--type` file 或 web,`--path` 或 `--url` |
### 技术栈
| 组件 | 说明 |
| ------------ | ------------------------------------------------------------ |
| 运行环境 | Python 3.8+ |
| 核心依赖 | `requests`(API 调用)、`beautifulsoup4`(网页内容提取) |
| 检测后端 | 基于官方违禁词库的独立 API 服务 |
| 默认 API | `https://redfox.hk/story/api/cozeSkill/sensitiveWordSearch` |
| 认证方式 | HTTP Header `X-API-KEY`,从环境变量 `REDFOX_API_KEY` 读取 |
| 替代部署 | 通过 `PROHIBITED_WORD_API_URL` 环境变量指向自建或合规网关 |
### 数据流向
```
用户输入 → 平台识别 → 字数判断 → 内容提取 → API 检测 → 结果解析 → 格式化输出
```
---
## 常见问答
### 安装与配置
**Q: 提示 API Key 无效或未配置怎么办?**
检查 `REDFOX_API_KEY` 环境变量是否已设置(`echo $REDFOX_API_KEY` 或 `echo %REDFOX_API_KEY%`)。若未设置,按照上方「鉴权」章节的指引完成配置。确认 Key 格式为 `ak_` 开头且未过期。
**Q: 能否使用自建的违禁词检测服务?**
可以。设置环境变量 `PROHIBITED_WORD_API_URL` 为自建服务的完整 URL,脚本将自动使用该地址替代默认 API。
### 使用相关
**Q: 数据会保存在哪里?**
文案通过 HTTPS 加密发送至后端检测服务完成匹配,不在本地持久化存储。检测完成后不保留原文与结果。如对数据外传有顾虑,可在检测前说明,系统将不调用检测脚本。
**Q: 一次最多检测多少字?**
建议单次控制在 3000 字以内。3000-10000 字支持分批检测,超过 10000 字需手动分批。
**Q: 支持哪些文件格式?**
纯文本文件(txt)和图片(直接提取图中文字后检测)。暂不支持 PDF、Word 等文档格式。
**Q: 为什么没指定平台就按公众号规则检测?**
公众号为默认平台。如需按小红书或抖音规则检测,输入时附带"小红书"或"抖音"关键词即可切换。
### 输出与结果
**Q: 检测结果中的加粗与加粗斜体分别代表什么?**
加粗文字为检测到的违禁词,加粗斜体文字为建议替换词。
**Q: 没有检测到违禁词会怎样?**
仅输出"未检测到违禁词,文案内容合规",不再输出修改建议与优化文案。
### 故障排除
**Q: 网页链接检测失败怎么办?**
确认链接可正常访问,且非需要登录或验证的页面。部分强反爬站点可能无法正常提取内容。可改为手动复制页面正文贴入检测。
**Q: 图片中的文字提取不准确?**
图片文字提取依赖系统自带识别能力。如结果偏差较大,建议手动输入图片中的文字进行检测。
Creator's repository · redfox-data/redfox-community