vision-support
Passed all 3 security checks为非多模态模型(如 deepseek-v4-pro、GLM-5.1、mimo-v2.5-pro 等纯文本模型)提供图片识别能力。当主模型无法识别图片、用户发送了截图/设计稿/UI 截图需要分析、或者用户说'看看这张图'、'分析这个截图'、'这张图片有什么问题'时,自动触发此技能。也适用于用户粘贴了图片但当前模型不支持图片输入的任何场景。支持同时识别多张图片,通过配置多个识图模型实现主备回退。使用指令 /skill:vision-support 或 /vision 也可手动触发。铁律:本技能配置的模型仅用于图片内容识别,绝不参与主逻辑推理。注意:如果当前模型本身是多模态模型(如 Claude Sonnet 4、GPT-4o、Gemini 等可以直接识图的模型),不要使用此技能,直接让主模型识别即可。