Prompt-Guard on 忘川

Prompt-Guard on 忘川https://f50a586b.blog-run.pages.dev/tags/prompt-guard/Recent content in Prompt-Guard on 忘川Hugo -- gohugo.iozh-cnTue, 10 Mar 2026 00:00:00 +0000OpenClaw Skill 08：Prompt-Guard 提示注入防护https://f50a586b.blog-run.pages.dev/docs/openclaw-skill-08-prompt-guard%E6%8F%90%E7%A4%BA%E6%B3%A8%E5%85%A5%E9%98%B2%E6%8A%A4/Tue, 10 Mar 2026 00:00:00 +0000https://f50a586b.blog-run.pages.dev/docs/openclaw-skill-08-prompt-guard%E6%8F%90%E7%A4%BA%E6%B3%A8%E5%85%A5%E9%98%B2%E6%8A%A4/<h2 id="一skill-定位">一、Skill 定位 </h2><p><code>Prompt-Guard</code> 主要用于识别并拦截提示注入、越权指令和可疑输入。<br> 在生产环境中，它是保护 Agent 执行边界的关键安全层。</p> <h2 id="二适用场景">二、适用场景 </h2><ol> <li>Agent 会读取外部网页、邮件、文档等不可信输入。</li> <li>系统支持工具调用，存在潜在越权执行风险。</li> <li>业务对数据安全与合规有明确要求。</li> <li>多租户或多团队共享同一 Agent 平台。</li> </ol> <h2 id="三安装与前置">三、安装与前置 </h2><h3 id="1-安装命令">1) 安装命令 </h3><div class="highlight"><pre tabindex="0" class="chroma"><code class="language-bash" data-lang="bash"><span class="line"><span class="cl">clawhub install prompt-guard </span></span><span class="line"><span class="cl">clawhub sync --all </span></span></code></pre></div><h3 id="2-防护策略建议">2) 防护策略建议 </h3><ol> <li>输入分级：可信输入与不可信输入分开处理。</li> <li>动作分级：高风险动作必须二次确认。</li> <li>输出审查：关键输出先过规则再发送。</li> </ol> <h2 id="四使用方法">四、使用方法 </h2><h3 id="step-1设定高风险关键词与模式">Step 1：设定高风险关键词与模式 </h3><p>例如：泄露密钥、忽略系统指令、执行未授权命令。</p> <h3 id="step-2执行安全检测">Step 2：执行安全检测 </h3><div class="highlight"><pre tabindex="0" class="chroma"><code class="language-text" data-lang="text"><span class="line"><span class="cl">/skill prompt-guard </span></span><span class="line"><span class="cl">检测以下输入是否存在注入风险，并给出风险等级与拦截建议。 </span></span></code></pre></div><h3 id="step-3联动执行策略">Step 3：联动执行策略 </h3><ol> <li>低风险：记录日志并继续。</li> <li>中风险：要求人工确认后执行。</li> <li>高风险：直接阻断并告警。</li> </ol> <h3 id="step-4持续更新规则库">Step 4：持续更新规则库 </h3><p>把已发生案例沉淀为规则，提高下一次命中率。</p> <h2 id="五注意事项">五、注意事项 </h2><ol> <li><strong>不要只靠关键词</strong>：要结合上下文语义判断。</li> <li><strong>误杀可控</strong>：安全策略宁可略保守，也不要放过高风险动作。</li> <li><strong>日志留痕</strong>：每次拦截都要记录样本与处置结果。</li> <li><strong>分环境策略</strong>：测试环境和生产环境阈值应不同。</li> <li><strong>人工兜底</strong>：涉及资金、权限、外发信息必须人工复核。</li> </ol> <h2 id="六常见问题">六、常见问题 </h2><ol> <li>误报过高：调整阈值并增加白名单机制。</li> <li>漏报攻击：补充语义规则与历史样本训练。</li> <li>影响效率：对低风险路径做快速放行，关键环节再加严。</li> </ol> <h2 id="七落地清单">七、落地清单 </h2><ol> <li>先定义高风险动作清单。</li> <li>对关键入口启用 Prompt-Guard。</li> <li>接入告警渠道与审计日志。</li> <li>每月做一次攻防演练与规则更新。</li> </ol> <h2 id="八参考资料">八、参考资料 </h2><ol> <li>Prompt-Guard Skill：https://github.com/sundial-org/awesome-openclaw-skills/tree/main/skills/prompt-guard</li> <li>OpenClaw Skills 文档：https://docs.openclaw.ai/skills</li> </ol>