<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Prompt-Guard on 忘川</title><link>https://f50a586b.blog-run.pages.dev/tags/prompt-guard/</link><description>Recent content in Prompt-Guard on 忘川</description><generator>Hugo -- gohugo.io</generator><language>zh-cn</language><lastBuildDate>Tue, 10 Mar 2026 00:00:00 +0000</lastBuildDate><atom:link href="https://f50a586b.blog-run.pages.dev/tags/prompt-guard/index.xml" rel="self" type="application/rss+xml"/><item><title>OpenClaw Skill 08：Prompt-Guard 提示注入防护</title><link>https://f50a586b.blog-run.pages.dev/docs/openclaw-skill-08-prompt-guard%E6%8F%90%E7%A4%BA%E6%B3%A8%E5%85%A5%E9%98%B2%E6%8A%A4/</link><pubDate>Tue, 10 Mar 2026 00:00:00 +0000</pubDate><guid>https://f50a586b.blog-run.pages.dev/docs/openclaw-skill-08-prompt-guard%E6%8F%90%E7%A4%BA%E6%B3%A8%E5%85%A5%E9%98%B2%E6%8A%A4/</guid><description>&lt;h2 id="一skill-定位"&gt;一、Skill 定位
&lt;/h2&gt;&lt;p&gt;&lt;code&gt;Prompt-Guard&lt;/code&gt; 主要用于识别并拦截提示注入、越权指令和可疑输入。&lt;br&gt;
在生产环境中，它是保护 Agent 执行边界的关键安全层。&lt;/p&gt;
&lt;h2 id="二适用场景"&gt;二、适用场景
&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;Agent 会读取外部网页、邮件、文档等不可信输入。&lt;/li&gt;
&lt;li&gt;系统支持工具调用，存在潜在越权执行风险。&lt;/li&gt;
&lt;li&gt;业务对数据安全与合规有明确要求。&lt;/li&gt;
&lt;li&gt;多租户或多团队共享同一 Agent 平台。&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id="三安装与前置"&gt;三、安装与前置
&lt;/h2&gt;&lt;h3 id="1-安装命令"&gt;1) 安装命令
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-bash" data-lang="bash"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;clawhub install prompt-guard
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;clawhub sync --all
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="2-防护策略建议"&gt;2) 防护策略建议
&lt;/h3&gt;&lt;ol&gt;
&lt;li&gt;输入分级：可信输入与不可信输入分开处理。&lt;/li&gt;
&lt;li&gt;动作分级：高风险动作必须二次确认。&lt;/li&gt;
&lt;li&gt;输出审查：关键输出先过规则再发送。&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id="四使用方法"&gt;四、使用方法
&lt;/h2&gt;&lt;h3 id="step-1设定高风险关键词与模式"&gt;Step 1：设定高风险关键词与模式
&lt;/h3&gt;&lt;p&gt;例如：泄露密钥、忽略系统指令、执行未授权命令。&lt;/p&gt;
&lt;h3 id="step-2执行安全检测"&gt;Step 2：执行安全检测
&lt;/h3&gt;&lt;div class="highlight"&gt;&lt;pre tabindex="0" class="chroma"&gt;&lt;code class="language-text" data-lang="text"&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;/skill prompt-guard
&lt;/span&gt;&lt;/span&gt;&lt;span class="line"&gt;&lt;span class="cl"&gt;检测以下输入是否存在注入风险，并给出风险等级与拦截建议。
&lt;/span&gt;&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;&lt;/div&gt;&lt;h3 id="step-3联动执行策略"&gt;Step 3：联动执行策略
&lt;/h3&gt;&lt;ol&gt;
&lt;li&gt;低风险：记录日志并继续。&lt;/li&gt;
&lt;li&gt;中风险：要求人工确认后执行。&lt;/li&gt;
&lt;li&gt;高风险：直接阻断并告警。&lt;/li&gt;
&lt;/ol&gt;
&lt;h3 id="step-4持续更新规则库"&gt;Step 4：持续更新规则库
&lt;/h3&gt;&lt;p&gt;把已发生案例沉淀为规则，提高下一次命中率。&lt;/p&gt;
&lt;h2 id="五注意事项"&gt;五、注意事项
&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;&lt;strong&gt;不要只靠关键词&lt;/strong&gt;：要结合上下文语义判断。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;误杀可控&lt;/strong&gt;：安全策略宁可略保守，也不要放过高风险动作。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;日志留痕&lt;/strong&gt;：每次拦截都要记录样本与处置结果。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;分环境策略&lt;/strong&gt;：测试环境和生产环境阈值应不同。&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;人工兜底&lt;/strong&gt;：涉及资金、权限、外发信息必须人工复核。&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id="六常见问题"&gt;六、常见问题
&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;误报过高：调整阈值并增加白名单机制。&lt;/li&gt;
&lt;li&gt;漏报攻击：补充语义规则与历史样本训练。&lt;/li&gt;
&lt;li&gt;影响效率：对低风险路径做快速放行，关键环节再加严。&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id="七落地清单"&gt;七、落地清单
&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;先定义高风险动作清单。&lt;/li&gt;
&lt;li&gt;对关键入口启用 Prompt-Guard。&lt;/li&gt;
&lt;li&gt;接入告警渠道与审计日志。&lt;/li&gt;
&lt;li&gt;每月做一次攻防演练与规则更新。&lt;/li&gt;
&lt;/ol&gt;
&lt;h2 id="八参考资料"&gt;八、参考资料
&lt;/h2&gt;&lt;ol&gt;
&lt;li&gt;Prompt-Guard Skill：https://github.com/sundial-org/awesome-openclaw-skills/tree/main/skills/prompt-guard&lt;/li&gt;
&lt;li&gt;OpenClaw Skills 文档：https://docs.openclaw.ai/skills&lt;/li&gt;
&lt;/ol&gt;</description></item></channel></rss>