OpenAI 锁定模式：防提示注入攻击保护敏感数据

OpenAI 近日宣布推出名为 Lockdown Mode（锁定模式） 的新功能，旨在为 ChatGPT 用户提供针对提示注入攻击的额外防护。提示注入攻击是指攻击者将恶意指令隐藏在网页或其他内容源中，诱使 AI 模型执行非预期操作，甚至泄露敏感信息。

开启 Lockdown Mode 后，ChatGPT 将禁用实时网页浏览（仅可访问缓存内容）、停止从网络检索和显示图片（但仍可生成图片），同时关闭深度研究和 Agent 模式。这一系列限制旨在切断攻击者常用的数据外泄通道。

不过，OpenAI 坦诚地指出，即便启用锁定模式，ChatGPT 仍可能受到提示注入的影响——例如，恶意指令可能出现在缓存网页或上传的文件中，从而影响响应的准确性或行为。尽管如此，该模式的核心目标是降低在交互过程中敏感数据被泄露的可能性。

OpenAI 明确表示：“锁定模式并非面向所有用户，而是专为处理敏感数据的个人和组织设计，旨在提供更严格的数据外泄防护。”目前，该功能正在向自助服务的 ChatGPT Business 账户以及符合条件的个人账户逐步推送。

行业背景与意义

提示注入攻击已成为大语言模型（LLM）安全领域最棘手的挑战之一。随着企业将 AI 集成到工作流中，攻击者不断利用模型对上下文的依赖，通过构造特殊输入绕过安全过滤。OpenAI 此次推出的锁定模式，本质上是一种防御性降级策略——通过主动牺牲部分功能（如实时浏览、图像检索），来换取更高的数据安全性。这与一些安全厂商提出的“最小权限原则”高度一致，即限制模型与外部资源的交互面，从而减少攻击向量。

对于金融、医疗、法律等对数据合规要求极高的行业，锁定模式提供了一种可选的“安全模式”。但需要警惕的是，该模式并非万能。安全专家指出，缓存污染、文件上传等途径仍可能绕过防护，且锁定模式可能影响正常使用体验。因此，组织在部署时仍需结合其他安全措施，如输入过滤、输出审计和员工培训。

总结

OpenAI 的 Lockdown Mode 是对抗提示注入攻击的一次务实尝试。它不追求绝对安全，而是通过功能取舍实现风险可控。对于处理敏感数据的用户而言，这是一个值得启用的选项；但对于普通用户，日常使用可能无需开启，以免降低 ChatGPT 的实用性和灵活性。

OpenAI 推出“锁定模式”，严防提示注入攻击窃取敏感数据

行业背景与意义

总结

延伸阅读

相关资讯