SheepNav
新上线今天0 投票

OpenAI 推出“锁定模式”,严防提示注入攻击窃取敏感数据

OpenAI 近日宣布推出名为 Lockdown Mode(锁定模式) 的新功能,旨在为 ChatGPT 用户提供针对提示注入攻击的额外防护。提示注入攻击是指攻击者将恶意指令隐藏在网页或其他内容源中,诱使 AI 模型执行非预期操作,甚至泄露敏感信息。

开启 Lockdown Mode 后,ChatGPT 将禁用实时网页浏览(仅可访问缓存内容)、停止从网络检索和显示图片(但仍可生成图片),同时关闭深度研究和 Agent 模式。这一系列限制旨在切断攻击者常用的数据外泄通道。

不过,OpenAI 坦诚地指出,即便启用锁定模式,ChatGPT 仍可能受到提示注入的影响——例如,恶意指令可能出现在缓存网页或上传的文件中,从而影响响应的准确性或行为。尽管如此,该模式的核心目标是降低在交互过程中敏感数据被泄露的可能性

OpenAI 明确表示:“锁定模式并非面向所有用户,而是专为处理敏感数据的个人和组织设计,旨在提供更严格的数据外泄防护。”目前,该功能正在向自助服务的 ChatGPT Business 账户以及符合条件的个人账户逐步推送。

行业背景与意义

提示注入攻击已成为大语言模型(LLM)安全领域最棘手的挑战之一。随着企业将 AI 集成到工作流中,攻击者不断利用模型对上下文的依赖,通过构造特殊输入绕过安全过滤。OpenAI 此次推出的锁定模式,本质上是一种防御性降级策略——通过主动牺牲部分功能(如实时浏览、图像检索),来换取更高的数据安全性。这与一些安全厂商提出的“最小权限原则”高度一致,即限制模型与外部资源的交互面,从而减少攻击向量。

对于金融、医疗、法律等对数据合规要求极高的行业,锁定模式提供了一种可选的“安全模式”。但需要警惕的是,该模式并非万能。安全专家指出,缓存污染、文件上传等途径仍可能绕过防护,且锁定模式可能影响正常使用体验。因此,组织在部署时仍需结合其他安全措施,如输入过滤、输出审计和员工培训。

总结

OpenAI 的 Lockdown Mode 是对抗提示注入攻击的一次务实尝试。它不追求绝对安全,而是通过功能取舍实现风险可控。对于处理敏感数据的用户而言,这是一个值得启用的选项;但对于普通用户,日常使用可能无需开启,以免降低 ChatGPT 的实用性和灵活性。

延伸阅读

  1. WWDC 2026 前瞻:Siri 重大改版与 Apple Intelligence 更新
  2. 白宫AI顾问斯里拉姆·克里希南将于6月底离职,计划创建新机构继续影响特朗普AI政策
  3. 特朗普政府或考虑入股OpenAI,AI产业迎来公私合营新变局
查看原文