OpenAI 推出“锁定模式”:为敏感数据用户提供额外的提示注入防护
OpenAI 近日宣布推出 “锁定模式”(Lockdown Mode),这是一项可选的高级安全设置,旨在限制 OpenAI 产品中能够连接网络或外部服务的工具和功能,从而降低因 提示注入攻击 导致数据泄露的风险。该功能已向符合条件的个人账户(包括免费、Go、Plus、Pro 用户)以及自助式 ChatGPT 商业账户逐步推送。
什么是锁定模式?
锁定模式的核心思路是 限制出站网络请求,阻止攻击者通过提示注入将敏感数据外传。它并非面向所有用户,而是专为处理敏感数据的个人和组织设计,这些用户对数据泄露风险有更高的防护需求。
工作原理:多层防御中的最后一环
提示注入是 AI 领域一个前沿且棘手的安全挑战。OpenAI 表示,他们持续在多层面加固安全系统,包括模型层、产品层和系统层。锁定模式在此基础上,通过 沙箱隔离、基于 URL 的数据外泄防护、监控与执行机制,以及 基于角色的访问控制和审计日志 等企业级控制手段,构成多层防御。
锁定模式的重点在于 阻断数据泄露的最终阶段——即限制出站网络请求,防止敏感数据被传输给攻击者。但需要注意的是,锁定模式 并不能阻止提示注入本身 出现在 ChatGPT 处理的内容中(例如缓存的网页内容或上传的文件里),也无法完全消除注入对模型行为或响应准确性的影响。
锁定模式下哪些功能会受影响?
启用锁定模式后,以下功能将被禁用或受限:
- 实时网页浏览:仅能访问缓存内容,搜索结果可能受限、不可用或已过时。
- 图像支持:ChatGPT 可能无法在常规回复中显示图像或从网络获取图像。用户仍可上传图片文件,图像生成功能(如 DALL·E)保持不变。
- 深度研究(Deep Research):该功能被完全禁用。
适用场景与可用性
锁定模式适用于所有账户类型和工作区,用户必须登录后才能使用。目前该功能正在逐步推送中,若在设置中未看到该选项,说明账户可能暂未获得权限。
对于企业用户而言,锁定模式可以与现有的角色权限、审计日志等企业级控制结合,构建更严格的安全策略。但对于普通用户,由于会牺牲部分便利性,OpenAI 并不建议默认开启。
行业视角
提示注入攻击已成为大语言模型应用中最受关注的安全威胁之一。此前,多家安全研究机构已展示过通过精心构造的提示,诱导模型输出内部数据或执行恶意操作的案例。OpenAI 此次推出锁定模式,可以视作对这类攻击的 针对性防御措施,同时也反映了 AI 安全从“模型安全”向“产品安全”延伸的趋势——不仅要在模型层面抵御注入,还要在系统层面阻断数据泄露通道。
当然,锁定模式并非万能。它无法消除注入本身,也无法覆盖所有潜在的攻击路径(例如通过文件上传间接泄露数据)。对于需要极致安全的环境,仍需结合其他安全措施,如数据脱敏、输入过滤和严格的访问控制。
