OpenAI 锁定模式：防止提示注入数据泄露的新安全设置

OpenAI 近日宣布推出 “锁定模式”（Lockdown Mode），这是一项可选的高级安全设置，旨在限制 OpenAI 产品中能够连接网络或外部服务的工具和功能，从而降低因 提示注入攻击 导致数据泄露的风险。该功能已向符合条件的个人账户（包括免费、Go、Plus、Pro 用户）以及自助式 ChatGPT 商业账户逐步推送。

什么是锁定模式？

锁定模式的核心思路是 限制出站网络请求，阻止攻击者通过提示注入将敏感数据外传。它并非面向所有用户，而是专为处理敏感数据的个人和组织设计，这些用户对数据泄露风险有更高的防护需求。

工作原理：多层防御中的最后一环

提示注入是 AI 领域一个前沿且棘手的安全挑战。OpenAI 表示，他们持续在多层面加固安全系统，包括模型层、产品层和系统层。锁定模式在此基础上，通过 沙箱隔离、基于 URL 的数据外泄防护、监控与执行机制，以及 基于角色的访问控制和审计日志 等企业级控制手段，构成多层防御。

锁定模式的重点在于 阻断数据泄露的最终阶段——即限制出站网络请求，防止敏感数据被传输给攻击者。但需要注意的是，锁定模式 并不能阻止提示注入本身 出现在 ChatGPT 处理的内容中（例如缓存的网页内容或上传的文件里），也无法完全消除注入对模型行为或响应准确性的影响。

锁定模式下哪些功能会受影响？

启用锁定模式后，以下功能将被禁用或受限：

实时网页浏览：仅能访问缓存内容，搜索结果可能受限、不可用或已过时。
图像支持：ChatGPT 可能无法在常规回复中显示图像或从网络获取图像。用户仍可上传图片文件，图像生成功能（如 DALL·E）保持不变。
深度研究（Deep Research）：该功能被完全禁用。

适用场景与可用性

锁定模式适用于所有账户类型和工作区，用户必须登录后才能使用。目前该功能正在逐步推送中，若在设置中未看到该选项，说明账户可能暂未获得权限。

对于企业用户而言，锁定模式可以与现有的角色权限、审计日志等企业级控制结合，构建更严格的安全策略。但对于普通用户，由于会牺牲部分便利性，OpenAI 并不建议默认开启。

行业视角

提示注入攻击已成为大语言模型应用中最受关注的安全威胁之一。此前，多家安全研究机构已展示过通过精心构造的提示，诱导模型输出内部数据或执行恶意操作的案例。OpenAI 此次推出锁定模式，可以视作对这类攻击的 针对性防御措施，同时也反映了 AI 安全从“模型安全”向“产品安全”延伸的趋势——不仅要在模型层面抵御注入，还要在系统层面阻断数据泄露通道。

当然，锁定模式并非万能。它无法消除注入本身，也无法覆盖所有潜在的攻击路径（例如通过文件上传间接泄露数据）。对于需要极致安全的环境，仍需结合其他安全措施，如数据脱敏、输入过滤和严格的访问控制。

OpenAI 推出“锁定模式”：为敏感数据用户提供额外的提示注入防护

什么是锁定模式？

工作原理：多层防御中的最后一环

锁定模式下哪些功能会受影响？

适用场景与可用性

行业视角

延伸阅读

相关资讯