
“危险”AI模型势不可挡:Anthropic事件背后的行业真相
上周晚些时候,Anthropic 应美国政府出口管制指令,将新发布的 Claude Fable 5 和 Mythos 5 AI 模型下线,禁止“任何外国公民”使用。自 4 月 Mythos 首次亮相以来,Anthropic 便警告该模型具有双重用途:既能帮助防御者发现软件漏洞,也能被恶意行为者利用进行攻击。公司最初通过 Project Glasswing 工作组向特定财团私下发布了 Mythos 5,而 Claude Fable 5 作为 Mythos 级别的模型,则面向公众发布并设置了生物与网络安全方面的防护栏。然而,特朗普政府认为 Fable 5 的防护可被绕过,从而完全释放 Mythos 5 的能力,构成国家安全风险。
但专家指出,这场机构间的冲突只是掩盖了一个残酷事实:Anthropic 只是冰山一角,多家公司及开源开发者很快(或已经)拥有类似 Mythos 5 的能力。TPO Group 首席安全官 Tarah Wheeler 表示:“认为其他竞争对手不会开发类似能力,甚至尚未开发,是极度短视的。许多公司紧随其后,可能已拥有类似能力,只是暂未公开。”
双重用途困境:AI 安全的“矛与盾”
Mythos 5 的核心能力在于自动化漏洞挖掘与利用。这种技术对网络安全行业意义重大——它可以帮助防御者比攻击者更快地识别并修补漏洞。然而,一旦落入恶意之手,同样的能力可能被用于发动大规模网络攻击。Anthropic 在发布博客中明确承认:“AI 模型的高级用途是双刃剑:网络安全专家和生物学研究人员的良性查询,在恶意行为者手中可能变得危险。”
这正是 AI 安全治理 面临的核心悖论:如何在不扼杀创新的前提下,防止技术被滥用?Anthropic 的解决方案是分级发布:先向可信的“Project Glasswing”工作组提供完整能力,再向公众发布受限版本。但政府的担忧在于,防护栏可能被绕过——尤其是当模型权重本身被公开或泄露时。
管制的局限性:防不胜防的扩散风险
尽管美国政府的出口管制暂时限制了 Anthropic 的模型,但专家认为这种措施治标不治本。Wheeler 指出:“其他公司很可能已经拥有类似能力,只是选择不公开。从开源社区到国家支持的黑客组织,技术扩散只是时间问题。”
事实上,当前 AI 领域的竞争极为激烈。OpenAI、Google DeepMind 以及众多开源项目都在竞相提升模型能力。一旦某项技术被证明可行,模仿与改进将迅速跟进。历史经验表明,对单一公司的管制往往导致技术转移至境外或地下,反而增加监管难度。
未来趋势:危险能力将成“标配”
Mythos 5 的出现标志着一个转折点:高级 AI 模型的“危险”能力正在从理论走向实践。未来,类似 Mythos 的模型将不再是特例,而是常态。这意味着网络安全行业、政策制定者和公众都必须做好准备,迎接一个“AI 黑客”泛滥的时代。
对于企业而言,防御策略必须升级。传统的漏洞扫描与修复流程将无法应对 AI 驱动的自动化攻击。对于政府而言,需要建立更灵活、更国际化的监管框架,而非仅靠出口管制。而对于 Anthropic 这样的公司,如何在透明与安全之间取得平衡,将成为长期挑战。
小结
Anthropic 的遭遇只是 AI 安全困境的缩影。危险能力不会因一家公司的退让而消失,反而会加速扩散。业界需要正视这一现实,从技术、政策与教育等多维度共同应对。毕竟,当 AI 的矛与盾都变得更强时,真正的安全只能来自更深刻的认知与更系统的协作。
