Anthropic联手苹果谷歌等45家机构测试AI网络安全

在3月底泄露消息后，Anthropic于本周二正式宣布推出Claude Mythos Preview模型，并联合微软、苹果、谷歌、亚马逊AWS、Linux基金会、思科、英伟达、博通等超过45家科技、网络安全、关键基础设施和金融组织，共同发起Project Glasswing（玻璃翼项目）。这一行业联盟旨在利用新模型测试和应对AI能力快速发展对全球软件安全和数字防御实践带来的颠覆性挑战。

项目背景与目标

Anthropic的“前沿红队”负责人Logan Graham向WIRED表示：“真正的信息不在于这个模型或Anthropic本身，而在于我们需要为未来6、12、24个月内这些能力广泛普及的世界做好准备。许多安全方面的现状将会改变，我们建立现代安全范式所依赖的许多假设可能会被打破。”

Project Glasswing的核心目标是为全球基础技术平台的开发者提供时间窗口，让他们能够使用Mythos Preview模型对自己的系统进行测试，从而在模拟攻击中识别和缓解模型可能发现的漏洞与利用链。

模型能力与行业影响

Anthropic CEO Dario Amodei在项目启动视频中强调：“Claude Mythos预览版是一个特别大的飞跃。我们并没有专门训练它擅长网络安全，而是训练它擅长代码——但作为擅长代码的副作用，它也擅长网络安全。”

这一表述揭示了当前AI发展的一个关键趋势：随着模型在代码理解和生成能力上的提升，其“副作用”可能包括识别安全漏洞、提出攻击策略或防御方案。这本质上延续了安全领域经典的“猫鼠游戏”，但工具本身既可能助力防御者，也可能降低攻击门槛，使曾经因成本或复杂度过高而不切实际的攻击变得可行。

联盟成员与运作方式

参与Project Glasswing的机构覆盖了科技生态的关键环节：

云与平台方：微软、谷歌、亚马逊AWS
硬件与芯片：英伟达、博通
网络与安全：思科及多家网络安全公司
开源与标准组织：Linux基金会
关键行业：金融、基础设施等领域的代表性企业

这些成员将获得Mythos Preview模型的私有访问权限，该模型目前尚未公开发布。这种安排既保证了测试的深度与针对性，也避免了能力过早流入公开领域可能带来的风险。

行业紧迫性与未来展望

Anthropic强调，发起这一努力是为了紧急启动对AI能力如何颠覆全球软件安全和数字防御实践的探索。多家公司开发和训练的模型已经越来越能够发现代码中的漏洞并提出缓解措施或利用策略。

Amodei在视频中补充道：“更强大的模型将从我们和其他公司涌现。因此，我们需要共同面对这一现实。”

Project Glasswing的成立，标志着AI行业开始正视自身技术可能带来的安全挑战，并尝试通过跨公司、跨行业的协作，在能力爆发前构建应对框架。这不仅是技术测试，更是一次关于责任、治理与前瞻性防御的集体行动。

Anthropic联手苹果、谷歌等45家机构成立“玻璃翼项目”，用Claude Mythos模型测试AI网络安全能力

项目背景与目标

模型能力与行业影响

联盟成员与运作方式

行业紧迫性与未来展望

延伸阅读

相关资讯