Anthropic Claude 发现 Firefox 高危漏洞，AI 安全研究新突破

在 AI 安全研究领域，一项由 Anthropic 与 Mozilla 的合作项目近期取得了突破性进展。Claude Opus 4.6 模型在短短两周内，从 Firefox 的复杂代码库中独立识别出 22 个安全漏洞，其中 14 个被 Mozilla 评定为高危漏洞——这相当于 2025 年 Firefox 所有已修复高危漏洞的近五分之一。这些漏洞的发现和修复已通过 Firefox 148.0 版本推送给全球数亿用户。

从模型评估到实战合作

这项合作始于 2025 年底，当时 Anthropic 团队注意到 Opus 4.5 在 CyberGym 基准测试中已接近完全解决所有任务。CyberGym 是一个专门测试大语言模型能否复现已知安全漏洞的基准。为了构建更困难、更贴近现实的评估环境，团队决定转向 Firefox 这一目标。

选择 Firefox 并非偶然：它既是代码结构复杂的软件，又是全球测试最充分、最安全的开源项目之一。这使得它成为检验 AI 发现新型安全漏洞能力的“硬骨头”。浏览器漏洞尤其危险，因为数亿用户每天依赖它处理不受信任的内容，其安全性直接关系到用户隐私和数据保护。

技术突破：从复现到发现

合作的第一步是让 Claude 在旧版 Firefox 代码库中寻找历史上已公开的 CVE（常见漏洞与暴露）。结果令人惊讶：Opus 4.6 能够复现其中很高比例的历史漏洞，而这些漏洞当初都需要大量人力才能发现。

但真正的挑战在于：模型能否超越已知漏洞，发现全新的、未知的零日漏洞？为此，Anthropic 与 Mozilla 研究人员紧密合作，建立了一套高效的漏洞报告流程。Mozilla 帮助团队理解哪些类型的发现值得提交正式漏洞报告，并快速验证和修复了这些漏洞。

行业意义与未来展望

这项合作的成功，为 AI 驱动的安全研究者和软件维护者之间的协作提供了可复制的模型。它证明：

AI 能显著加速高危漏洞的检测速度，在传统人工审计难以覆盖的复杂代码区域发现潜在风险。
人机协作是关键：AI 负责大规模、高强度的代码审查和模式识别，人类专家则提供领域知识、验证结果并指导修复。
开源与透明合作 能最大化安全效益，尤其是在 Firefox 这样影响广泛的软件上。

随着 AI 模型在代码理解和逻辑推理能力上的持续进步，我们有望看到更多类似合作，将 AI 深度集成到软件开发生命周期中，从源头提升关键基础设施的安全性。这不仅关乎浏览器，也为操作系统、云服务、物联网设备等复杂系统的安全审计开辟了新路径。

Anthropic 红队助力 Firefox 安全加固：Claude 两周发现 22 个漏洞

从模型评估到实战合作

技术突破：从复现到发现

行业意义与未来展望

延伸阅读

相关资讯