SheepNav
Anthropic 推出 Mythos 5 升级版:企业专属,公众版“安全”无忧
新上线今天0 投票

Anthropic 推出 Mythos 5 升级版:企业专属,公众版“安全”无忧

Anthropic 于周二发布了两款新 AI 模型:Claude Mythos 5Claude Fable 5。Mythos 5 仅面向受信任的组织(如 Project Glasswing 合作伙伴)提供,而 Fable 5 则向公众开放,并内置了严格的“护栏”以防止被用于网络攻击。

能力与限制

Mythos 5 是此前 Mythos Preview 的升级版,具备更强的漏洞发现等高级能力。出于安全考虑,Anthropic 此前仅向少数科技合作伙伴开放。Fable 5 基于相同的基础模型,但通过重定向机制屏蔽了网络安全、生物学和化学等敏感领域的查询,这些请求会被转至较旧的 Claude Opus 4.8 处理。此外,若检测到用户试图进行模型蒸馏(利用大模型输出训练小模型),相关请求同样会被拦截。

安全策略的演进

Anthropic 产品管理主管 Diane Penn 表示,自 Mythos Preview 发布以来,公司一直在权衡如何管控其能力。目前的方案偏向保守,可能导致部分良性查询也被降级处理,但这是当前广泛发布的最安全选择。未来,公司计划通过优化分类器提升精准度。

行业背景与意义

此举反映了 AI 安全领域的两难困境:如何平衡能力开放与风险控制。Anthropic 选择“分级发布”策略,既满足了合作伙伴对前沿能力的需求,又通过技术手段降低了公众版本被滥用的风险。这一模式可能成为 AI 模型分发的参考范例。

延伸阅读

  1. 我试了试 Siri AI,到目前为止它真的能用了
  2. 没有传统VC基金,贾斯汀·欧内斯特如何向Anthropic、SpaceX等热门前沿公司投入近4亿美元
  3. 通用汽车:电动车电池可缓解AI数据中心的能源饥渴
查看原文