SheepNav
新上线今天0 投票

Anthropic 发布 Claude Fable 5:公众可用的神话级 AI 模型,但带有安全护栏

Anthropic 于今日正式发布 Claude Fable 5,这是其最强 AI 模型“Mythos”系列中首个面向公众开放的版本。该模型在软件工程、知识工作与视觉能力上表现卓越,但 Anthropic 为其设置了严格的安全限制:在网络安全、生物学、化学等高风险领域,模型将拒绝回答并自动回退至 Claude Opus 4.8。

Fable 5 的推出标志着 Anthropic 在 AI 安全与普及之间的新平衡。此前,Mythos 仅限少数合作伙伴使用,上周扩展至 15 个国家的数百家关键基础设施机构。如今,普通用户可通过 Anthropic 的 API 及企业套餐使用该模型,订阅用户从即日起至 6 月 22 日可免费体验,之后需消耗使用积分。

与此同时,Anthropic 也向已获批准的机构交付了更先进的 Mythos 5。公司强调,在释放强大能力的同时,必须建立“协调的刹车机制”。为此,Anthropic 要求所有流量保留 30 天日志(即使企业此前签署零保留协议),以便应对复杂攻击。内部测试显示,超过 1000 小时的漏洞赏金计划未发现通用越狱方法,但团队仍警惕新型攻击手段。

此举正值 Anthropic 筹备上市,并与 OpenAI、SpaceX 等企业竞争之际。Anthropic 此前呼吁全球 AI 实验室建立前沿 AI 开发的联合刹车机制,警告系统正快速逼近“递归自我改进”(RSI)阶段,可能无需人类干预即可自主进化。Fable 5 的发布,既是技术能力的展示,也是安全治理的试验场。

延伸阅读

  1. 我试了试 Siri AI,到目前为止它真的能用了
  2. 没有传统VC基金,贾斯汀·欧内斯特如何向Anthropic、SpaceX等热门前沿公司投入近4亿美元
  3. 通用汽车:电动车电池可缓解AI数据中心的能源饥渴
查看原文