新上线今天0 投票
Anthropic 发布 Claude Fable 5:公众可用的神话级 AI 模型,但带有安全护栏
Anthropic 于今日正式发布 Claude Fable 5,这是其最强 AI 模型“Mythos”系列中首个面向公众开放的版本。该模型在软件工程、知识工作与视觉能力上表现卓越,但 Anthropic 为其设置了严格的安全限制:在网络安全、生物学、化学等高风险领域,模型将拒绝回答并自动回退至 Claude Opus 4.8。
Fable 5 的推出标志着 Anthropic 在 AI 安全与普及之间的新平衡。此前,Mythos 仅限少数合作伙伴使用,上周扩展至 15 个国家的数百家关键基础设施机构。如今,普通用户可通过 Anthropic 的 API 及企业套餐使用该模型,订阅用户从即日起至 6 月 22 日可免费体验,之后需消耗使用积分。
与此同时,Anthropic 也向已获批准的机构交付了更先进的 Mythos 5。公司强调,在释放强大能力的同时,必须建立“协调的刹车机制”。为此,Anthropic 要求所有流量保留 30 天日志(即使企业此前签署零保留协议),以便应对复杂攻击。内部测试显示,超过 1000 小时的漏洞赏金计划未发现通用越狱方法,但团队仍警惕新型攻击手段。
此举正值 Anthropic 筹备上市,并与 OpenAI、SpaceX 等企业竞争之际。Anthropic 此前呼吁全球 AI 实验室建立前沿 AI 开发的联合刹车机制,警告系统正快速逼近“递归自我改进”(RSI)阶段,可能无需人类干预即可自主进化。Fable 5 的发布,既是技术能力的展示,也是安全治理的试验场。