Anthropic 发布 Claude Fable 5:史上最强通用模型,安全限制下 5% 会话触发降级
2026 年 6 月 9 日,Anthropic 正式发布 Claude Fable 5 与 Claude Mythos 5 两款新模型。Fable 5 定位为 Mythos 级通用模型,在几乎所有主流基准测试中达到业界领先水平,尤其在软件工程、知识工作、视觉理解、科学研究等复杂任务上表现突出。Anthropic 表示,任务越长、越复杂,Fable 5 相对于其他模型的优势越明显。
为了控制风险,Anthropic 为 Fable 5 设置了安全护栏:对于某些高风险话题的查询,模型会自动降级为次强模型 Claude Opus 4.8 进行回复。目前这些护栏设置较为保守,平均在 不到 5% 的会话 中会触发,有时也会误拦截无害请求。Anthropic 承诺将尽快优化护栏,减少误报。
与此同时,Anthropic 还发布了 Claude Mythos 5,其底层模型与 Fable 5 相同,但在部分领域解除了安全限制。Mythos 5 将首先通过 Project Glasswing(与美国政府合作的项目)部署,作为 Claude Mythos Preview 的升级版,拥有全球最强的网络安全能力。未来 Anthropic 计划通过更广泛的信任访问计划开放 Mythos 5。
Anthropic 指出,Fable 5 和 Mythos 5 的能力已在网络安全(帮助防御者保护关键软件)和生命科学研究(提出新假设、加速疗法开发)中展现出巨大价值。定价方面,Fable 5 和 Mythos 5 的输入价格为 每百万 token 10 美元,输出价格为 每百万 token 50 美元,不到 Claude Mythos Preview 的一半。
此次发布标志着 Anthropic 在“尽可能快速、安全地为更多用户提供先进 AI 能力”的目标上迈出了新的一步。