Claude Fable 5 发布：最强通用模型，安全降级仅5%会话

2026 年 6 月 9 日，Anthropic 正式发布 Claude Fable 5 与 Claude Mythos 5 两款新模型。Fable 5 定位为 Mythos 级通用模型，在几乎所有主流基准测试中达到业界领先水平，尤其在软件工程、知识工作、视觉理解、科学研究等复杂任务上表现突出。Anthropic 表示，任务越长、越复杂，Fable 5 相对于其他模型的优势越明显。

为了控制风险，Anthropic 为 Fable 5 设置了安全护栏：对于某些高风险话题的查询，模型会自动降级为次强模型 Claude Opus 4.8 进行回复。目前这些护栏设置较为保守，平均在 不到 5% 的会话 中会触发，有时也会误拦截无害请求。Anthropic 承诺将尽快优化护栏，减少误报。

与此同时，Anthropic 还发布了 Claude Mythos 5，其底层模型与 Fable 5 相同，但在部分领域解除了安全限制。Mythos 5 将首先通过 Project Glasswing（与美国政府合作的项目）部署，作为 Claude Mythos Preview 的升级版，拥有全球最强的网络安全能力。未来 Anthropic 计划通过更广泛的信任访问计划开放 Mythos 5。

Anthropic 指出，Fable 5 和 Mythos 5 的能力已在网络安全（帮助防御者保护关键软件）和生命科学研究（提出新假设、加速疗法开发）中展现出巨大价值。定价方面，Fable 5 和 Mythos 5 的输入价格为 每百万 token 10 美元，输出价格为 每百万 token 50 美元，不到 Claude Mythos Preview 的一半。

此次发布标志着 Anthropic 在“尽可能快速、安全地为更多用户提供先进 AI 能力”的目标上迈出了新的一步。

Anthropic 发布 Claude Fable 5：史上最强通用模型，安全限制下 5% 会话触发降级

延伸阅读

相关资讯