Claude Opus 4.8 发布:更智能、更高效,AI 协作体验再升级
Anthropic 于 2026 年 5 月 28 日正式发布 Claude Opus 4.8,这是对前代 Opus 4.7 的一次重要升级。新模型在基准测试中全面超越前代,同时在实用功能上带来多项创新:用户可控制 Claude 的“努力程度”、Claude Code 引入“动态工作流”,而快速模式速度提升 2.5 倍,成本却降至此前三分之一。
性能全面提升
官方公布的基准测试结果显示,Opus 4.8 在编码、智能体能力、推理和实际知识工作等任务上均优于 Opus 4.7 及其他竞品。例如,在 Super-Agent 基准 中,Opus 4.8 是唯一一个完整完成所有案例的模型,且成本与 GPT-5.5 持平。在 CursorBench 上,它在每个努力层级上都超越了前代模型。此外,在 Legal Agent Benchmark 上,Opus 4.8 创下最高分,成为首个在全部通过标准上突破 10% 的模型——这一精度提升直接转化为客户可以放心交给 AI 的实际律师工作量。
更可靠的协作体验
早期测试者反馈,Opus 4.8 在执行智能体任务时判断力更敏锐、可靠性更高。在 Claude Code 中,它会主动提出正确问题、发现自身错误、质疑不合理的计划,并在进行大规模变更前建立信心。翻译、深度研究、幻灯片制作和分析等产品中,它展现出强大的可靠性。此外,工具调用效率显著提升,能以更少的步骤完成同等智能的任务,并顺畅地贯穿端到端流程。
创新功能与成本优化
Opus 4.8 同步推出多项新功能:
- 努力程度控制:用户在 claude.ai 上可以调节 Claude 为任务投入的“努力”级别,灵活平衡速度与深度。
- 动态工作流:Claude Code 新增此功能,使其能够处理超大规模问题。
- 快速模式降价:Opus 4.8 的快速模式速度提升至 2.5 倍,但价格仅为前代模型的三分之一,大幅降低了高吞吐场景的使用成本。
行业意义
Opus 4.8 的发布正值 AI 行业对智能体可靠性要求日益提高的时期。Anthropic 通过提升模型在复杂任务中的判断力和效率,进一步巩固了其在高端 AI 助手市场的地位。对于需要高精度、长上下文协作的企业用户来说,Opus 4.8 不仅是一次性能升级,更是一个更加值得信赖的 AI 合作伙伴。