SheepNav
新上线今天0 投票

Anthropic 发布 Claude Sonnet 5:更便宜的智能体模型来了

Anthropic 正式推出 Claude Sonnet 5,这是其“中端”模型的最新升级版,主打更强的智能体(agent)能力、更低的价格以及更可靠的安全性。该模型在编程、推理和知识工作等任务上大幅超越前代 Sonnet 4.6,性能接近高端模型 Opus 4.8,但成本显著降低。

智能体能力成为标配

随着 OpenAI 的 GPT-5.6 Sol 和 Google 的 Gemini 3.5 Flash 相继推出具备智能体能力的模型,Anthropic 也迅速跟进。Sonnet 5 能够自主规划任务、使用浏览器和终端等工具,并长时间独立运行——这些能力在几个月前还需要更昂贵的大型模型才能实现。Anthropic 在官方博客中表示:“它可以在一个水平上制定计划、使用工具并自主运行,而就在几个月前,这还需要更大、更贵的模型。”

这标志着智能体能力已成为所有价位模型的“入场券”。行业竞争的关键不再是“谁能做智能体”,而是“谁做得更便宜、更可靠”。

性能接近 Opus,价格大幅降低

Sonnet 5 在多项基准测试中表现亮眼。在智能体编码测试中,它取得 63.2% 的分数,高于 Sonnet 4.6 的 58.1%,接近 Opus 4.8 的 69.2%。在知识工作基准上,Sonnet 5 甚至略微超过 Opus 4.8——后者素以解决高难度问题(如微妙判断和深度研究)著称。

定价方面,Sonnet 5 初始价格为 每百万输入 token 2 美元、每百万输出 token 10 美元(促销价至 8 月 31 日),之后将调整为 3 美元和 15 美元。这使其低于 Opus 4.8、OpenAI 的 GPT-5.5 和 Google 的 Gemini 3.1 Pro,但比 Gemini 3.5 Flash 略贵。

实用性与安全性并重

即日起,Sonnet 5 将成为免费版和 Pro 版用户的默认模型,并适用于所有订阅计划。Anthropic 强调,Sonnet 5 在安全性方面也有提升,更适合在缺乏人类监督的场景下运行。

总结来看,Sonnet 5 的推出进一步压缩了高端模型的价格空间,让更多开发者能够以较低成本获得接近顶级的智能体能力。对于预算有限但追求高性能的团队而言,这无疑是一个极具吸引力的选择。

延伸阅读

  1. 可预测的GRPO:训练动力学的闭合形式模型
  2. ReactionAtlas:机器学习从头探索化学反应网络
  3. 层级全局注意力(HGA):无需重训即可扩展长上下文Transformer,单卡RTX 5090运行64K token
查看原文