SheepNav
新上线今天0 投票

Anthropic 发布 Opus 4.8:新增“动态工作流”工具,升级周期大幅缩短

Anthropic 于周四推出了其最先进公开模型 Opus 4.8,距离上一版本 Opus 4.7 仅隔 41 天,升级节奏明显加快。新模型在保持标准定价不变的同时,带来了名为 Dynamic Workflows(动态工作流) 的研究预览功能,旨在协调数百个并行子代理完成复杂任务。

快速迭代背后的竞争压力

Opus 4.7 发布后市场反响平淡,部分用户感到失望。与此同时,OpenAI 的 Codex 和 Google 的 Gemini Flash 模型相继推出重要更新,迫使 Anthropic 加快步伐。Opus 4.8 的迅速到来,正是对这种竞争压力的直接回应。

基准测试与数据可靠性提升

Opus 4.8 在基准测试中继续保持领先,但更值得关注的是其对不确定数据的处理能力。据 Anthropic 介绍,早期测试者发现新模型“更倾向于标记工作中的不确定性,并且较少做出无依据的断言”。来自 Bridgewater 的反馈指出,Opus 4.8 最大的改进在于“主动标记分析输入和输出中的问题,而其他模型往往忽略这些问题,留给用户去发现”。

动态工作流:协调子代理集群

Dynamic Workflows 功能允许像 Opus 这样的大型模型管理跨数百个并行子代理的复杂任务。Anthropic 举例说明:“Claude Code 配合 Opus 4.8,现在可以从启动到合并,在数十万行代码的规模上执行代码库迁移,并以现有测试套件作为衡量标准。”这标志着 AI 在自动化大规模工程任务方面迈出了重要一步。

更强大的 Mythos 模型即将到来

Anthropic 此前预览的 Mythos 模型因网络安全担忧而暂未公开发布。但在 Opus 4.8 的发布公告中,公司暗示 Mythos 预览期可能很快结束:“我们在开发安全防护方面取得了快速进展,预计在未来几周内能够将 Mythos 类模型带给所有客户。”

总体而言,Opus 4.8 的快速发布和 Dynamic Workflows 的引入,展示了 Anthropic 在竞争激烈的 AI 市场中加速创新的决心,同时也为大规模自动化任务提供了新的可能性。

延伸阅读

  1. 在亚马逊 SageMaker AI 上训练阿塞拜疆语大语言模型
  2. LLM 在明确警告下仍会“相信”错误信息,研究揭示“否定忽视”现象
  3. 互联网正在被机器重建:AWS、Cloudflare等巨头为AI代理时代重塑云基础设施
查看原文