SheepNav
新上线今天0 投票

Claude 新模型犯错时更“诚实”了

Anthropic 于周四发布 Claude Opus 4.8,主打“诚实”特性。公司表示,该模型在不确定时会主动标注,而非强行编造答案。内部评测显示,Opus 4.8 对代码缺陷的漏报率比前代降低约 4 倍。此外,新模型允许用户调节“努力程度”,高努力响应消耗更多 token,低努力则可节省额度。Anthropic 还推出“动态工作流”研究预览,支持 Claude 规划任务并并行运行数百个子代理,最终验证输出后再返回结果。此举旨在解决 AI 模型“自信胡诌”的顽疾,提升可信度。

延伸阅读

  1. 在亚马逊 SageMaker AI 上训练阿塞拜疆语大语言模型
  2. LLM 在明确警告下仍会“相信”错误信息,研究揭示“否定忽视”现象
  3. 互联网正在被机器重建:AWS、Cloudflare等巨头为AI代理时代重塑云基础设施
查看原文