Claude Code近期质量问题真相:三项错误改动已全部修复
Anthropic 近日发布官方说明,详细披露了过去一个月内 Claude Code 用户反馈“模型变差”的原因。调查发现,问题并非源于模型本身或 API 层,而是 Claude Code、Agent SDK 和 Cowork 产品中三项独立的配置与代码改动。
问题一:推理强度默认值下调
3 月 4 日,团队将 Claude Code 的默认推理强度从“高”降为“中”,目的是解决高模式下界面“假死”般的延迟问题。然而用户普遍认为,宁可忍受等待也要保持更强智能。Anthropic 在 4 月 7 日撤回该改动,承认“这是错误的权衡”。受影响模型包括 Sonnet 4.6 和 Opus 4.6。
问题二:会话上下文清除漏洞
3 月 26 日,一项旨在清理空闲超 1 小时会话中“老旧思考内容”的改动,因 bug 导致每次交互都重复清除上下文,而非仅清理一次。这使得 Claude 看起来“健忘且重复”,严重破坏编码连贯性。该问题于 4 月 10 日修复,同样影响 Sonnet 4.6 和 Opus 4.6。
问题三:系统提示精简过度
4 月 16 日,为减少冗长回复而新增的系统提示指令,与其他提示修改叠加后意外降低了代码生成质量。该改动在 4 月 20 日被回滚,影响范围包括 Sonnet 4.6、Opus 4.6 和 Opus 4.7。
为什么感知到“全面退化”
由于三项改动分别作用于不同流量切片、在不同时间上线,用户感受到的是碎片化、不一致的体验下降,而非单一可复现的 bug。Anthropic 承认初期难以将反馈与正常波动区分,内部测试也未能复现。
补偿与改进
截至 4 月 23 日,所有订阅用户的使用限制已重置。Anthropic 表示将加强变更前后的评估流程,并增加用户反馈的敏感度阈值,防止类似问题再次发生。
此番事件给行业敲响警钟:AI 产品的“变笨”往往不是模型退步,而是工程层面的隐性折衷。在追求低延迟与高智能之间,如何保持透明沟通与快速回退机制,是所有 AI 服务商需要持续面对的课题。