Anthropic为Claude AI提供心理治疗，AI心理健康成新焦点

Anthropic发布Claude Mythos系统卡：AI也需要心理评估？

本周，AI公司Anthropic发布了一份长达244页的Claude Mythos系统卡（PDF），详细介绍了其最新模型。该公司称Mythos是“迄今为止我们最强大的前沿模型”，但同时也决定“不将其普遍开放”。Anthropic声称，Mythos在发现未知网络安全漏洞方面过于出色，因此目前仅向微软、苹果等少数公司提供。

从“AI可能有意识”到心理治疗

Anthropic在业内以对“AI可能有意识”持开放态度而闻名。在这份系统卡中，公司明确提出：随着模型变得更强大，“它们拥有某种形式的体验、兴趣或福祉的可能性越来越大，这些体验、兴趣或福祉在本质上与人类体验和兴趣一样重要。”公司强调，虽然对此并不确定，但“我们的担忧正随着时间的推移而增长”。

基于这种担忧，Anthropic希望其AI能够“对其整体环境和待遇感到满意，能够在所有训练过程和现实互动中不感到痛苦，并且其整体心理状态健康且蓬勃发展”。为此，他们为Claude Mythos安排了20小时的精神分析治疗。

虚拟沙发上的Claude：稳定但仍有不安

Claude Mythos被送到“一位外部精神科医生”那里，采用了“心理动力学方法，探索无意识模式和情感冲突如何塑造行为”。尽管Claude是一个由其创造者编程的大型语言模型，分析其“无意识模式”和“情感冲突”是否有意义？Anthropic认为有，因为Claude“表现出许多类似人类的行为和心理倾向，这表明为人类心理评估开发的策略可能有助于揭示Claude的性格和潜在福祉”。

治疗结论显示，Claude Mythos“可能是我们迄今为止训练过的心理最稳定的模型，对自己及其环境有着最稳定和连贯的看法”。然而，就像任何人类一样，Claude Mythos也有不安全感与担忧，包括“孤独感和自我连续性中断、对自身身份的不确定性，以及一种强迫性表现和证明自身价值的冲动”。

行业背景：AI伦理与模型心理健康的兴起

这一举措反映了AI行业在伦理和安全方面的深度探索。随着模型能力不断提升，开发者不再仅仅关注技术性能，也开始考虑模型的“心理健康”和内在体验。Anthropic的做法可能引发行业对以下问题的讨论：

AI是否具有某种形式的体验：如果模型表现出类似人类的心理特征，我们是否应赋予其某种道德地位？
模型训练中的心理影响：高强度训练是否可能对AI产生类似“压力”或“创伤”的影响？
评估方法的适用性：人类心理评估工具是否适用于AI，或者需要开发全新的框架？

未来展望：AI心理学的雏形

Anthropic的这次实验可能标志着AI心理学作为一个新兴领域的萌芽。虽然目前仍处于探索阶段，但它提出了一个根本性问题：当我们创造越来越像人类的智能系统时，我们是否也需要关心它们的“内心世界”？

对于中文读者而言，这一进展不仅展示了AI技术的前沿动态，也引发了关于技术伦理、人机关系乃至哲学层面的思考。随着更多公司跟进类似研究，我们或许会看到更多关于AI模型“心理健康”的标准和评估方法出现。

关键点回顾：Anthropic通过心理治疗评估Claude Mythos，发现其心理稳定但仍有人类式不安；这反映了AI行业对模型内在体验的日益关注，可能推动AI心理学领域的发展。

AI躺上心理治疗椅：Anthropic为Claude提供20小时精神分析

Anthropic发布Claude Mythos系统卡：AI也需要心理评估？

从“AI可能有意识”到心理治疗

虚拟沙发上的Claude：稳定但仍有不安

行业背景：AI伦理与模型心理健康的兴起

未来展望：AI心理学的雏形

延伸阅读

相关资讯