
新上线今天0 投票
Anthropic认为自身成功才是AI安全的关键
矛盾?Anthropic的“以进为退”安全哲学
Anthropic成立五年来,始终在警告先进AI可能带来的毁灭性风险——从大规模杀伤到社会动荡。但与此同时,它正以惊人速度推动AI能力边界:跻身顶级模型开发商,向美军等客户提供服务,估值一度接近万亿美元。这种“警告越严厉,行动越激进”的表象,在内部看来却并非矛盾。
核心信念:AI变革不可避免,关键在于谁引领
据多位前员工透露,Anthropic的运作基于两个核心理念:
- AI是人类史上最颠覆性的技术,其到来不可阻挡,唯一的问题是导向灾难还是繁荣。
- 公司必须留在AI竞赛的前沿,因为“世界会因我们处于领先而变得更好”。
内部常将自身定位为“好人”——即负责任的AI技术管理者。这种信念驱动下,积累资本、算力、人才与政治影响力不是目的,而是实现使命的代价:“确保世界安全过渡到变革性AI时代”。
森林寓言:先入险境,再驯服怪兽
乔治城大学安全与新兴技术中心执行主任、前OpenAI董事会成员Helen Toner用一个比喻解释Anthropic的世界观:
强大AI如同森林,既有魔法宝藏也有危险怪兽。所有村民都冲进去寻宝。Anthropic的选择是——比任何人都走得更深,同时投入重金驯服怪兽。即先获取AI的益处,再控制其灾难性风险。
“他们的策略非常明确:率先构建前沿AI,从而拥有定义游戏规则的席位。”Toner说。
争议与质疑:权力积累是否真的安全?
批评者认为,Anthropic一边高喊风险,一边加速军备竞赛,本质上是在为自身扩张提供道德合法性。但公司内部认为,只有掌握足够话语权,才能确保AI发展不失控。这种“以进为退”的逻辑,在硅谷安全派中并不罕见——但Anthropic将其推向了极致。
当被问及“积累权力是否本身就是风险”时,Anthropic的回应是:没有能力影响进程,才是最大的风险。这种哲学能否在商业竞争与安全使命之间找到平衡,仍将是行业持续观察的焦点。