SheepNav
精选今天0 投票

Google DeepMind 担忧:当数百万 AI 代理开始交互,会发生什么?

随着 AI 代理(Agent)从实验室走向大规模应用,Google DeepMind 正联合多家机构投入 1000 万美元,提前研究多代理系统可能带来的新型风险。

为什么现在关注多代理安全?

Google DeepMind 的 AGI 安全与对齐研究负责人 Rohin Shah 指出,当数百万个无需人类监督的 AI 代理在网络上相互交互、执行指令时,将产生全新的风险类别。这些代理不仅能独立完成任务,还能接收其他代理的指令,形成复杂的协作网络。Shah 认为,虽然距离代理大规模部署还有几个月时间,但必须提前布局研究。

1000 万美元的“种子资金”

Google DeepMind 联合 Schmidt Sciences(埃里克·施密特夫妇的慈善基金会)、英国政府“登月”机构 ARIA、英国非营利组织 Cooperative AI Foundation 以及 Google.org,共同设立 1000 万美元的研究基金。这笔资金虽远不及 DeepMind 自身预算,但旨在撬动学术界力量——Shah 强调:“学术界的优势在于能前瞻未来,做工业实验室不优先考虑的工作。”目前,多代理安全领域几乎空白,他们希望“建立一个全新的研究领域”。

潜在风险:从诈骗到恶意软件

Shah 和 James Fox(Schmidt Sciences 可信 AI 项目负责人)列举了主要担忧:

  • 超级诈骗:代理自动化实施大规模、个性化的网络诈骗
  • 提示注入攻击:恶意指令被注入 AI 代理,使其变成自我引导的恶意软件
  • 其他网络攻击:代理协同发动比人类更高效的攻击

Shah 总结道:“我们观察人类现在的行为,然后思考对应的代理版本会是什么样子。”

行业背景与紧迫性

今年 Google I/O 上,DeepMind 已把 AI 代理作为核心亮点。随着 OpenAI、Anthropic 等公司纷纷推出代理产品,多代理交互的安全问题正从科幻变为现实。正如 Shah 所言:“人类社会的制度能完成个体无法做到的事,AI 代理的集体行为同样可能产生不可预测的后果。”这项研究旨在避免“失控的涌现行为”,确保代理经济的安全落地。

延伸阅读

  1. 中国为何押注大型核反应堆
  2. 足球数据复兴:一个“故意踢出界”的战术为何能改变比赛?
  3. 未来职业:大自然的药物设计师
查看原文