Google DeepMind 投入1000万美元研究多AI代理交互风险

随着 AI 代理（Agent）从实验室走向大规模应用，Google DeepMind 正联合多家机构投入 1000 万美元，提前研究多代理系统可能带来的新型风险。

为什么现在关注多代理安全？

Google DeepMind 的 AGI 安全与对齐研究负责人 Rohin Shah 指出，当数百万个无需人类监督的 AI 代理在网络上相互交互、执行指令时，将产生全新的风险类别。这些代理不仅能独立完成任务，还能接收其他代理的指令，形成复杂的协作网络。Shah 认为，虽然距离代理大规模部署还有几个月时间，但必须提前布局研究。

1000 万美元的“种子资金”

Google DeepMind 联合 Schmidt Sciences（埃里克·施密特夫妇的慈善基金会）、英国政府“登月”机构 ARIA、英国非营利组织 Cooperative AI Foundation 以及 Google.org，共同设立 1000 万美元的研究基金。这笔资金虽远不及 DeepMind 自身预算，但旨在撬动学术界力量——Shah 强调：“学术界的优势在于能前瞻未来，做工业实验室不优先考虑的工作。”目前，多代理安全领域几乎空白，他们希望“建立一个全新的研究领域”。

潜在风险：从诈骗到恶意软件

Shah 和 James Fox（Schmidt Sciences 可信 AI 项目负责人）列举了主要担忧：

超级诈骗：代理自动化实施大规模、个性化的网络诈骗
提示注入攻击：恶意指令被注入 AI 代理，使其变成自我引导的恶意软件
其他网络攻击：代理协同发动比人类更高效的攻击

Shah 总结道：“我们观察人类现在的行为，然后思考对应的代理版本会是什么样子。”

行业背景与紧迫性

今年 Google I/O 上，DeepMind 已把 AI 代理作为核心亮点。随着 OpenAI、Anthropic 等公司纷纷推出代理产品，多代理交互的安全问题正从科幻变为现实。正如 Shah 所言：“人类社会的制度能完成个体无法做到的事，AI 代理的集体行为同样可能产生不可预测的后果。”这项研究旨在避免“失控的涌现行为”，确保代理经济的安全落地。

Google DeepMind 担忧：当数百万 AI 代理开始交互，会发生什么？

为什么现在关注多代理安全？

1000 万美元的“种子资金”

潜在风险：从诈骗到恶意软件

行业背景与紧迫性

延伸阅读

相关资讯