精选今天0 投票
多智能体系统如何高效通信?PACT协议用“动作-状态”记录大幅降低Token消耗
背景:自由对话的代价
当前基于大语言模型的多智能体系统(MAS)通常围绕角色、流水线和轮次调度来组织,但智能体之间传递的消息往往被设计为无约束的自然语言。这种自由形式的通信虽然灵活,却会迅速膨胀Token用量,挤占共享上下文窗口,最终影响系统性能和推理成本。
研究洞察:没有万能策略,但“动作中心”是关键
来自研究团队的最新论文(arXiv:2606.05304)系统分析了五种常见智能体间通信策略,并在两种典型MAS拓扑结构下进行测试。结果发现:没有任何一种固定策略在所有场景下都最优。但有效的跨智能体消息始终保留了下游智能体所需的动作中心信息——即智能体执行了什么动作、产生了什么状态变化。
PACT协议:将通信转化为公共状态更新
基于这一洞察,研究者提出 PACT(Protocolized Action-state Communication and Transmission) 协议。PACT将智能体间通信视为一个公共状态更新问题:每个智能体的原始输出在被写入共享历史之前,先被投影为一个紧凑的“动作-状态”记录。这种结构化表示去除了冗余的自然语言描述,只保留最关键的决策信息。
性能与成本的双赢
实验表明,在不同MAS拓扑下,PACT一致地改善了性能-成本权衡:
- 在同等或更强任务表现下,Token消耗大幅减少。
- 在代码开发工具 OpenHands 中,PACT使问题解决率提升,同时每个解决任务消耗的Token减少10%。
- 在 SWE-agent 上,PACT在保持解决率不变的情况下,将输入Token用量减半。
意义与展望
PACT的核心贡献在于揭示了多智能体通信中“说什么”比“怎么说”更重要。通过将通信内容从自由文本约束为动作-状态记录,系统既能保留关键语义,又能显著降低推理成本。这为构建大规模、高效的多智能体协作系统提供了实用设计原则。论文代码已开源,为后续研究奠定了基础。