PACT协议：多智能体系统高效通信新方法，Token消耗减半

背景：自由对话的代价

当前基于大语言模型的多智能体系统（MAS）通常围绕角色、流水线和轮次调度来组织，但智能体之间传递的消息往往被设计为无约束的自然语言。这种自由形式的通信虽然灵活，却会迅速膨胀Token用量，挤占共享上下文窗口，最终影响系统性能和推理成本。

研究洞察：没有万能策略，但“动作中心”是关键

来自研究团队的最新论文（arXiv:2606.05304）系统分析了五种常见智能体间通信策略，并在两种典型MAS拓扑结构下进行测试。结果发现：没有任何一种固定策略在所有场景下都最优。但有效的跨智能体消息始终保留了下游智能体所需的动作中心信息——即智能体执行了什么动作、产生了什么状态变化。

PACT协议：将通信转化为公共状态更新

基于这一洞察，研究者提出 PACT（Protocolized Action-state Communication and Transmission） 协议。PACT将智能体间通信视为一个公共状态更新问题：每个智能体的原始输出在被写入共享历史之前，先被投影为一个紧凑的“动作-状态”记录。这种结构化表示去除了冗余的自然语言描述，只保留最关键的决策信息。

性能与成本的双赢

实验表明，在不同MAS拓扑下，PACT一致地改善了性能-成本权衡：

在同等或更强任务表现下，Token消耗大幅减少。
在代码开发工具 OpenHands 中，PACT使问题解决率提升，同时每个解决任务消耗的Token减少10%。
在 SWE-agent 上，PACT在保持解决率不变的情况下，将输入Token用量减半。

意义与展望

PACT的核心贡献在于揭示了多智能体通信中“说什么”比“怎么说”更重要。通过将通信内容从自由文本约束为动作-状态记录，系统既能保留关键语义，又能显著降低推理成本。这为构建大规模、高效的多智能体协作系统提供了实用设计原则。论文代码已开源，为后续研究奠定了基础。

多智能体系统如何高效通信？PACT协议用“动作-状态”记录大幅降低Token消耗

背景：自由对话的代价

研究洞察：没有万能策略，但“动作中心”是关键

PACT协议：将通信转化为公共状态更新

性能与成本的双赢

意义与展望

延伸阅读

相关资讯