Arbor:将树搜索作为自主智能体的认知层,实现LLM推理性能跃升
核心要点:树搜索 + 多智能体协作,重塑自动化优化范式
来自 arXiv 的最新论文《Arbor: Tree Search as a Cognition Layer for Autonomous Agents》提出了一种全新的多智能体框架 Arbor。该框架将结构化的树搜索作为自主智能体的“认知层”,使其能够在大型、有状态的动作空间中进行高效探索。与以往针对孤立目标、无状态评估的优化系统不同,Arbor 维护一棵显式的假设搜索树,作为所有智能体的共享工作记忆。这棵树随着每次测量而演化:失败被视为诊断信号,用于重塑后续探索方向;成功则改变瓶颈分布,引导树向新区域扩展。
应用场景:全栈LLM推理优化
研究团队将 Arbor 应用于全栈 LLM 推理优化这一极具挑战性的领域。在传统模式下,实现推理峰值性能往往需要应用、框架、编译器、内核和硬件等多个工程团队的协同努力,耗时巨大且难以复制。Arbor 通过两类智能体分工协作:
- Orchestrator(编排智能体):驱动优化过程,将任务委派给覆盖推理栈各层的领域专家。
- Critic(评论智能体):通过根因分析、自我反思和测量验证来保障系统稳定性,形成一种制衡架构——任一智能体都无法单方面主导系统。
智能体的能力被分解为硬技能(领域专长)和软技能(协调协议,决定贡献如何组合),从而实现完全自主的多日优化战役。
关键成果:性能飞跃与可复现性
实验结果显示,Arbor 在推理吞吐-延迟帕累托曲线上实现了最高193%的提升,远超供应商优化的基线。相比之下,未使用该框架的单一智能体仅获得**+33%的吞吐量提升**,并在数小时内出现不可恢复的崩溃。Arbor 还能泛化到多代硬件平台,运行间方差控制在2个百分点以内,表明该方法与硬件无关且可复现。
行业意义:从“人工调优”到“智能体协作”
Arbor 的提出标志着 AI 基础设施优化进入新阶段。它不再依赖工程师手动调整参数,而是通过树搜索驱动的多智能体系统,自动探索庞大的配置空间。这种“认知层”设计为复杂系统的自动化调优提供了通用框架,尤其适用于那些状态空间巨大、评估代价高昂的领域。对于 LLM 推理服务商而言,这意味着更低的延迟、更高的吞吐量,以及更少的运维人力投入。
小结
Arbor 将树搜索与多智能体协作巧妙结合,在 LLM 推理优化上取得了显著成果。其核心创新在于将失败转化为学习信号,并通过制衡架构保障稳定性。未来,这种“认知层”思想有望扩展到更多需要自主探索的 AI 系统。