Arbor：树搜索作为认知层，自主优化LLM推理性能

核心要点：树搜索 + 多智能体协作，重塑自动化优化范式

来自 arXiv 的最新论文《Arbor: Tree Search as a Cognition Layer for Autonomous Agents》提出了一种全新的多智能体框架 Arbor。该框架将结构化的树搜索作为自主智能体的“认知层”，使其能够在大型、有状态的动作空间中进行高效探索。与以往针对孤立目标、无状态评估的优化系统不同，Arbor 维护一棵显式的假设搜索树，作为所有智能体的共享工作记忆。这棵树随着每次测量而演化：失败被视为诊断信号，用于重塑后续探索方向；成功则改变瓶颈分布，引导树向新区域扩展。

应用场景：全栈LLM推理优化

研究团队将 Arbor 应用于全栈 LLM 推理优化这一极具挑战性的领域。在传统模式下，实现推理峰值性能往往需要应用、框架、编译器、内核和硬件等多个工程团队的协同努力，耗时巨大且难以复制。Arbor 通过两类智能体分工协作：

Orchestrator（编排智能体）：驱动优化过程，将任务委派给覆盖推理栈各层的领域专家。
Critic（评论智能体）：通过根因分析、自我反思和测量验证来保障系统稳定性，形成一种制衡架构——任一智能体都无法单方面主导系统。

智能体的能力被分解为硬技能（领域专长）和软技能（协调协议，决定贡献如何组合），从而实现完全自主的多日优化战役。

关键成果：性能飞跃与可复现性

实验结果显示，Arbor 在推理吞吐-延迟帕累托曲线上实现了最高193%的提升，远超供应商优化的基线。相比之下，未使用该框架的单一智能体仅获得**+33%的吞吐量提升**，并在数小时内出现不可恢复的崩溃。Arbor 还能泛化到多代硬件平台，运行间方差控制在2个百分点以内，表明该方法与硬件无关且可复现。

行业意义：从“人工调优”到“智能体协作”

Arbor 的提出标志着 AI 基础设施优化进入新阶段。它不再依赖工程师手动调整参数，而是通过树搜索驱动的多智能体系统，自动探索庞大的配置空间。这种“认知层”设计为复杂系统的自动化调优提供了通用框架，尤其适用于那些状态空间巨大、评估代价高昂的领域。对于 LLM 推理服务商而言，这意味着更低的延迟、更高的吞吐量，以及更少的运维人力投入。

小结

Arbor 将树搜索与多智能体协作巧妙结合，在 LLM 推理优化上取得了显著成果。其核心创新在于将失败转化为学习信号，并通过制衡架构保障稳定性。未来，这种“认知层”思想有望扩展到更多需要自主探索的 AI 系统。

Arbor：将树搜索作为自主智能体的认知层，实现LLM推理性能跃升

核心要点：树搜索 + 多智能体协作，重塑自动化优化范式

应用场景：全栈LLM推理优化

关键成果：性能飞跃与可复现性

行业意义：从“人工调优”到“智能体协作”

小结

延伸阅读

相关资讯