SheepNav
精选今天0 投票

PREPING:无任务先例,智能体如何自主构建记忆?

核心结论:记忆冷启动难题的新解法

智能体(Agent)在部署到新环境时,常因缺乏任务经验而陷入“冷启动”困境。传统的记忆构建依赖离线演示或在线交互,但前者需要人工标注,后者则需真实部署后才能积累。韩国科学技术院(KAIST)等机构的研究团队提出 PREPING 框架,让智能体在未观察任何目标任务的情况下,仅通过自生成合成实践来构建程序性记忆,从而以更低的成本实现与强基线相当的性能。

方法:Proposer-Guided 自循环

PREPING 的核心是一个 Proposer(提议器),它维护一个结构化控制状态(称为 proposer memory),用于指导后续的合成任务生成。具体流程如下:

  1. Proposer 基于当前记忆状态,生成一个合成任务;
  2. Solver(求解器) 尝试执行该任务;
  3. Validator(验证器) 判断生成的轨迹是否有效,并将其存入记忆,同时向 Proposer 提供反馈以改进后续提议。

这种有选择地更新记忆的机制,避免了冗余、不可行或无信息的轨迹污染记忆库。

实验:成本降低 2-3 倍,性能持平

研究者在 AppWorldBFCL v3MCP-Universe 三个基准上进行了测试。结果显示:

  • 相比无记忆基线,PREPING 带来显著提升;
  • 与基于离线演示或在线交互的 playbook 方法相比,PREPING 性能不相上下
  • 部署成本大幅降低:在 AppWorld 上仅为在线记忆构建的 1/2.99,在 BFCL v3 上为 1/2.23

关键洞察:质量胜过数量

进一步分析表明,PREPING 的成功并非单纯依赖合成数据的规模,而是源于 Proposer 端对可行性、冗余度和覆盖范围的控制,以及选择性记忆更新策略。这为智能体在零任务先例下的自主适应能力提供了新思路。

行业意义:更高效的 Agent 部署

当前 AI 应用(如工具调用、代码生成)中,Agent 的冷启动问题是一个实际瓶颈。PREPING 通过自生成练习而非依赖人工或在线数据,有望降低部署门槛,尤其适合隐私敏感或交互成本高昂的场景。未来,如何将 proposer memory 扩展到更复杂的多步骤任务,将是值得关注的方向。

论文链接:arXiv:2605.13880

延伸阅读

  1. AI代理设计模式新框架:认知功能与执行拓扑的二维分类
  2. 用混合整数目标规划实现个性化膳食优化:告别1.7个鸡蛋的尴尬
  3. GraphBit:基于图结构的确定性智能体编排框架,终结提示编排的幻觉与循环
查看原文