PREPING：智能体无任务经验如何自动构建记忆？

核心结论：记忆冷启动难题的新解法

智能体（Agent）在部署到新环境时，常因缺乏任务经验而陷入“冷启动”困境。传统的记忆构建依赖离线演示或在线交互，但前者需要人工标注，后者则需真实部署后才能积累。韩国科学技术院（KAIST）等机构的研究团队提出 PREPING 框架，让智能体在未观察任何目标任务的情况下，仅通过自生成合成实践来构建程序性记忆，从而以更低的成本实现与强基线相当的性能。

方法：Proposer-Guided 自循环

PREPING 的核心是一个 Proposer（提议器），它维护一个结构化控制状态（称为 proposer memory），用于指导后续的合成任务生成。具体流程如下：

Proposer 基于当前记忆状态，生成一个合成任务；
Solver（求解器） 尝试执行该任务；
Validator（验证器） 判断生成的轨迹是否有效，并将其存入记忆，同时向 Proposer 提供反馈以改进后续提议。

这种有选择地更新记忆的机制，避免了冗余、不可行或无信息的轨迹污染记忆库。

实验：成本降低 2-3 倍，性能持平

研究者在 AppWorld、BFCL v3 和 MCP-Universe 三个基准上进行了测试。结果显示：

相比无记忆基线，PREPING 带来显著提升；
与基于离线演示或在线交互的 playbook 方法相比，PREPING 性能不相上下；
部署成本大幅降低：在 AppWorld 上仅为在线记忆构建的 1/2.99，在 BFCL v3 上为 1/2.23。

关键洞察：质量胜过数量

进一步分析表明，PREPING 的成功并非单纯依赖合成数据的规模，而是源于 Proposer 端对可行性、冗余度和覆盖范围的控制，以及选择性记忆更新策略。这为智能体在零任务先例下的自主适应能力提供了新思路。

行业意义：更高效的 Agent 部署

当前 AI 应用（如工具调用、代码生成）中，Agent 的冷启动问题是一个实际瓶颈。PREPING 通过自生成练习而非依赖人工或在线数据，有望降低部署门槛，尤其适合隐私敏感或交互成本高昂的场景。未来，如何将 proposer memory 扩展到更复杂的多步骤任务，将是值得关注的方向。

论文链接：arXiv:2605.13880

PREPING：无任务先例，智能体如何自主构建记忆？

核心结论：记忆冷启动难题的新解法

方法：Proposer-Guided 自循环

实验：成本降低 2-3 倍，性能持平

关键洞察：质量胜过数量

行业意义：更高效的 Agent 部署

延伸阅读

相关资讯