SheepNav
精选今天0 投票

世界泄露未来:利用演化构建未来预测智能体

在人工智能领域,许多关键决策必须在结果未知的情况下做出,这被称为未来预测问题。传统方法主要依赖最终结果进行改进,但这种方式过于粗糙,难以指导早期因素追踪、证据收集与解释或不确定性处理。近日,来自中国科学技术大学、中关村研究院和清华大学的研究团队在arXiv上发布了一篇题为《The World Leaks the Future: Harness Evolution for Future Prediction Agents》的论文,提出了一种名为Milkyway的自演化智能体系统,通过内部反馈机制,让模型在问题解决前就能持续改进预测能力。

未来预测的挑战与机遇

未来预测任务要求大型语言模型(LLM)智能体仅基于预测时可用的公开信息,对未解决的问题形成预测。这一设置之所以困难,是因为公开证据会随时间演变,而有用的监督信息只有在问题解决后才会到来。因此,大多数现有方法仍主要从最终结果中学习改进。然而,最终结果过于宏观,无法有效指导早期阶段的因素追踪证据收集与解释不确定性处理

论文指出,当同一个未解决的问题随时间被反复审视时,早期与后期预测之间的时间对比可以揭示早期预测过程中的遗漏;研究团队将这种信号称为内部反馈。这为智能体在最终结果到来前进行自我优化提供了可能。

Milkyway:自演化的未来预测系统

Milkyway系统的核心创新在于保持基础模型固定,转而更新一个持久的未来预测工具链。这个工具链专门负责因素追踪、证据收集与解释以及不确定性处理。系统通过以下机制实现持续进化:

  • 内部反馈提取:在对同一未解决问题进行重复预测的过程中,Milkyway提取内部反馈信号。
  • 可复用指导写入:系统将这些反馈转化为可复用的指导,写入工具链中。
  • 预测前改进:因此,后续对该问题的预测可以在结果已知前就得到改进。
  • 回顾性检查:问题解决后,最终结果提供一个回顾性检查,确保更新后的工具链在应用于后续问题前是可靠的。

这种方法不仅提高了预测的准确性,还增强了模型在动态环境中的适应能力。

实验验证与性能提升

研究团队在FutureXFutureWorld两个基准数据集上评估了Milkyway的性能。实验结果显示,Milkyway在对比方法中取得了最佳总体得分:

  • 在FutureX上,分数从44.07提升至60.90
  • 在FutureWorld上,分数从62.22提升至77.96

这些数据表明,通过利用内部反馈和工具链演化,Milkyway显著提升了未来预测任务的性能,验证了其方法的有效性。

对AI行业的启示

这项研究为AI预测系统的发展提供了新思路。在现实世界的决策场景中,如金融市场分析、政策制定或医疗诊断,往往需要在信息不完全的情况下做出判断。Milkyway的演化机制允许智能体在持续互动中学习,减少对事后监督的依赖,这对于构建更自主、更适应动态变化的AI系统具有重要意义。

未来,随着更多复杂预测任务的涌现,类似Milkyway的自演化框架可能会成为提升LLM在不确定环境中表现的关键技术之一。

延伸阅读

  1. 通过蒙特卡洛树搜索实现智能体技能的双层优化
  2. DeepER-Med:通过智能体AI推进医学深度循证研究
  3. AI智能体蒸馏中的不安全行为潜意识转移:首次实证研究揭示风险
查看原文