状态化ReAct智能体：Token成本降低90%的自主实验新方法

自主实验（autoresearch）模式让大语言模型（LLM）通过迭代修改代码来优化目标指标，但其无状态设计导致每次迭代都要从头重建实验上下文，产生 O(n) 的逐次 Token 成本和 O(n²) 的总成本。最新研究《Remember, Don't Re-read: Stateful ReAct Agents for Token-Efficient Autonomous Experimentation》提出用 LangGraph 构建状态化 ReAct 智能体，通过类型化持久状态和工具调用接口在迭代间携带实验历史，从而将 Token 消耗大幅降低。

核心创新：从“重读”到“记住”

传统无状态智能体每次迭代都会将完整历史（包括代码、结果、日志）重新送入 LLM 上下文窗口，导致 Token 消耗随迭代次数线性增长。状态化 ReAct 智能体则利用 LangGraph 的持久化状态机制，只将当前步骤的必要信息（如最新结果、待办动作）放入上下文，历史信息通过内部状态引用而非显式重读。这种设计将每次迭代的 Token 成本从 O(n) 降为 O(1)。

基准测试结果

研究者在两项任务上进行了评估：

超参数调优（15 次迭代，每次观察数据量小）：状态化智能体消耗 2,492 个 Token，比无状态版本的 24,465 个减少 90%。
代码性能优化（40 次迭代，每次包含完整源码和基准结果）：状态化智能体消耗 627K Token，比无状态版本的 1,275K 减少 52%，且优化质量相当。

架构细节与可复现性

论文详细描述了基于 LangGraph 的实现：

定义类型化状态（TypedState）存储实验历史、当前步骤和工具调用记录。
ReAct 智能体通过工具调用接口与环境交互，每次只追加新信息到固定大小的对话窗口。
状态管理自动剪枝过期上下文，避免上下文膨胀。

作者提供了足够详细的设计说明，使从业者能够为自己的工作流实现类似的状态化自主实验智能体。

意义与展望

这项工作的价值不仅在于 Token 节省——在 GPT-4 等昂贵模型上，成本降低直接意味着更长的实验序列或更复杂的任务成为可能。此外，固定上下文窗口还避免了长序列推理中的“迷失在中间”问题，可能提升模型在长任务中的稳定性。未来方向包括将状态化设计扩展到多智能体协作、动态上下文压缩等场景。

别再重读：状态化 ReAct 智能体如何将自主实验的 Token 成本降低 90%

核心创新：从“重读”到“记住”

基准测试结果

架构细节与可复现性

意义与展望

延伸阅读

相关资讯