AGCLR：为连续潜在推理引入持久记忆，突破概念瓶颈

大语言模型（LLM）在数学推理和多跳规划任务中展现出惊人能力，但传统的思维链（CoT）方法迫使模型在早期就锁定单一推理路径，限制了探索多样性。CoCoNuT（连续思维链）范式尝试突破这一限制，允许模型在潜在空间中同时探索多条推理路径。然而，一篇新论文《Why Limit the Residual Stream to Layers and Not Tokens? Persistent Memory for Continuous Latent Reasoning》揭示了CoCoNuT的一个关键缺陷——概念瓶颈，并提出了一种名为AGCLR的改进方案。

概念瓶颈：遗忘的中间事实

研究发现，CoCoNuT在每个推理步骤中，中间隐藏状态会被覆盖，导致模型在推理深度增加时丢失早期计算的关键信息。实验数据证实了这一点：在HotpotQA数据集上，基础CoCoNuT的精确匹配（EM）得分仅为10.4%，甚至低于CoT基线（11.0%）；在GSM8K上，随着课程深度增加，性能反而下降。这意味着模型虽然能并行探索多条路径，却无法有效记忆和复用中间成果。

AGCLR：门控概念流与持久记忆

为解决问题，作者提出了AGCLR（自适应门控连续潜在推理）。核心创新是引入门控概念流——一个跨所有推理步骤维护的持久残差记忆。该记忆由三个可学习门控控制：

写入门：将中间事实提交到记忆；
读取门：检索相关先验状态；
遗忘门：剪除无关上下文。

这种设计让模型在持续推理过程中，既能记住关键信息，又能动态筛选有用内容，直接解决了概念瓶颈。

实验验证与性能提升

以GPT-2为基座模型，在GSM8K、HotpotQA和ProsQA三个数据集上，AGCLR均取得一致改进。随着课程深度增加，性能优势不断累积，充分证明其有效性。代码已开源。

意义与展望

这项工作揭示了连续潜在推理中记忆机制的重要性。AGCLR不仅提升了现有模型的推理能力，也为未来设计更高效、更持久的推理架构提供了新思路。当模型能像人类一样在长链条推理中“记笔记”并“回顾重点”，其解决复杂问题的潜力将进一步释放。

AGCLR：为连续潜在推理引入持久记忆，突破概念瓶颈

概念瓶颈：遗忘的中间事实

AGCLR：门控概念流与持久记忆

实验验证与性能提升

意义与展望

延伸阅读

相关资讯