SheepNav
精选今天0 投票

从推理中寻找真相:动态表征编辑框架如何引导大模型走向真实

让大模型“想对方向”,而不仅是“想得更多”

当前提升大语言模型推理能力的主流方法,如思维链(Chain-of-Thought)“Wait”提示,本质上都是在鼓励模型“多想想”。然而,想得更多并不等于想得更正确——模型可能在复杂的推理步骤中越走越偏,最终生成看似合理但实则错误的答案。

一项被 ICML 2026 接收的新研究《Search for Truth from Reasoning》提出了一个关键问题:如何引导模型的推理轨迹真正趋向“真相”,而非仅仅增加推理步数? 为此,研究团队提出了一个名为 DynaSteer 的动态表征编辑框架,试图从模型内部表征的几何结构入手,实现对推理过程的精准干预。

三个关键发现:真相的“几何学”

研究首先深入分析了模型在推理过程中内部表征的变化,揭示了关于“真相”的三个重要性质:

  1. 真相编码在句子层级,且与推理模式纠缠:模型并非在单个 token 上编码“正确性”,而是在完整的句子或子句层面表达真实程度。同时,这种真实信号与模型使用的推理策略(如类比、分解)高度耦合,难以直接分离。
  2. 干预存在“测不准原理”与“衰减效应”:对模型表征的修改并非越早越好或越强越好。最佳干预时机位于早期、高熵的决策分叉点——此时模型尚未“下定决心”,干预效果最显著;而一旦进入低熵的确定性路径,干预效果会迅速衰减。
  3. 朴素干预向量噪声过大:直接使用简单的方向向量进行编辑,容易引入噪声,甚至破坏原本正确的推理轨迹,导致“误伤”。

DynaSteer:动态、精准、可回滚

基于上述洞察,DynaSteer 框架提出了三阶段解决方案:

  • 模式聚类解耦:首先对推理过程中的表征进行聚类,将不同的推理模式(如代数推理、几何推理)分离到不同的流形上,从而避免跨模式干扰。
  • Fisher-LDA 投影提纯:利用 Fisher 线性判别分析,在解耦后的流形上提取出最纯净的“真相方向”,大幅降低噪声。
  • 动态监测与选择性干预:通过实时计算前瞻熵(lookahead entropy) 来评估当前推理路径的不确定性。仅在熵值高于阈值时触发干预,并允许在干预失效时回滚到之前的健康状态。

实验验证与行业意义

MATH 基准上的全面实验表明,DynaSteer 在多个难度级别的数学推理任务上均显著提升了准确率,同时减少了不必要的推理步数。在跨领域代码生成任务上的测试进一步证实了其泛化能力。

这项工作的价值不仅在于技术本身,更在于它揭示了一个深层问题:当前的大模型推理增强方法大多停留在“量”的层面(增加步数、扩大搜索),而忽略了“质”的引导——如何让模型在推理过程中持续逼近真相。 DynaSteer 提供了一种可微、可控制的内部表征干预范式,有望与外部提示方法互补,成为下一代推理增强工具的核心组件。

随着大模型在数学、编程、科学推理等高价值场景中的应用日益深入,如何确保其推理结果的可信度将成为关键挑战。DynaSteer 的“动态编辑+回滚”思路,或许为这一难题提供了一条值得探索的新路径。

延伸阅读

  1. COMPASS:统一多模态模型中的构图意图引导与落地
  2. 用亚里士多德美德伦理学为LLM“画像”:VirtueMap框架解读
  3. IMCBench:多模态大模型在图像医疗对话中的新基准
查看原文