LoRA微调发现遗忘现象：高争议样本学习效果差

LoRA微调中的“遗忘”现象：高争议样本为何越学越差？

一项最新研究发现，在LoRA（Low-Rank Adaptation）微调过程中，模型对标注者争议较大的样本表现出一种独特的“遗忘”模式——训练损失不降反升。这一现象在全参数微调中基本不存在，却在所有测试的六个模型中（四个编码器模型、两个仅解码器模型）一致出现。

研究团队通过分析ChaosNLI数据集（每个样本提供100个标注标签）计算标注熵——衡量标注者之间分歧程度的指标。他们将标注熵与每个样本在SNLI和MNLI数据集上的**损失曲线下面积（AULC）**进行关联分析。

结果令人惊讶：在所有25个测试条件下，两者均呈现正相关（Spearman ρ = 0.06–0.43）。这意味着标注者争议越大的样本，在LoRA微调过程中学习效果越差，损失曲线呈现上升趋势。

这种差异揭示了两种微调方法在学习机制上的本质不同。LoRA通过低秩矩阵更新参数，可能对噪声敏感；而全参数微调能更全面地调整模型表示。

研究还发现一个有趣模式：在相同LoRA秩条件下，仅解码器模型（如GPT系列架构）比编码器模型（如BERT系列架构）表现出更强的相关性。这可能源于不同架构对标注噪声的敏感度差异，或是注意力机制在处理模糊信息时的不同表现。

为确保发现可靠，研究团队进行了多方面验证：

这一发现对大语言模型微调实践具有重要指导价值：

数据质量评估：标注熵可作为数据清洗的重要指标。高争议样本可能需要额外处理（如重新标注、加权采样或直接剔除），特别是在使用LoRA等高效微调方法时。

微调策略选择：当处理争议性较大的任务（如主观判断、创意写作评估）时，可能需要谨慎选择微调方法。全参数微调可能更适合处理模糊边界样本。

模型解释性：研究为理解LoRA的“黑箱”行为提供了新视角。为什么参数高效的方法会对某些样本“学不会”？这背后可能涉及模型容量、优化轨迹和表示空间的复杂交互。

虽然研究聚焦NLI任务，但这一现象很可能推广到其他自然语言处理任务。未来研究可探索：

这项研究揭示了LoRA微调的一个潜在盲点：它对标注者分歧大的样本处理不佳，甚至出现“越训练越差”的反常现象。这提醒AI从业者，在选择微调方法时，不仅要考虑计算效率和性能，还要评估数据特性与微调方法的匹配度。对于标注质量参差不齐的现实场景，全参数微调可能仍是更稳妥的选择。

论文信息：arXiv:2604.16332，提交于2026年3月12日，作者Brady Steele。