SheepNav
新上线今天0 投票

Manifold Representation Forgetting:一种基于流形表示遗忘的近似机器反学习新方法

近日,一篇发表在 arXiv 上的论文提出了一种名为 ManiF-SMC(Manifold Forgetting with Self Mode Connectivity)的新型机器反学习方法,旨在更有效地实现“被遗忘权”。机器反学习的目标是从已训练好的模型中删除特定数据的影响,但现有方法往往效果有限,且可能破坏原始学习目标。ManiF-SMC 通过将反学习问题重新定义为在表示空间中推动被遗忘样本远离其原始流形中心,并利用自模式连通性自适应生成边界,实现了与重训练等效的反学习效果。

核心问题:现有反学习方法的局限

当前大多数反学习方法依赖于标签操作或任务梯度反转,但这些方式存在明显缺陷:

  • 反学习效果有限:难以彻底消除目标数据的影响。
  • 破坏原有模型性能:可能损害模型在剩余数据上的表现。
  • 不等价于重训练:无法保证与从头训练(在移除数据后)的模型行为一致。

ManiF-SMC 的创新思路

研究团队观察到,在剩余数据上重训练的模型倾向于根据语义相似性对已删除样本进行分类。基于此,他们提出将近似反学习重新定义为:将每个被遗忘样本从其原始学习的流形表示中心,推向保留数据中与其最相似的语义邻居。这一操作完全在表示空间中进行,减少了对标签和任务特定梯度的依赖。

具体而言,ManiF-SMC 采用基于边界的三元组损失来同时实现反学习和表示保留目标。然而,为每个反学习案例找到合适的边界极具挑战。为此,论文引入自模式连通性模块,能够快速重建局部流形,从而为每个反学习案例生成自适应的边界。

实验验证与性能

在四个代表性数据集上的大量实验表明,ManiF-SMC 在仅操作模型表示空间的情况下,反学习效果可与最先进的近似方法相媲美,同时保持了对原始任务的性能。该方法为机器反学习提供了一条不依赖标签和梯度反转的新路径,具有重要的理论与应用价值。

意义与展望

随着数据隐私法规(如 GDPR)的推行,机器反学习成为保障用户“被遗忘权”的关键技术。ManiF-SMC 的提出不仅提升了反学习的有效性,还通过纯表示空间操作降低了实现门槛。未来,该方法有望应用于联邦学习、推荐系统等需要动态删除用户数据的场景。

延伸阅读

  1. LLM何时需要推理?熵相变视角下的动态系统解读
  2. MedExpMem: Adapting Experience Memory for Differential Diagnosis
  3. 思维链推理的“捷径”:小语言模型算术任务中的位置复制机制
查看原文