基于群分解理论与参数划分的变换分类方法

无监督表示学习的目标是从感官数据中提取有意义的特征，但什么才算是“好”的表示，至今缺乏统一的理论解释。近日，东京大学的研究团队在 arXiv 上发表了一项新研究，提出一种基于群分解理论的变换分类方法，通过参数划分与同态约束来识别变换中的结构，无需监督信号即可将旋转、平移、缩放等变换归入不同类别。

从解耦到群分解：表示学习的新视角

经典解耦学习追求表示中各个因子相互独立，但当真实世界的变换因子相互耦合时（比如物体同时发生旋转和平移），独立假设便不再成立。此前，该团队曾利用伽罗瓦理论，通过将变换分解为两个变换的乘积来学习群结构，其中一个因子被限制在正规子群内。然而，该方法依赖运动、等距等辅助假设，且消融实验未能清晰分离理论约束与辅助假设的效果。

参数划分：更简洁的理论框架

新方法参数划分（Parameter Division）摒弃了辅助假设，直接对单个变换的参数进行拆分：将完整变换的参数分为若干分量，并施加同态约束——要求完整变换到某一分量的映射保持群运算结构。该分量的核（即映射到单位元的变换集合）恰好构成一个正规子群。通过这种方式，模型可以自动识别出变换中哪些成分构成结构化的子群。

实验在包含旋转、平移、缩放的图像对上进行。消融研究显示，正是群分解约束驱动了正确的分类行为，而非数据中的统计偏差。

理论意义与潜在应用

这项工作为无监督表示学习提供了更坚实的代数基础。相比依赖统计独立性的方法，群分解框架能够处理非交换变换（如三维旋转），并有望推广到更复杂的视觉变换场景。未来，该方法或可应用于机器人感知中的运动分类、图像生成中的可控编辑，以及任何需要从数据中自动发现变换结构的问题。

不过，研究目前仍停留在合成数据阶段，真实场景下的泛化能力还有待验证。但无论如何，将抽象代数引入表示学习，不失为一条值得探索的方向。

基于群分解理论与参数划分的变换分类方法

从解耦到群分解：表示学习的新视角

参数划分：更简洁的理论框架

理论意义与潜在应用

延伸阅读

相关资讯