新上线今天0 投票
基于群分解理论与参数划分的变换分类方法
无监督表示学习的目标是从感官数据中提取有意义的特征,但什么才算是“好”的表示,至今缺乏统一的理论解释。近日,东京大学的研究团队在 arXiv 上发表了一项新研究,提出一种基于群分解理论的变换分类方法,通过参数划分与同态约束来识别变换中的结构,无需监督信号即可将旋转、平移、缩放等变换归入不同类别。
从解耦到群分解:表示学习的新视角
经典解耦学习追求表示中各个因子相互独立,但当真实世界的变换因子相互耦合时(比如物体同时发生旋转和平移),独立假设便不再成立。此前,该团队曾利用伽罗瓦理论,通过将变换分解为两个变换的乘积来学习群结构,其中一个因子被限制在正规子群内。然而,该方法依赖运动、等距等辅助假设,且消融实验未能清晰分离理论约束与辅助假设的效果。
参数划分:更简洁的理论框架
新方法参数划分(Parameter Division)摒弃了辅助假设,直接对单个变换的参数进行拆分:将完整变换的参数分为若干分量,并施加同态约束——要求完整变换到某一分量的映射保持群运算结构。该分量的核(即映射到单位元的变换集合)恰好构成一个正规子群。通过这种方式,模型可以自动识别出变换中哪些成分构成结构化的子群。
实验在包含旋转、平移、缩放的图像对上进行。消融研究显示,正是群分解约束驱动了正确的分类行为,而非数据中的统计偏差。
理论意义与潜在应用
这项工作为无监督表示学习提供了更坚实的代数基础。相比依赖统计独立性的方法,群分解框架能够处理非交换变换(如三维旋转),并有望推广到更复杂的视觉变换场景。未来,该方法或可应用于机器人感知中的运动分类、图像生成中的可控编辑,以及任何需要从数据中自动发现变换结构的问题。
不过,研究目前仍停留在合成数据阶段,真实场景下的泛化能力还有待验证。但无论如何,将抽象代数引入表示学习,不失为一条值得探索的方向。