精选今天0 投票
KAN-MLP-Mixer:柯尔莫哥洛夫-阿诺德网络与MLP混合架构,让人体活动识别更准更稳
研究背景:KAN的精度与MLP的鲁棒性,能否兼得?
近年来,Kolmogorov-Arnold Networks(KAN) 因其在低维、干净数据上卓越的函数拟合能力而备受关注。然而,当面对真实世界中充满噪声、不完美的传感器数据时,KAN的性能明显下降。相反,传统的多层感知机(MLP) 虽然精度不如KAN,但对噪声容忍度更高,计算效率也更具优势。
在基于惯性测量单元(IMU)的人体活动识别(HAR) 任务中,简单地将所有MLP组件替换为KAN,往往导致精度和计算效率双双下降。这揭示了一个核心挑战:如何融合KAN的精确性与MLP的噪声鲁棒性和高效性?
方法:KAN-MLP-Mixer混合架构
针对上述问题,来自德国人工智能研究中心(DFKI)等机构的研究团队系统探索了KAN模块在深层HAR网络中的不同放置位置,并提出了一种名为 KAN-MLP-Mixer 的混合架构。该架构的核心策略包括:
- 输入嵌入层采用KAN:利用KAN对复杂函数的高效学习能力,从原始IMU信号中提取高质量特征。
- 中间特征混合保留MLP:保持MLP层用于中间特征混合,以利用其对噪声的鲁棒性和计算效率。
- 分类层引入LarctanKAN模块:设计了一种名为 LarctanKAN 的专用模块,用于最终的分类决策,该模块通过引入arctan激活函数改进传统KAN的数值稳定性。
实验结果:性能显著提升
在8个公开HAR数据集上的实验表明,KAN-MLP-Mixer相比纯MLP模型,平均宏F1分数相对提升5.33%,显著优于单纯的KAN或MLP基线。此外,将该混合策略集成到其他先进的HAR架构中,也能持续带来性能提升。
行业启示:混合范式或成趋势
这项研究不仅为IMU-based HAR领域提供了更优的模型方案,更揭示了一个重要思路:在现实世界的噪声环境中,简单的“替换”不如“融合”。通过精心设计的混合架构,可以平衡不同网络结构的优势,从而在精度、鲁棒性和效率之间取得最佳折中。
未来,随着可穿戴设备和边缘计算的发展,这种混合范式有望在更多传感器数据驱动的任务中落地,让人工智能更好地服务于真实场景。