简单状态空间模型SSM在多变量时间序列分类中超越Mamba

时间序列分类（TSC）是许多工业应用的核心任务，从金融预测到医疗诊断都离不开它。近年来，状态空间模型（SSM） 作为序列建模的新范式备受关注，尤其是以 Mamba 为代表的架构，通过输入依赖的状态转换取得了出色表现，但代价是极高的计算复杂度。然而，一项最新研究打破了这一趋势——来自莫纳什大学等机构的研究人员发现，更简单的对角 SSM（S4D） 在 TSC 任务上不仅效率更高，准确率也全面超越 Mamba 变体。

核心发现：复杂度并非越多越好

研究团队首次系统比较了**对角 SSM（S4D）和输入依赖 SSM（Mamba 家族）**在大规模 TSC 基准上的表现，覆盖 59 个数据集，包括 MONSTER（多达 6000 万样本、5 万时间步、82 个类别）和 UEA 基准。结果出人意料：S4D 在准确率和效率上均稳定优于 Mamba 变体，挑战了“更高复杂度必然带来更好性能”的普遍假设。

轻量级改进：MS4 与 MS4N

基于这一发现，团队提出了两个轻量级改进版本：

MS4：在 S4D 基础上加入线性输入投影和通道混合机制，几乎不增加计算量。
MS4N：进一步引入归一化操作，稳定状态动态，开销可忽略。

在与 15 个基线模型的对比中，MS4 和 MS4N 不仅全面超越 Mamba 模型，还匹配甚至超越了参数规模大 2 倍到 10 倍的深度学习模型。这意味着，在 TSC 领域，轻量级结构化 SSM 完全可以替代堆砌复杂度的方案。

行业启示：效率与精度的新平衡

这一研究对 AI 行业有重要启示。当前，大模型竞赛中“越大越好”的思维盛行，但在许多实际应用中，计算资源有限，效率与精度的平衡才是关键。SSM 作为 Transformer 的潜在替代者，其简化版本在 TSC 上的成功表明：针对特定任务设计精简架构，可能比盲目扩大模型更有效。

此外，Mamba 架构虽在语言建模等领域表现突出，但其在时间序列任务中的优势并不明显。这提醒我们，架构选择应基于任务特性，而非盲目追随潮流。

未来方向

研究团队指出，未来工作可探索将 SSM 与其他机制（如注意力）结合，或进一步优化归一化策略。同时，将 MS4/MS4N 扩展到更多序列任务（如异常检测、预测）也是自然方向。

总之，这篇论文为时间序列分类提供了一个简单、高效且强大的新基线，也再次证明：在 AI 领域，少即是多的理念依然值得重视。

简单状态空间模型在多变量时间序列分类中表现卓越

核心发现：复杂度并非越多越好

轻量级改进：MS4 与 MS4N

行业启示：效率与精度的新平衡

未来方向

延伸阅读

相关资讯