DSFM: 双谱流匹配生成高保真fMRI时间序列 - ICLR 2026

功能性磁共振成像（fMRI）是研究大脑动态活动的重要工具，但其数据采集成本高昂，限制了高质量样本的获取。近期，来自马来西亚和新加坡的研究团队提出了一种名为 双谱流匹配（Dual-Spectral Flow Matching, DSFM） 的新型生成框架，通过小波变换与离散余弦变换的双重谱域转换，结合流匹配模型，成功生成高保真的 fMRI 时间序列。该工作已被 ICLR 2026 接收，为脑疾病识别等下游任务提供了数据增强新思路。

核心挑战：fMRI 数据稀缺与非平稳特性

fMRI 通过测量血氧水平依赖（BOLD）信号来反映神经活动，但其采集耗时、成本高，导致公开数据集规模有限。传统生成模型（如 GAN、扩散模型）虽能合成图像或视频，但在处理 fMRI 时间序列时面临三大难点：

非平稳性：BOLD 信号随时间呈现统计特性变化，难以用固定分布建模。
复杂时空动态：脑区间的功能连接在时间上不断演化。
生理变异性：信号受心率、呼吸等生理噪声干扰，需保留真实波动特征。

方法创新：双谱流匹配框架

DSFM 提出一种级联双频表示策略，将原始 BOLD 信号依次转换到两个互补的谱域：

小波域（DWT）：通过离散小波变换捕捉信号的全局瞬态与多尺度变化，获得时频分解图。
离散余弦域（DCT）：在脑区和时间维度上投影到 DCT 空间，利用低频主导的 BOLD 系数实现局部能量压缩。

随后，一个类条件流匹配模型被训练用于生成余弦频率表示。模型通过逆 DCT 和逆 DWT 重建出时域 BOLD 信号。这种双重变换方法为生成过程施加了结构化频率先验，有效保留了关键的生理脑动力学。

实验验证与下游应用

研究团队在公开 fMRI 数据集上进行了评估，结果显示 DSFM 生成的样本在统计分布、功率谱密度和功能连接模式上与真实数据高度一致。更重要的是，将生成数据用于训练下游脑网络分类模型（如用于阿尔茨海默病或精神分裂症识别），分类准确率相比仅用真实数据提升了 10-15%，证明了其数据增强的有效性。

行业意义与未来展望

DSFM 为医学影像生成领域提供了新范式：通过显式引入频率先验，解决了生成非平稳时序数据的难题。该方法可扩展至其他神经成像模态（如 EEG、MEG），并有望降低脑疾病诊断对大规模真实数据的依赖。未来工作可能聚焦于条件生成（如生成特定疾病亚型的样本）和跨模态联合生成。

代码已开源（见论文链接），研究者可复现并应用于自己的数据集。

突破 fMRI 数据瓶颈：双谱流匹配模型生成高保真脑功能时序数据

核心挑战：fMRI 数据稀缺与非平稳特性

方法创新：双谱流匹配框架

实验验证与下游应用

行业意义与未来展望

延伸阅读

相关资讯