突破 fMRI 数据瓶颈:双谱流匹配模型生成高保真脑功能时序数据
功能性磁共振成像(fMRI)是研究大脑动态活动的重要工具,但其数据采集成本高昂,限制了高质量样本的获取。近期,来自马来西亚和新加坡的研究团队提出了一种名为 双谱流匹配(Dual-Spectral Flow Matching, DSFM) 的新型生成框架,通过小波变换与离散余弦变换的双重谱域转换,结合流匹配模型,成功生成高保真的 fMRI 时间序列。该工作已被 ICLR 2026 接收,为脑疾病识别等下游任务提供了数据增强新思路。
核心挑战:fMRI 数据稀缺与非平稳特性
fMRI 通过测量血氧水平依赖(BOLD)信号来反映神经活动,但其采集耗时、成本高,导致公开数据集规模有限。传统生成模型(如 GAN、扩散模型)虽能合成图像或视频,但在处理 fMRI 时间序列时面临三大难点:
- 非平稳性:BOLD 信号随时间呈现统计特性变化,难以用固定分布建模。
- 复杂时空动态:脑区间的功能连接在时间上不断演化。
- 生理变异性:信号受心率、呼吸等生理噪声干扰,需保留真实波动特征。
方法创新:双谱流匹配框架
DSFM 提出一种级联双频表示策略,将原始 BOLD 信号依次转换到两个互补的谱域:
- 小波域(DWT):通过离散小波变换捕捉信号的全局瞬态与多尺度变化,获得时频分解图。
- 离散余弦域(DCT):在脑区和时间维度上投影到 DCT 空间,利用低频主导的 BOLD 系数实现局部能量压缩。
随后,一个类条件流匹配模型被训练用于生成余弦频率表示。模型通过逆 DCT 和逆 DWT 重建出时域 BOLD 信号。这种双重变换方法为生成过程施加了结构化频率先验,有效保留了关键的生理脑动力学。
实验验证与下游应用
研究团队在公开 fMRI 数据集上进行了评估,结果显示 DSFM 生成的样本在统计分布、功率谱密度和功能连接模式上与真实数据高度一致。更重要的是,将生成数据用于训练下游脑网络分类模型(如用于阿尔茨海默病或精神分裂症识别),分类准确率相比仅用真实数据提升了 10-15%,证明了其数据增强的有效性。
行业意义与未来展望
DSFM 为医学影像生成领域提供了新范式:通过显式引入频率先验,解决了生成非平稳时序数据的难题。该方法可扩展至其他神经成像模态(如 EEG、MEG),并有望降低脑疾病诊断对大规模真实数据的依赖。未来工作可能聚焦于条件生成(如生成特定疾病亚型的样本)和跨模态联合生成。
代码已开源(见论文链接),研究者可复现并应用于自己的数据集。