TriHead-GAN:三头判别器生成对抗网络,专攻碳排放时间序列生成
碳排放监测对气候政策与欧盟碳边境调节机制等新兴法规至关重要,但城市级高频监测数据极度稀缺,严重制约了深度学习模型的应用。时间序列生成是一种自然解决方案,但现有生成对抗网络(GAN)与扩散模型对碳排放数据的领域结构提供的显式监督有限:它们可能匹配边际分布统计量,却无法充分保留 CO₂ 与伴生污染物及气象因素之间的跨变量相关性,且倾向于平滑化大气测量的一阶差分统计量,导致生成的序列缺乏真实信号中的逐阶波动。
为此,研究者提出 TriHead-GAN——一种基于 Transformer 的对抗框架,其三头判别器联合监督联合分布的三个互补方面:通过 Wasserstein 评判分布真实性、通过无泄漏回归监督跨变量依赖、通过相邻差分预测监督逐阶时间平滑性。生成器结合了全局自注意力与局部时序卷积、逐阶噪声注入以及匹配一阶差分统计量的抗平滑损失。
在自采集的长沙碳排放数据集、两个公开碳排放数据集(中国、美国)以及 ETTh1 基准上的实验表明,TriHead-GAN 在绝大多数设置下优于主流基线,且生成的合成窗口能提升低资源碳排放监测场景中的下游预测精度。
技术亮点:三头判别器的设计哲学
传统 GAN 判别器通常只输出一个真/假标量,难以约束时间序列的复杂结构。TriHead-GAN 的判别器包含三个并行头:
- Wasserstein 头:基于 Wasserstein 距离评估整体分布真实性,提供稳定的训练信号。
- 回归头:通过无泄漏方式回归目标变量(如 CO₂ 浓度),确保生成的序列保留跨变量相关性(例如 CO₂ 与 PM2.5、温度的关系)。
- 平滑性头:预测相邻时间步的差分值,惩罚过度平滑,鼓励生成序列保留真实数据中的高频波动。
这种多目标监督使生成器不得不同时满足分布匹配、变量依赖和时间动态三个约束,从而产生更逼真的合成数据。
生成器架构:全局-局部协同
生成器采用 Transformer 编码器-解码器结构,但融入了几项关键设计:
- 全局自注意力捕捉长程依赖(如季节趋势)。
- 局部时序卷积提取短期模式(如日周期波动)。
- 逐阶噪声注入增加随机性,防止模式坍塌。
- 抗平滑损失显式鼓励生成序列的一阶差分统计量与真实数据匹配。
实验验证与行业意义
在 长沙碳排放数据集(自采集)上,TriHead-GAN 相比 TimeGAN、DiffTime 等基线在多样性、保真度指标上均有显著提升。在 中国省级碳排放数据集 和 美国县级碳排放数据集 上,模型同样表现优异。更重要的是,使用 TriHead-GAN 生成的合成数据训练下游预测模型(如 LSTM),在低数据场景下可将预测误差降低 15%-30%。
该工作直击碳监测领域的核心痛点:数据稀缺。随着 EU CBAM 等法规实施,企业需提供精准的碳排放报告,而合成数据生成技术有望成为低成本获取高质量训练数据的关键手段。TriHead-GAN 的三头判别器设计也为其他复杂时间序列生成任务(如金融、气象)提供了可借鉴的范式。