统一零样本时间序列预测:Darts 基础模型
时间序列分析是机器学习的重要分支,广泛应用于金融、气象、物联网等领域。自 2020 年首次发布以来,Darts 已成为最受欢迎的开源 Python 时间序列库之一。然而,随着 Chronos-2、TimesFM 2.5、TiRex、PatchTST-FM 等基础模型相继涌现,零样本预测能力显著提升,却因接口碎片化、缺乏互操作性而难以集成。
近日,Darts 团队在 arXiv 发布论文《Unified Zero-Shot Time Series Forecasting: A Darts Foundation》,提出统一 FoundationModel 类集合,将上述主流基础模型封装为标准化接口,实现“只需改个名字”即可在现有 Darts 流水线中调用。
零样本预测的范式转移
传统时间序列预测需要针对每个数据集训练定制模型,成本高、泛化差。基础模型通过海量数据预训练,可直接用于未见过的任务,无需微调即可取得竞争性结果。但问题在于:每个模型都有独立的 API、预处理逻辑和输出格式,用户被迫在多个代码库间切换。
Darts 的解决方案
Darts 的 FoundationModel 类提供了全周期预测接口,涵盖零样本推理、微调、不确定性估计和回测。用户只需将模型名称从 ARIMA 改为 Chronos-2,即可体验零样本能力。新流水线也能无缝集成数据处理与评估工具。
论文以 Chronos-2、TimesFM 2.5、TiRex、PatchTST-FM 为例,展示了统一框架如何降低使用门槛。例如,在能源负荷预测任务中,零样本模型的表现已接近甚至超越领域专用模型,且无需重新训练。
行业意义与未来
这项工作的核心价值在于生态整合。Darts 作为已有庞大用户基础的库,其统一接口有望加速基础模型在工业界的落地。未来,更多模型(如 Lag-Llama、MOMENT)可能被纳入,推动时间序列预测向“预训练+零样本”范式全面转型。
对于开发者而言,这意味着更少的代码、更高的复用性;对于业务方,则意味着更快地从数据中获取洞察。基础模型不再是孤立的“黑盒”,而是可组合、可评估的标准化组件。