新上线今天0 投票
多源数据联合发现偏微分方程:竞争优化框架MCO-PDE
从单数据集到多源数据:方程发现的瓶颈与突破
在科学机器学习领域,从观测数据中自动发现控制方程是实现可解释性AI的关键一步。然而,现有数据驱动方法大多局限于单一数据集,当观测受限时(如空间采样稀疏或边界条件不完整),其性能往往大打折扣。现实中,同一物理系统常有多组数据集可用,它们仅因初始条件或边界配置不同而有所区别。
MCO-PDE:竞争优化框架的核心设计
针对上述问题,来自北京大学等机构的研究团队提出了 MCO-PDE(Multi-source Competitive Optimization for PDE discovery)框架,旨在从多源数据中联合发现共享的偏微分方程。该框架包含三个关键模块:
- 独立神经代理训练:为每个数据源单独训练一个神经网络,作为该数据源动态行为的代理模型。
- 软竞争加权机制:动态评估每个数据源的“可信度”,并为全局共识系数的聚合分配权重。这种软竞争方式使得低质量或信息量少的数据源自动被降权,而高质量数据源主导方程发现。
- 遗传算法结构搜索:在系数空间和函数形式空间中进行全局优化,同时识别控制方程的函数形式和参数。
实验验证:小样本、复杂几何与真实数据
研究团队在多个案例上验证了MCO-PDE的有效性:
- 小样本恢复:仅需每个数据源50个观测点,即可高精度恢复经典方程(如Burgers方程、波动方程等)。
- 二维/三维不规则区域:框架天然支持不规则边界和异质系数,无需特殊处理。
- 真实波槽实验数据:成功从实际物理实验中提取出有意义的波浪传播方程,展示了从真实噪声数据中自动发现物理定律的潜力。
意义与展望
MCO-PDE的提出标志着数据驱动科学发现从单数据集向多源异构数据融合的重要跨越。其竞争优化策略不仅提高了方程发现的鲁棒性,还为处理现实世界中数据质量参差不齐的问题提供了新思路。未来,该框架有望推广至更复杂的耦合系统、高维问题,甚至与主动学习结合,进一步降低数据需求。
论文链接:arXiv:2606.30699