SheepNav
新上线今天0 投票

PushCen-ADFL:面向异步去中心化联邦学习的偏差校正聚合新方法

异步去中心化联邦学习(ADFL)因无需中央协调和全局同步,成为大规模异构系统的理想选择。然而,频繁的点对点通信、有向拓扑上的异步更新以及非独立同分布(non-IID)数据共同导致了通信开销过大、聚合偏差严重和模型漂移问题。针对这些挑战,来自澳大利亚皇家墨尔本理工大学的研究团队提出了一种名为 PushCen-ADFL 的通信高效框架,相关论文已被 KDD 2026 接收。

核心思路:以质心为中心的三重闭环

PushCen-ADFL 的核心创新在于将通信、聚合与局部稳定化耦合在一个共享的质心表示空间中,形成一个压缩与优化之间的闭环。具体而言:

  • 质心消息交换:客户端之间不再直接交换完整模型,而是传输压缩后的质心形式消息,大幅降低单次通信成本。
  • 保平均推求和混合:采用平均保持的 push-sum 聚合机制,校正有向拓扑带来的聚合偏差,确保全局一致性。
  • 质心正则化:在相同质心空间内引入轻量级正则化项,有效缓解数据异构性和延迟更新导致的模型漂移。

此外,框架还设计了一个有界、发送端去重的缓冲区,进一步增强了在异步到达模式不规则情况下的鲁棒性。

实验结果:精度提升 6%,通信成本降低 80%

在多个视觉数据集上的实验表明,PushCen-ADFL 在数据异构场景下将模型精度最高提升了 6%,同时将每次推送的通信开销减少了 超过 80%,实现了精度与通信成本之间的出色平衡。这一成果对于资源受限的边缘设备集群尤其具有实际价值。

行业意义:去中心化联邦学习走向实用化

当前联邦学习主要依赖中心化聚合服务器,存在单点故障和通信瓶颈。PushCen-ADFL 通过纯去中心化架构和偏差校正机制,为构建真正大规模、高鲁棒性的分布式机器学习系统提供了可行路径。其压缩与优化协同设计的思路,也为其他异步分布式算法提供了借鉴。

小结:PushCen-ADFL 以创新的质心空间闭环设计,同时解决了 ADFL 中的通信效率、聚合偏差和模型漂移三大痛点,是去中心化联邦学习领域的重要进展。

延伸阅读

  1. GEM:几何熵混合——大模型预训练数据配比的最优解
  2. 约束税:小语言模型在结构化输出中的有效性与正确性权衡测量
  3. AirCast-SR:基于潜在一致性扩散的千米级大气超分辨率基础模型
查看原文