云端推理优于设备端？新研究挑战自动驾驶实时系统设计

传统观点认为，在自动驾驶等实时控制系统中，将推理任务放在设备端执行是唯一可行的选择，因为网络延迟和波动会严重影响云端推理的时效性。然而，一项来自加州大学洛杉矶分校等机构的最新研究（arXiv:2605.00005）却提出了截然不同的结论：在合适的条件下，云端推理不仅可行，甚至可能优于设备端。

该研究首先构建了一个形式化的分析模型，将分布式推理延迟建模为感知频率、平台吞吐量、网络延迟和任务安全约束的函数。模型揭示了关键权衡：虽然设备端避免了网络延迟，但其计算能力有限，导致推理吞吐量低，当感知频率升高时，设备端可能因处理速度跟不上而产生排队积压，反而增加延迟。相比之下，云端服务器拥有强大的算力，能够以高吞吐量处理请求，从而有效摊销网络传输和排队带来的延迟。

为了验证模型，研究者选择**自动紧急制动（AEB）**这一典型安全场景进行模拟。他们利用真实车辆动力学数据，对比了设备端和云端在不同网络条件、感知频率下的性能表现。结果显示，当网络延迟处于合理范围（例如数十毫秒）且云端资源充足时，云端推理能够更稳定地满足安全制动的时间约束，而设备端在高感知频率下则频繁出现超时。

这一发现挑战了分布式实时系统设计的传统智慧。研究者指出，随着5G/6G网络和边缘云的普及，网络延迟已大幅降低，而设备端算力的增长相对缓慢。因此，在系统设计时不应默认“设备优先”，而应基于实际负载、网络特性和安全需求进行量化权衡。

当然，该研究也承认其局限性：当前模型主要针对单任务场景，未考虑多任务并发或网络拥塞的极端情况。但无论如何，它为未来CPS架构设计提供了新的思路——云端并非遥不可及，在某些场景下，它可能比设备端更“近”。

云端比想象中更近：重新审视分布式实时推理的权衡

延伸阅读

相关资讯