新上线今天0 投票
设备端神经架构搜索:让AI芯片学会“自我设计”
核心突破:在传感器旁完成模型定制
近日,一篇发表于arXiv的论文提出了一种全新的**设备端神经架构搜索(On-Device NAS)**方法,将模型设计过程从云端下沉到部署设备本身。这项技术允许轻量级NAS算法直接在传感器所在的嵌入式系统上运行,根据实时采集的数据自动寻找最优的小型神经网络结构。
为什么需要“自己设计”的模型?
传统做法中,神经网络架构通常由开发者在服务器上预先设计并训练,再部署到边缘设备。但这种方式在面对个体差异显著的应用场景(如生物信号分析)时存在短板——不同用户的手势肌电信号、心率特征往往大相径庭,预训练模型难以泛化。论文提出的方法允许设备在用户更换后,通过一次引导式数据采集,重新搜索并定制最适合当前用户的网络结构,从而在边缘端实现真正的个性化适应。
性能验证:更小、更准、更省内存
团队以意大利手语(ISL)数据集(包含意大利字母手势的表面肌电信号)和凯斯西储大学(CWRU)轴承故障诊断数据集作为验证基准,在Raspberry Pi 4等嵌入式平台上测试。结果显示:
- ISL任务:设备端NAS搜索出的网络相比现有最优方案,RAM占用减少37%,同时准确率提升5.96个百分点。
- CWRU任务:RAM占用降低56%,准确率仍高出0.2个百分点。
这种“又小又准”的特性,对于资源受限的可穿戴设备、工业传感器节点等场景意义重大。
技术实现:轻量级NAS如何“上机”?
论文设计了一套专为设备端优化的NAS流程,核心思路是简化搜索空间并采用权重共享等高效策略,使得搜索过程在计算能力有限的MCU或Linux单板计算机上可完成。搜索结束后,设备直接部署找到的架构,无需与云端交互。
应用前景与行业意义
这项研究将个性化边缘AI推进一步。在人机交互领域,智能假肢、手势控制设备可根据用户生理信号实时调整模型;在工业预测性维护中,不同工况下的振动信号也能驱动设备自优化。不过,论文未讨论搜索过程的能耗和延迟对实时性的影响,实际落地还需进一步验证。
总体而言,On-Device NAS为边缘AI的“自适应”能力提供了新范式,未来或将成为智能传感器的一项标配功能。