
AI 编程代理教会机器人安装 GPU 和剪扎带,NVIDIA 实验室实现夜间自主进化
NVIDIA 的 GEAR 实验室联合卡内基梅隆大学和加州大学伯克利分校,开发了一个名为 ENPIRE 的新型代理框架,让多个 AI 编程代理能够自主协作训练机器人完成复杂任务。在实验中,这些代理成功教会机器人 剪断扎带 和 将 GPU 插入主板上的薄型插槽 等精细操作。
框架核心:让 AI 自主驱动机器人训练
ENPIRE 框架包含四个模块,赋予 AI 编程代理以下能力:
- 自动重置与验证:确保实验条件一致并验证任务结果。
- 策略优化:迭代改进指导机器人行为的策略。
- 并行评估:同时在多台实体机器人上测试策略。
- 故障分析与修复:通过分析日志、阅读研究论文,改进训练基础设施和算法代码。
团队测试了三种 AI 编程代理:OpenAI 的 Codex(基于 GPT-5.5)、Anthropic 的 Claude Code(Opus 4.7)以及 Moonshot AI 的 Kimi Code(Kimi K2.6)。这些代理各自独立开发不同的算法方法,在真实实验中测试,并保留能提升整体成功率的变更,经过多轮自主迭代后,机器人任务表现持续提升。
行业意义:从“人工调参”到“AI 自进化”
NVIDIA AI 总监 Jim Fan 在 LinkedIn 上表示:“我们 GEAR 实验室的一部分现在可以彻夜不休地自我改进,我们早上只需阅读报告。”他调侃道:“我们都去度假,Jensen 甚至不会注意到。”这指向了机器人训练领域的一个关键瓶颈:传统方法依赖大量人工调参和手动纠错,而 ENPIRE 框架通过 “慷慨的 token 预算” 让 AI 代理自主完成整个训练循环。
更值得关注的是,团队计划将 ENPIRE 全部开源,这意味着任何研究机构或爱好者都可以搭建自己的“自主运行机器人实验室”。这有望大幅降低机器人训练的门槛,加速从工业装配到家庭服务等场景的机器人部署。
局限与展望
尽管成果令人振奋,论文也指出了当前方法的局限,例如对 token 预算的依赖较高,以及在极端复杂或非结构化环境中的泛化能力仍需提升。但整体而言,这项研究展示了 AI 代理在 自动化科研实验 和 机器人技能习得 上的巨大潜力,预示着未来 AI 不仅能编写代码,还能直接操作物理世界。