SheepNav
从折叠纸盒到修理吸尘器:GEN-1 机器人模型实现 99% 可靠性
新上线今天0 投票

从折叠纸盒到修理吸尘器:GEN-1 机器人模型实现 99% 可靠性

机器人机器学习公司 Generalist 近日发布了 GEN-1 物理 AI 系统,宣称其在多种需要人手灵活性与肌肉记忆的物理技能上达到了“生产级成功率”。这一新模型不仅能够以约三倍于前代 GEN-0 的速度执行重复性精细任务,更关键的是,它具备应对干扰、即兴发挥的能力,甚至能“连接不同领域的想法来解决新问题”。

数据瓶颈的突破:从“数据手”到海量物理交互

与大型语言模型(LLM)可以轻松获取互联网上万亿级文本数据不同,机器人模型长期以来缺乏高质量、可扩展的物理交互数据来源。Generalist 通过其创新的 “数据手”(data hands)——一套可穿戴的夹持器——解决了这一难题。这些设备在人类执行手工任务时,精确捕捉微动作和视觉信息。

公司现已收集了 超过 50 万小时 的物理交互数据,数据量达 PB 级,为 GEN-1 的训练提供了坚实基础。这种大规模、高保真的数据积累,是模型能够泛化到多种未训练场景的核心前提。

核心能力:精度、速度与适应性

GEN-1 展示了令人印象深刻的综合能力:

  • 高精度操作:能够完成将钱放入钱包这类需要毫米级精度的任务。
  • 广泛技能覆盖:可适应折叠衣物、分类汽车零件等多种物理操作。
  • 超高成功率与速度:在折叠纸盒、包装手机、维修机器人吸尘器等重复性精细机械任务上,达到了 99% 的成功率,且速度约为 GEN-0 的 三倍
  • 快速适应:仅需约 1 小时 的“机器人数据”微调,就能将预训练知识适配到特定的机器人实体上,大幅降低了部署成本和时间。

真正的飞跃:从“执行程序”到“应对意外”

传统复杂机器人系统通常依赖精心预设的程序,或只能专注于单一、变化极小的任务。GEN-1 的突破性在于其 泛化与即兴能力

模型能够基于先前经验进行即兴发挥,并对干扰做出自然反应,即使这些干扰 “完全超出训练数据分布”。例如,在《福布斯》的采访中,Generalist 工程师描述了这样一个场景:当任务执行过程中出现意外障碍时,GEN-1 不是失败或停止,而是能自主规划出一系列新的动作序列来绕过障碍、完成任务。这种从错误中恢复并寻找替代方案的能力,是迈向真正自主、类人机器人的关键一步。

行业意义:规模化定律在机器人领域的验证

GEN-1 是建立在 GEN-0 概念验证基础上的产物。GEN-0 已于去年 11 月展示了 规模化定律(scaling laws) 在机器人训练中的适用性——即更多的预训练数据和计算时间能显著提升训练后性能。GEN-1 的成功进一步证实了这一路径的有效性,为整个机器人 AI 领域指明了一个清晰的发展方向:通过构建大规模、多样化的物理世界数据集,并结合强大的基础模型架构,机器人能力可以实现类似 LLM 的指数级提升。

小结

GEN-1 的发布标志着机器人 AI 正从一个依赖硬编码和狭窄任务训练的领域,转向一个基于海量数据、具备强大泛化与适应能力的通用物理智能新阶段。其 99% 的可靠性与应对未知的能力,不仅对工业自动化、物流分拣、家庭服务等场景具有 immediate 的落地价值,更长远来看,它为开发能在动态、非结构化真实世界中可靠工作的通用机器人铺平了道路。下一步的挑战可能在于如何进一步降低成本、扩大技能库,以及确保其在更复杂、安全攸关的环境中的稳健性。

延伸阅读

  1. OpenAI 校友低调启动新基金,目标募资 1 亿美元,已悄然投资
  2. “问题出在萨姆·奥特曼”:OpenAI内部人士不信任CEO
  3. M5 MacBook Air 发布仅一个月就迎来历史最低价,亚马逊售价 949 美元起
查看原文