SheepNav
新上线今天0 投票

机器人初创公司Physical Intelligence发布新模型π0.7,声称其机器人“大脑”能完成从未学过的任务

Physical Intelligence,这家位于旧金山、成立仅两年的机器人初创公司,已成为湾区最受关注的AI公司之一。周四,该公司发布了一项新研究,展示了其最新模型π0.7能够指挥机器人执行它们从未明确训练过的任务——这一能力连公司自己的研究人员都感到意外。

迈向通用机器人“大脑”的关键一步

π0.7被公司描述为迈向通用机器人“大脑”这一长期目标的一个早期但意义重大的步骤。这种“大脑”能够被指向一个不熟悉的任务,通过自然语言指导完成,并真正执行成功。如果这些发现经得起审查,它们可能意味着机器人AI正接近一个拐点,类似于大型语言模型领域所经历的那种能力爆发式增长。

核心突破:组合泛化能力

论文的核心主张是组合泛化——即模型能够将不同情境中学到的技能组合起来,解决从未遇到过的问题。

  • 传统方法的局限:迄今为止,机器人训练的标准方法基本上是死记硬背:收集特定任务的数据,训练一个专门针对该任务的模型,然后为每个新任务重复此过程。
  • π0.7的突破:Physical Intelligence声称,π0.7打破了这种模式。公司联合创始人、专注于机器人AI的加州大学伯克利分校教授Sergey Levine指出,一旦模型跨越了从“只做数据收集时的事情”到“以新方式重新组合事物”的阈值,其能力的提升将超过数据量的线性增长。这种更有利的扩展特性,我们已经在语言和视觉等其他领域看到过。

令人惊讶的演示:理解从未见过的空气炸锅

论文中最引人注目的演示涉及一个模型在训练中基本上从未见过的空气炸锅。研究团队调查后发现,在整个训练数据集中,只有两个相关片段:

  1. 一个片段中,一个不同的机器人只是推关了空气炸锅。
  2. 另一个片段来自开源数据集,另一个机器人根据指令将一个塑料瓶放入空气炸锅中。

模型不知何故,将这些零散的片段,加上更广泛的基于网络的预训练数据,综合成了对这个电器如何工作的功能性理解。

挑战与未来展望

Physical Intelligence的研究员、斯坦福大学的Lucy Shi坦言:“很难追踪知识是从哪里来的,或者它将在哪里成功或失败。”这突显了这种新兴能力带来的新挑战:可解释性和可靠性。

小结

Physical Intelligence的π0.7模型展示了机器人AI在组合泛化方面的显著进步,使其能够处理未经明确训练的任务。这标志着向更通用、更灵活的机器人“大脑”迈出了重要一步,其发展轨迹可能开始类似于大型语言模型的指数级增长。然而,这种能力的来源和边界仍然是一个需要深入研究的开放性问题。

延伸阅读

  1. AI编程初创公司Factory估值达15亿美元,专注企业级开发
  2. Luma联手Wonder Project推出AI制片工作室,首部作品聚焦摩西故事
  3. 亲测谷歌 Gemini Mac 版应用:相比网页版,它有一个巨大优势
查看原文