SheepNav
新上线昨天0 投票

Google Genie 世界模型接入街景,现实模拟触手可及

Google DeepMind 在 Google I/O 大会上宣布,将 街景(Street View) 数据整合到 Project Genie 中,打造沉浸式、可交互的世界模拟器。用户不仅可以在熟悉的街道上漫步,还能调整天气、模拟罕见事件,为机器人训练、游戏开发、旅行规划等场景提供前所未有的真实感。

从街景到“世界模拟器”

Project Genie 是 Google 的通用世界模型,能够生成多样、交互的环境。过去,它通过文本或图像提示创建游戏世界;如今,结合 20 年来积累的 2800 亿张街景图像(覆盖 110 个国家),Genie 可以精确模拟现实街道的细节。DeepMind 研究员 Jack Parker-Holder 举例:一台即将在伦敦部署的机器人,很少见到阳光。Genie 可以模拟维多利亚式建筑上罕见的阳光反射,让机器人提前适应,避免被强光“惊吓”。

场景:从旅行到灾难模拟

对于普通人,Genie 的街景模拟意味着更丰富的探索体验。你可以“走进”纽约的某个街区,将其切换为雪景,看看冬日的模样;或者模拟“后天”式的极端天气,感受环境变化。这种能力不仅用于娱乐,更在 机器人训练自动驾驶 中发挥关键作用。Genie 3 此前已为 Waymo 提供模拟器,训练自动驾驶汽车应对“极罕见事件”,如龙卷风或偶遇大象。接入街景后,Waymo 可以针对更多城市的地理特征进行定制化训练。

技术融合:现实与模拟的边界模糊

Google 将街景这一“真实世界的数据宝库”与 Genie 的生成能力结合,标志着世界模型从“虚构场景”迈向“现实镜像”。这不仅降低了机器人部署的成本(减少真实环境测试风险),也让用户能以前所未有的方式“预演”旅行或探索。不过,目前该功能仍处于研究预览阶段,仅面向部分 AI Ultra 订阅用户开放。未来,随着数据集的扩大和模型优化,我们或许很快就能在自己的手机上“穿越”到任何一条街,体验任意天气与事件。

小结

Genie + Street View 的组合,让世界模型不再是科幻概念,而是触手可及的工具。无论是为机器人“预习”伦敦的阳光,还是为旅行者“预览”雪中的巴黎,这项技术都在重新定义我们与数字世界的互动方式。

延伸阅读

  1. 掩码离散序列模型中成对互信息的神经估计:让AI学会“读懂”变量关系
  2. GraphDiffMed:融合药理图先验与差分注意力机制,实现更可靠的药物推荐
  3. TabPFN-MT:专为表格数据设计的原生多任务上下文学习器
查看原文