SheepNav
谷歌让“深度伪造”自己变得简单:Flow 新增虚拟化身功能
新上线昨天0 投票

谷歌让“深度伪造”自己变得简单:Flow 新增虚拟化身功能

谷歌于 I/O 开发者大会上宣布对其 AI 创作工具 Flow 进行重大升级,其中最引人注目的新功能是“虚拟化身”(avatars)。该功能允许用户创建自己的数字克隆,并将其无缝插入 AI 生成的视频片段中。这一更新由全新的 Omni Flash 视频生成模型驱动,旨在为创作者提供更便捷、更一致的自我融入内容的方式。

从“深度伪造”到创作工具

谷歌实验室产品管理副总裁 Elias Roman 在演示中展示了自己如何通过扫描创建数字分身,随后利用 Omni Flash 模型将“自己”放入任意 AI 视频场景中。Roman 表示:“这面向那些想将自己融入内容,但又不想实际拍摄自己的创作者。”这一功能与 OpenAI 已下架的 Sora 应用中的“自拍深度伪造”功能类似,但谷歌称之为“虚拟化身”,并强调其面向社交优先的创作场景。虚拟化身功能也将通过 Gemini 应用和 YouTube 提供。

Omni Flash:更丰富的细节与一致性

Flow 本次升级的核心是新的视频生成模型 Omni Flash,它接替了之前的 Veo 模型。类似谷歌此前通过 Nano Banana 模型增强图像生成对世界的理解,Omni Flash 在视频生成中带来了更丰富的细节。一个关键改进是角色一致性:过去版本中,AI 生成的角色在连续视频生成中容易出现变形,而 Omni Flash 大幅提升了稳定性,使角色在多个场景中保持外观一致。

面向下一代创作者的 AI 工作流

Roman 指出,谷歌此前从未为创意工作推出过专门产品线(生产力、开发者工具、视频消费是传统强项),Flow 是谷歌为新一代创作者构建工具的尝试。除了虚拟化身,Flow 还引入了多项 AI 代理(agent)和“氛围编码”(vibe coding)功能:用户可设置自定义指令以重复生成特定风格的视频,并创建自动工作流,将相似剪辑自动归类到文件夹中。这些变化与谷歌 I/O 上关于 AI 代理和自然语言编程的宏观战略一脉相承,旨在让 AI 创作工具更加普及。

行业背景与影响

谷歌此举标志着科技巨头在 AI 视频生成领域的竞争进一步白热化。此前 OpenAI 的 Sora 曾引发对“深度伪造”的讨论,但谷歌选择将类似技术包装为“虚拟化身”,并强调其作为创意工具的正面价值。通过将数字分身与 AI 视频生成结合,谷歌降低了内容创作的门槛,但同时也引发了关于身份安全、伦理滥用等潜在问题的思考。对于普通用户而言,这意味着未来生成包含自己形象的 AI 视频将像输入一段文字描述一样简单。

延伸阅读

  1. 掩码离散序列模型中成对互信息的神经估计:让AI学会“读懂”变量关系
  2. GraphDiffMed:融合药理图先验与差分注意力机制,实现更可靠的药物推荐
  3. TabPFN-MT:专为表格数据设计的原生多任务上下文学习器
查看原文