SheepNav
我用Gemini的AI化身克隆了自己,结果令人不安地像我
新上线今天0 投票

我用Gemini的AI化身克隆了自己,结果令人不安地像我

我使用Gemini应用生成了一段逼真的视频,其中包含一个数字克隆的我。Google将此视为创作的未来,而我仍然感到毛骨悚然。

初次体验:从设置到生成

一个温暖的午后,我在旧金山多洛雷斯公园为一只史前恐龙唱生日歌。当我完成小夜曲时,一个插着粉色蜡烛的纸杯蛋糕凭空出现在我空着的手中。吹灭蜡烛后,那个CGI风格的恐龙露出满足的表情。视频中的男人看起来和听起来都像我,但实际上这是使用Google Gemini应用的新功能——化身(Avatars) 生成的。这些数字再现类似于OpenAI已停用的Sora应用的核心功能。化身由Google新的Omni视频模型驱动,仅对付费订阅用户开放。我每月支付20美元订阅Google AI Pro计划,但很快就用完了使用限额(每5小时重置)。我只问了几个问题并生成了两个10秒的片段,就被提示等待。

技术细节与限制

与OpenAI允许用户决定是否允许他人使用自己肖像生成视频不同,Google只允许成年用户用自己的化身制作视频。设置过程大约需要5分钟:在光线充足的房间里,用手机摄像头对准脸部,朗读一串两位数数字,然后缓慢向右转头再向左转。完成后,我的数字克隆诞生了。需要注意设置时的着装,因为衣服很可能出现在AI生成的画面中。

质量与感受

前两个片段分别是我在旧金山为恐龙唱歌和在金门大桥下冲浪。我既印象深刻又感到不安。内容有些尴尬,存在混乱的时刻和不合逻辑的服装,但视频中的人确实是我。我放大画面观察嘴巴的动作——牙齿有点不协调,但那就是我,连双下巴都还原了。

行业背景与前景

Google将化身视为创作的未来,但这类技术也引发伦理担忧。相比OpenAI的开放态度,Google采取了更谨慎的策略,限制用户只能生成自己的化身,这在一定程度上降低了滥用风险。然而,随着AI视频生成技术日益成熟,如何在创新与隐私保护之间取得平衡仍是行业面临的重大挑战。

延伸阅读

  1. Marshall Milton ANC 耳机:独特连接功能或让我告别 Bose 和 Sony
  2. 用 Amazon Bedrock 打造 AI 招聘助手:简历解析、智能评分与面试题生成
  3. 在 Amazon Bedrock AgentCore 上用 NLP 构建 AI 驱动的仪表板自动化代理
查看原文