SheepNav
新上线10天前0 投票

谷歌发布Lyria 3 Pro音乐生成模型,支持创作长达三分钟的自定义曲目

谷歌于本周三正式发布其升级版音乐生成模型Lyria 3 Pro,这是继一个月前Lyria 3发布后的又一次重要更新。新模型将单曲生成时长从30秒大幅提升至三分钟,并显著增强了创作控制与自定义能力。

核心升级:时长与结构控制

与Lyria 3相比,Lyria 3 Pro最直观的改进在于生成长度。用户现在可以生成长达三分钟的完整音乐片段,这为创作更复杂、更具叙事性的作品提供了基础。更重要的是,模型对音乐结构的理解能力得到提升,用户可以在提示词中明确指定前奏、主歌、副歌、桥段等不同段落,实现更精细的编排控制。

多平台部署策略

谷歌正将Lyria 3 Pro快速整合到其产品生态中:

  • Gemini应用:继Lyria 3后,Pro模型也已上线,但仅限付费订阅用户使用。
  • Google Vids视频编辑应用:为视频创作者提供AI生成的背景音乐。
  • ProducerAI:谷歌上月收购的生成式AI音乐制作工具,将直接受益于新模型。
  • 企业级工具:通过Vertex AI(公开预览版)、Gemini API和AI Studio,为企业客户提供音乐生成能力。

训练数据与版权考量

谷歌强调,Lyria 3 Pro使用了合作伙伴数据以及来自YouTube和谷歌的合规数据进行训练。公司明确表示,模型不会直接模仿特定艺术家的风格。但如果用户在提示中指定某位艺术家,模型会从该艺术家的作品中汲取广泛灵感进行创作。

所有由Lyria 3和Lyria 3 Pro生成的曲目都会被打上SynthID水印,以标识其AI生成属性。这一做法恰逢音乐流媒体平台加强AI内容治理——本周早些时候,Spotify推出了新工具,允许艺术家审核以其名义发布的歌曲,防止AI内容冒名;Deezer也发布了供流媒体服务识别AI生成音乐的工具。

行业背景与意义

谷歌此次快速迭代Lyria系列,反映了AI音乐生成赛道正从“玩具级”演示向实用化、商业化加速迈进。三分钟的生成能力已接近主流流行歌曲的常见长度,结合结构化控制,使得AI辅助创作真正具备了产出完整作品的可能性。

同时,将模型嵌入Gemini付费层、企业API及视频编辑工具,显示出谷歌正试图将AI音乐能力转化为直接的产品差异化优势和收入来源。在Meta、Stability AI等公司纷纷推出音乐模型的竞争格局下,谷歌通过生态整合与时长突破,试图巩固其在该领域的领先地位。

然而,版权与艺术家权益问题仍是悬而未决的挑战。尽管谷歌采取了水印和“不模仿”策略,但“灵感汲取”的边界依然模糊。随着AI生成音乐质量提升,平台、创作者与法律界如何平衡创新与保护,将成为下一阶段的关键议题。

延伸阅读

  1. 太空数据中心能否支撑SpaceX的巨额估值?
  2. 在日本,机器人不是来抢工作的,而是填补没人愿意干的岗位
  3. 我让Google Maps里的Gemini规划我的一天,结果出乎意料地好
查看原文