SheepNav
新上线今天0 投票

《大西洋月刊》创建可搜索数据库,曝光用于训练AI的数千万首音乐

数据库揭示AI音乐训练的“灰色地带”

近日,《大西洋月刊》记者Alex Reisner曝光了四个用于训练AI模型的音乐数据集,并将其整合为可公开搜索的数据库。这一发现再次引发业界对AI训练数据版权问题的关注。

数据集规模惊人

这四个数据集中,两个大型数据集分别包含1200万和900万首曲目,另外两个较小的也各有超过10万首歌曲。据Reisner调查,这些数据集已被下载数千次,谷歌和Stability AI均在研究论文中确认使用过它们。

数据来源与版权隐患

部分数据集来自免费音乐档案馆(Free Music Archive),其个人使用免费,但商业应用需授权。然而,更棘手的是:三个数据集以YouTube或Spotify链接列表形式分发,AI开发者通过自动化工具绕过登录、广告及创作者收益机制直接下载音频。Reisner指出,这类工具违反了平台服务条款。

涉及艺术家范围广泛

数据库中出现的名字从流行巨星Lady Gaga、Fred Again..,到Radiohead、Aphex Twin、Wu-Tang Clan、Bruce Springsteen,再到实验音乐人Hainbach,涵盖主流与独立音乐人。

行业影响与后续行动

该数据库已上线《大西洋月刊》的“AI Watchdog”站点,公众可搜索被用于训练AI的歌曲、书籍及其他媒体。此事件再次凸显AI训练数据使用的法律与道德争议,尤其是在音乐行业——此前Suno等AI音乐生成公司已获4亿美元投资,但版权纠纷持续不断。

Reisner的工作为版权持有者提供了追索依据,也为监管机构提供了重要参考。随着AI音乐生成技术的商业化加速,如何平衡技术创新与创作者权益,将成为未来数年的核心议题。

延伸阅读

  1. Signal 总裁 Meredith Whittaker 警告:AI 聊天机器人“不是你的朋友”
  2. In the Weights:你的AI版“自我搜索”新玩具
  3. 诺贝尔奖得主 John Jumper 离开 DeepMind,加盟竞争对手 Anthropic
查看原文