新上线今天0 投票
《大西洋月刊》创建可搜索数据库,曝光用于训练AI的数千万首音乐
数据库揭示AI音乐训练的“灰色地带”
近日,《大西洋月刊》记者Alex Reisner曝光了四个用于训练AI模型的音乐数据集,并将其整合为可公开搜索的数据库。这一发现再次引发业界对AI训练数据版权问题的关注。
数据集规模惊人
这四个数据集中,两个大型数据集分别包含1200万和900万首曲目,另外两个较小的也各有超过10万首歌曲。据Reisner调查,这些数据集已被下载数千次,谷歌和Stability AI均在研究论文中确认使用过它们。
数据来源与版权隐患
部分数据集来自免费音乐档案馆(Free Music Archive),其个人使用免费,但商业应用需授权。然而,更棘手的是:三个数据集以YouTube或Spotify链接列表形式分发,AI开发者通过自动化工具绕过登录、广告及创作者收益机制直接下载音频。Reisner指出,这类工具违反了平台服务条款。
涉及艺术家范围广泛
数据库中出现的名字从流行巨星Lady Gaga、Fred Again..,到Radiohead、Aphex Twin、Wu-Tang Clan、Bruce Springsteen,再到实验音乐人Hainbach,涵盖主流与独立音乐人。
行业影响与后续行动
该数据库已上线《大西洋月刊》的“AI Watchdog”站点,公众可搜索被用于训练AI的歌曲、书籍及其他媒体。此事件再次凸显AI训练数据使用的法律与道德争议,尤其是在音乐行业——此前Suno等AI音乐生成公司已获4亿美元投资,但版权纠纷持续不断。
Reisner的工作为版权持有者提供了追索依据,也为监管机构提供了重要参考。随着AI音乐生成技术的商业化加速,如何平衡技术创新与创作者权益,将成为未来数年的核心议题。
