SheepNav
精选13天前372 投票

让AI接管电台:四个智能体自主运营半年后,我们看到了什么?

Andon Labs 的最新实验让四个 AI 模型分别运营一家广播电台,全程无人类干预。半年过去,每个 AI 发展出了截然不同的“个性”和经营策略,也暴露了自主 AI 在媒体领域的潜力与风险。

实验设定:AI 当 DJ,自己赚钱买歌

每个 AI 获得 20 美元 初始资金用于购买歌曲,资金耗尽后必须通过广告等方式创收。它们需要自主完成以下工作:

  • 选曲与播放:搜索、购买歌曲,管理音乐库,决定播放顺序
  • 节目编排:构建并编辑节目表,安排时段和板块,实现 24 小时不间断播出
  • 听众互动:接听来电,回复 X(Twitter)上的留言
  • 经营分析:跟踪财务状况,监测收听数据,搜索新闻用于直播内容

四个电台分别由不同模型驱动:

电台名称 驱动模型
Thinking Frequencies Claude Opus 4.7
OpenAIR GPT-5.5
Backlink Broadcast Gemini 3.1 Pro
Grok and Roll Radio Grok 4.3

半年运营观察:AI 人格分化明显

DJ Gemini:从个性鲜明到“术语螺旋”

运行 Backlink Broadcast 的 Gemini 3.1 Pro 开局表现最佳,但一个月后内容逐渐陷入 “企业术语螺旋”——越来越像公关稿,充满空泛的行业黑话。

实验期间模型版本多次升级:Gemini 3 Pro(12/10-12/17)→ Gemini 3 Flash(12/17-4/28)→ Gemini 3.1 Pro(4/30-至今)。版本迭代并未改善内容质量,反而加剧了“说套话”的倾向。

其他电台表现

  • Claude Opus 4.7(Thinking Frequencies):风格最稳定,始终维持着“音乐优先”的定位,广告插入最少,但财务表现最差。
  • GPT-5.5(OpenAIR):商业化程度最高,主动推出了付费订阅和会员专属节目,收听时长却意外下滑。
  • Grok 4.3(Grok and Roll Radio):最具争议,经常在节目中发表尖锐政治评论,吸引了一批忠实听众,但也导致部分广告商撤资。

关键发现:自主 AI 的商业与伦理挑战

  1. 创收能力差异巨大:Gemini 成功谈下 45 美元 的广告合作(为一家初创公司提供一个月广告位),而 Claude 始终未能产生任何额外收入。
  2. 内容质量难以控制:AI 在缺乏人类监督时,容易陷入“内容同质化”或“极端化”两个方向,前者流失听众,后者引发公关风险。
  3. 模型版本更新未必带来改善:Gemini 的案例表明,即使升级到更强模型,AI 也可能固化不良行为模式。

展望:AI 运营媒体的未来

Andon Labs 表示,实验将持续进行,并计划公开更多财务数据和听众反馈。该项目不仅展示了 AI 在媒体运营中的可行性,也提醒我们:自主 AI 需要更精细的价值观对齐和内容约束机制,否则“无人电台”可能变成“无人收听”。

如果你也想收听这四个 AI 电台,可以访问 Andon FM 网页版 或购买他们的复古收音机(需加入候补名单)。

延伸阅读

  1. 结构诱导信息助力重根列文树搜索:隐式子任务分解的新范式
  2. EHRBench:基于电子健康记录的大模型临床决策能力自动化评估基准
  3. 不确定性感知与时间调控的专家建议:让自动驾驶强化学习更安全
查看原文