
专访“随机鹦鹉”作者 Emily Bender:五年后,在 ChatGPT 时代重新审视那篇论文
五年前,华盛顿大学计算语言学家 Emily Bender 与合著者共同发表了题为《论随机鹦鹉的危险》的论文,为大型语言模型(LLM)的热潮泼下一盆冷水。如今,在 ChatGPT 席卷全球的背景下,Bender 再次接受专访,澄清“随机鹦鹉”的真正含义,并反思该论文在当下 AI 格局中的持续影响力。
核心论点:并非“鹦鹉学舌”那么简单
Bender 强调,“随机鹦鹉”这一比喻常被误解。论文的核心并非嘲讽 LLM 只是机械模仿,而是指出模型通过统计模式生成看似连贯的文本,却缺乏对意义的真实理解。这种“随机性”与“模仿”的组合,使得模型可能放大训练数据中的偏见、传播虚假信息,并带来环境成本。Bender 认为,当前许多 AI 宣传恰恰利用了公众对语言理解的错误期待,将“流畅”等同于“智能”。
五年后的回顾:担忧已成现实
回顾论文发表后的 AI 发展,Bender 指出,她与合著者当时警告的风险——如模型生成仇恨言论、加剧社会不平等、消耗大量能源——如今已广泛显现。尤其是 ChatGPT 的爆发式普及,让“随机鹦鹉”式文本生成进入了数十亿用户的日常生活,而相应的监管和伦理框架却严重滞后。Bender 呼吁业界重新审视“规模至上”的发展路径,转向更透明、更负责任的 AI 研究。
对当前 AI 热潮的批判
Bender 对当前 AI 行业的“技术解决主义”倾向表示担忧,即认为更大的模型、更多的数据就能解决一切问题。她批评部分企业刻意模糊“统计模式匹配”与“真正推理”的界限,以吸引投资和公众关注。她坚持认为,语言模型本质上是一种“文字生成器”,而非“思考机器”,将其部署在高风险场景(如医疗、法律)前必须经过严格验证。
未来展望:回归语言学的本质
作为计算语言学家,Bender 希望 AI 社区能更多借鉴语言学的基础知识,例如语义学、语用学和话语分析,而非一味追求参数规模的膨胀。她认为,只有将语言模型置于更广阔的人类交流框架中,才能设计出真正有益的工具。
小结
五年前,“随机鹦鹉”论文像一枚警钟,提醒人们警惕 LLM 的潜在危害。五年后,这枚警钟的回响比任何时候都更加响亮。Bender 的访谈不仅澄清了误解,更是一次对 AI 发展方向的深刻叩问:我们究竟需要怎样的“智能”?