精选今天0 投票

聊天机器人如何工作？大语言模型证实了“创新幻觉”

一篇来自 arXiv 的新论文对聊天机器人作为问题解决对话伙伴的能力提出了深刻质疑。作者 S.F.M. van Vlijmen 和 H.D. Lethe jr 综合运用聚合动力学、认知语言学、神经心理学和心理学等多学科视角，试图解释聊天机器人能做什么、不能做什么，以及背后的原因。

核心论点：聊天机器人不是真正的思考伙伴

论文聚焦于基础聊天机器人（由大语言模型加简单界面构成），认为这类系统无法成为与人类匹敌的思考伙伴。作者提出，人类的理解和思考基于“隐喻性问题传播”，而训练 LLM 的文本数据集仅能部分模仿这种过程。LLM 训练将人工的隐喻性问题传播编码到模型中，但本质上无法复现人类真正的认知能力。

关键假设与结论

数据集局限性：用于训练 LLM 的文本具有特定特征，只能部分模拟人类思维和理解。
编码过程：训练过程将人工的“隐喻性问题传播”编码进模型，但这是对真实认知的简化模仿。
根本限制：基础聊天机器人无法成为真正的思考伙伴，即使进一步发展 LLM 也无法突破这一局限。

作者引用了 Yann LeCun 的观点：动物和人类的学习与理解能力远超当前 AI/ML 系统。他们的结论与 LeCun 的愿景一致，而与大型科技公司的乐观态度形成对比。

社会意义与讨论价值

尽管存在根本性局限，聊天机器人已被个人和组织大规模使用。因此，理解其功能、益处和弊端具有重要的社会和政治意义。这篇论文旨在为相关讨论提供新的视角，其跨学科的研究方法在现有文献中尚未被广泛采用。

论文共 42 页，包含 3 张图，已提交至 Transmathematic 期刊。它提醒我们：面对 AI 热潮，需要保持清醒，认清技术能力的边界。

延伸阅读

相关资讯

Anthropic 发布 Claude Fable 5：史上最强通用模型，安全限制下 5% 会话触发降级

今日下载：全身返老还童药物与AI必知五件事

Nextdoor 工程师如何借助 Codex 突破开发极限

人机混合企业中的领导力：如何驾驭AI代理浪潮