AI智能体不应只是询问偏好,更应帮助用户构建偏好
传统AI助手通常假设用户是“专家用户”——即用户对自己的需求有明确、完整的偏好,因此当任务描述不清晰时,系统只会反复追问细节。但这一假设在现实中往往不成立:用户可能缺乏必要的领域知识,无法直接回答“你喜欢什么”之类的问题。近日,一篇来自arXiv的论文《Beyond expert users: agents should help users construct preferences, not just elicit them》对此提出了系统性批判,并提出了新框架CoPref(偏好构建模型)与配套评测基准CoShop。
从信息经济学出发:偏好并非天然存在
研究团队借鉴信息经济学中的“搜索-体验-信任”(Search-Experience-Credence)框架,认为用户偏好的形成是一个动态过程,而非静态信息。例如,当用户想买一台相机时,可能并不了解“光圈大小”或“传感器类型”意味着什么。此时,智能体不应直接问“你偏好大光圈吗?”,而应先通过示例或解释帮助用户理解这些概念,让用户学会如何形成偏好。
为此,论文提出了 CoPref模型,将用户偏好构建过程形式化为智能体对话动作与用户知识增长的交互。模型的核心思想是:智能体的角色不仅是“提取”用户已有的偏好,更应是“辅导”用户探索和构建新的偏好。
CoShop基准测试:前沿模型表现不佳
为了验证这一理念,团队设计了一个交互式推荐基准 CoShop。在该场景中,智能体需要与一个由CoPref模型驱动的虚拟用户对话,并最终推荐合适的商品。智能体的表现取决于它能否帮助用户获得必要的领域知识,从而明确任务需求。
测试了包括GPT-4o、Claude等在内的五个前沿模型后,结果显示:即便经过五轮对话,所有智能体的准确率均未超过56%。更关键的是,失败原因并非智能体“找不到商品”,而是对话几乎未能扩展用户对自身需求的理解。换言之,智能体只是在被动回应,而非主动引导用户学习。
对AI产品设计的启示
这项研究直指当前对话式AI与推荐系统的核心短板:过度依赖“显式偏好”假设。现实中的用户,尤其是在陌生领域,往往处于“我不知道我需要什么”的状态。未来的智能体需要从“问答机”转变为“学习导师”——通过解释、对比、举例等方式,帮助用户逐步构建偏好。
这一转变对电商、教育、医疗等领域的AI助手设计具有直接指导意义。例如,一个医疗咨询智能体不应直接问“你更喜欢哪种治疗方案?”,而应先用通俗语言解释不同方案的利弊,让用户具备做出知情决策的基础知识。
小结
CoPref与CoShop的提出,标志着AI研究从“偏好提取”向“偏好构建”的重要转向。虽然当前模型表现不佳,但这一方向为下一代交互式AI提供了清晰的理论框架和评测工具。对于AI从业者而言,理解并应用“偏好构建”理念,或许正是突破推荐系统与对话助手瓶颈的关键。