精选今天0 投票
从用户行为日志中分层诱导多 persona:学习有证据支撑且真实可信的用户画像
用户行为日志蕴含丰富的建模信号,但通常充满噪声且意图交织。现有方法虽能借助大语言模型生成可解释的自然语言 persona,却往往侧重下游任务效用,对 persona 本身质量的评估不足。针对这一问题,arXiv 上最新发表的论文《Hierarchical Multi-Persona Induction from User Behavioral Logs》提出了一种分层框架,通过聚合用户行为形成意图记忆,再经聚类和标注诱导出多个有证据支撑的 persona。研究者将 persona 诱导形式化为一个优化问题,目标函数涵盖聚类紧密度、persona-证据对齐度和 persona 真实性,并采用群体扩展的直接偏好优化(DPO) 来训练模型。在大规模服务日志和两个公开数据集上的实验表明,该方法生成的 persona 更加连贯、有据可查且值得信赖,同时还能提升对未来交互的预测性能。这一工作为构建更可靠、可解释的用户模型提供了新思路。