PersonaDrive：人类风格检索增强VLA智能体用于闭环驾驶仿真

概述

自动驾驶仿真中，非自车交通智能体（traffic agents）的行为模式往往单一，要么基于规则，要么通过单一行为模式训练。最近，加州大学欧文分校的研究人员提出 PersonaDrive，一种基于检索增强的视觉-语言-动作（VLA）模型，能从人类风格驾驶数据中学习，生成具有不同驾驶风格的非自车智能体，用于闭环仿真。

核心方法

PersonaDrive 包含三个阶段的流程：

离线三元组挖掘：从人类在 CARLA 仿真器上按激进、中性和保守指令驾驶的数据中，利用图像-文本相似度分数挖掘风格特定的三元组。
轻量级检索头训练：将冻结的视觉特征与小型控制编码器融合，为每种风格训练一个检索头，查询对应风格的数据库。
VLA 主干微调：在单一路径预测模型中，将检索到的上下文点作为行为示例，进行上下文学习。

推理时，只需切换检索头查询的数据库，即可改变智能体的驾驶风格，无需针对每种风格重新训练。

性能表现

在 Bench2Drive 基准上，PersonaDrive（无风格条件）的驾驶分数比 SimLingo 高 4.6%，比 HiP-AD 高 2.5%。在风格条件模式下，每种风格下的驾驶分数均达到最高，且弱风格比最强基线 DMW 高 5.4%。从保守到激进指令，平均速度和加速度分别提升 18% 和 25%。

意义与影响

PersonaDrive 解决了仿真中非自车智能体行为单一的问题，通过人类风格数据实现多样化的驾驶行为，有助于更真实地测试自动驾驶系统。其无需重新训练的切换机制降低了部署成本，为闭环仿真提供了更自然的交通流。

PersonaDrive：用于闭环驾驶仿真的人类风格检索增强VLA智能体

概述

核心方法

性能表现

意义与影响

延伸阅读

相关资讯