精选今天0 投票
PersonaDrive:用于闭环驾驶仿真的人类风格检索增强VLA智能体
概述
自动驾驶仿真中,非自车交通智能体(traffic agents)的行为模式往往单一,要么基于规则,要么通过单一行为模式训练。最近,加州大学欧文分校的研究人员提出 PersonaDrive,一种基于检索增强的视觉-语言-动作(VLA)模型,能从人类风格驾驶数据中学习,生成具有不同驾驶风格的非自车智能体,用于闭环仿真。
核心方法
PersonaDrive 包含三个阶段的流程:
- 离线三元组挖掘:从人类在 CARLA 仿真器上按激进、中性和保守指令驾驶的数据中,利用图像-文本相似度分数挖掘风格特定的三元组。
- 轻量级检索头训练:将冻结的视觉特征与小型控制编码器融合,为每种风格训练一个检索头,查询对应风格的数据库。
- VLA 主干微调:在单一路径预测模型中,将检索到的上下文点作为行为示例,进行上下文学习。
推理时,只需切换检索头查询的数据库,即可改变智能体的驾驶风格,无需针对每种风格重新训练。
性能表现
在 Bench2Drive 基准上,PersonaDrive(无风格条件)的驾驶分数比 SimLingo 高 4.6%,比 HiP-AD 高 2.5%。在风格条件模式下,每种风格下的驾驶分数均达到最高,且弱风格比最强基线 DMW 高 5.4%。从保守到激进指令,平均速度和加速度分别提升 18% 和 25%。
意义与影响
PersonaDrive 解决了仿真中非自车智能体行为单一的问题,通过人类风格数据实现多样化的驾驶行为,有助于更真实地测试自动驾驶系统。其无需重新训练的切换机制降低了部署成本,为闭环仿真提供了更自然的交通流。