SheepNav
精选今天0 投票

PersonaDrive:用于闭环驾驶仿真的人类风格检索增强VLA智能体

概述

自动驾驶仿真中,非自车交通智能体(traffic agents)的行为模式往往单一,要么基于规则,要么通过单一行为模式训练。最近,加州大学欧文分校的研究人员提出 PersonaDrive,一种基于检索增强的视觉-语言-动作(VLA)模型,能从人类风格驾驶数据中学习,生成具有不同驾驶风格的非自车智能体,用于闭环仿真。

核心方法

PersonaDrive 包含三个阶段的流程:

  1. 离线三元组挖掘:从人类在 CARLA 仿真器上按激进、中性和保守指令驾驶的数据中,利用图像-文本相似度分数挖掘风格特定的三元组。
  2. 轻量级检索头训练:将冻结的视觉特征与小型控制编码器融合,为每种风格训练一个检索头,查询对应风格的数据库。
  3. VLA 主干微调:在单一路径预测模型中,将检索到的上下文点作为行为示例,进行上下文学习。

推理时,只需切换检索头查询的数据库,即可改变智能体的驾驶风格,无需针对每种风格重新训练。

性能表现

在 Bench2Drive 基准上,PersonaDrive(无风格条件)的驾驶分数比 SimLingo 高 4.6%,比 HiP-AD 高 2.5%。在风格条件模式下,每种风格下的驾驶分数均达到最高,且弱风格比最强基线 DMW 高 5.4%。从保守到激进指令,平均速度和加速度分别提升 18%25%

意义与影响

PersonaDrive 解决了仿真中非自车智能体行为单一的问题,通过人类风格数据实现多样化的驾驶行为,有助于更真实地测试自动驾驶系统。其无需重新训练的切换机制降低了部署成本,为闭环仿真提供了更自然的交通流。

延伸阅读

  1. Evoflux:推理时进化可执行工具工作流,让紧凑型AI智能体更可靠
  2. TrajGenAgent:分层LLM智能体实现高质量人类移动轨迹生成
  3. “你撒谎了吗?”:评估不同规模模型与信念验证模型体上的谎言检测器
查看原文