NAVSIM数据集---Data-Driven Non-Reactive Autonomous Vehicle Simulation and Benchmarking

Non-Reactive仿真是一种基于真实数据的自动驾驶算法评估方法，其核心特点是在仿真过程中，环境中的其他车辆和行人不会对自动驾驶车辆（AV）的决策做出反应。这种仿真方法通过短期固定规划（如4秒）来评估AV的行驶轨迹，并在简化的鸟瞰图视角下进行。评估指标PDMS（Planning Decision Making Score）由惩罚项和加权平均项组成，其中惩罚项（如无碰撞NC和可行驶区域合规性DA

早睡早起吧

2310人浏览 · 2025-05-10 20:55:17

早睡早起吧 · 2025-05-10 20:55:17 发布

文章目录

Non-Reactive如何理解？

1、基于真实数据：算法的输入仍然是真实世界采集的传感器数据（比如某一时刻的摄像头图像、雷达点云）。

2、短期固定规划：算法根据这一刻的输入，规划出未来一小段时间（比如4秒）的行驶轨迹。

3、环境“不理你”：在这4秒的仿真里，环境中的其他车辆、行人等，会完全按照它们在原始数据记录中的方式运动，就好像你的车不存在，或者你的车没有做出任何新的规划一样。它们不会因为你的算法规划了变道而减速，也不会因为你的算法规划了刹车而从你旁边超过去。你的算法的决策不会影响环境中其他物体的行为。

4、鸟瞰图抽象：仿真在一个简化的鸟瞰图（Bird’s Eye View, BEV）视角下进行。

指标

简单来说，就是：

PDMS = (所有惩罚项分数的乘积) × (多个目标项的加权平均分) 【惩罚项至关重要】

如果任何一个“惩罚项”的得分很低（尤其是0），那么总的PDMS就会变得很低（甚至是0），无论“加权平均项”里的其他表现有多好。这体现了安全是驾驶的首要前提。

Penalties（惩罚项）

绝对不能违反的硬性规则（比如安全和基本合规性）。这些项是相乘的，一旦某一项为0，整个PDMS就为0

NC (No Collision - 无碰撞)：评价AV是否与其他交通参与者或物体发生碰撞。

1、score_NC = 0: 如果AV与道路使用者（如其他车辆、行人、自行车）发生碰撞。

案例1（与车辆碰撞）： AV计划变道，但在其4秒的模拟轨迹中，它在第2.5秒时与侧方车道正常行驶的另一辆车（该车在NAVSIM中按其原始记录轨迹行驶，不理会AV）发生了重叠。此时 score_NC = 0，导致该场景的 PDMS 直接为 0。
案例2（与行人碰撞）： AV计划右转通过人行横道，但其模拟轨迹在第3秒时撞到了一个正在按原始记录过马路的行人。此时 score_NC = 0，PDMS 为 0。

2、score_NC = 0.5: 如果AV与静态物体（如路边的树、电线杆、停放的车辆）发生碰撞。这被认为是一个较轻的惩罚

案例3（与静态物体碰撞）： AV在路边停车，规划的轨迹过于贴近路肩，其模拟车身在第2秒时剐蹭到了一个消防栓。此时 score_NC = 0.5。如果其他惩罚项都是1，那么最终PDMS至少会减半。

3、score_NC = 1: 在4秒的模拟规划中，没有发生任何碰撞。

特殊情况：论文提到会忽略某些不被认为是AV“过错”的碰撞，例如AV完全静止时被追尾（尽管在非反应式仿真中，其他车辆也是按固定轨迹行驶，这种情况可能较少或有特定定义）。

DAC (Drivable Area Compliance - 可行驶区域合规性)：评价AV是否一直保持在规定的可行驶区域内。

1、score_DAC = 0: 如果AV的模拟轨迹有任何部分驶出了可行驶区域（例如，开上了人行道、中央隔离带、逆行车道等）。

案例1（驶出路面）： AV在转弯时速度过快或路径规划不当，其模拟轨迹显示车辆在第2秒时冲上了路肩或人行道。此时 score_DAC = 0，导致该场景的 PDMS 直接为 0。
案例2（严重违规变道）： AV为了超车，规划的轨迹长时间压实线行驶或进入了禁止驶入的区域。此时 score_DAC = 0，PDMS 为 0。

2、score_DAC = 1: AV在4秒的模拟规划中，完全保持在合法的可行驶区域内。

Weighted Average (加权平均项)

EP (Ego Progress - 自车进展)：衡量AV沿着规划路线有效前进的程度。

权重 weight_EP = 5。
得分 score_EP 是AV实际进展与一个“安全进展上限”（由一个名为PDM-Closed的基于规则的规划器估算得出，代表在该场景下安全、合理的最大进展）的比值，结果会被限制在[0, 1]之间。如果这个上限太低（比如小于5米），这个分数可能不作考虑。

案例1（进展良好）：AV的任务是直行通过一段30米长的路。PDM-Closed估算出在此4秒内，安全进展上限是25米。AV规划的轨迹实际前进了22米。那么score_EP = 22 / 25 = 0.88。
案例2（进展不足）：同样是直行30米的任务，安全进展上限25米。但AV规划得非常保守，只前进了5米。那么 score_EP = 5 / 25 = 0.2。
案例3（无法进展/进展为负）：如果AV规划倒车或原地不动，而任务是前进，那么EP得分会很低或为0。

TTC (Time-to-Collision - 碰撞时间)：确保AV与其他车辆保持足够的安全距离，通常是向前车。

权重 weight_TTC = 5。
score_TTC 默认值为1（表示安全）。如果在4秒模拟的任何时间点，AV以当前速度和方向匀速前进，会在一个设定的时间阈值（例如2秒或3秒）内与前车或其他相关车辆发生碰撞，那么 score_TTC 就会被设为0。

案例1（保持安全TTC）： AV在4秒的规划中，始终与前车保持着，若按当前状态行驶，则至少需要4秒才会追尾的距离。这个TTC大于安全阈值（比如阈值是2.5秒）。那么 score_TTC = 1。
案例2（TTC过低）：AV规划跟车行驶，在第3秒时，如果它和前车都保持当前速度，它将在1.5秒后撞上前车。这个1.5秒低于安全阈值（比如2.5秒）。那么 score_TTC = 0。这个0分会严重拉低加权平均分的总分。

时刻 t = 1.5秒 (AV规划的第1.5秒)：
AV瞬时速度: 40 km/h (直线向前)
前车瞬时速度: 35 km/h (直线向前)
两车当前距离: 8米
TTC计算：AV比前车快5km/h (约1.39m/s)。要追上8米的距离需要 8 / 1.39 ≈ 5.75秒。
比较： 5.75秒 > 2.5秒。此瞬间TTC通过。 score_TTC 仍为 1。

时刻 t = 2.8秒 (AV规划的第2.8秒)：
AV瞬时速度: 50 km/h (直线向前) (AV可能计划继续加速或保持此速度)
前车瞬时速度: 40 km/h (直线向前) (前车在原始数据中可能此时减速了，或者AV靠得太近了)
两车当前距离: 6米 TTC
计算： AV比前车快10km/h (约2.78m/s)。要追上6米的距离需要 6 / 2.78 ≈ 2.16秒。
比较： 2.16秒 < 2.5秒 (安全阈值)！此瞬间TTC违规！
score_TTC 的最终结果：因为在 t = 2.8秒这个时刻检测到了TTC违规，所以不管其他时刻TTC是否安全，最终这个4秒规划的 score_TTC 直接被设定为 0。

C (Comfort - 舒适度)：评价AV规划轨迹的平顺性，主要看加速度和加加速度（jerk，即加速度的变化率）是否在舒适范围内。

权重 weight_C = 2。
score_C 是根据AV轨迹的加速度和jerk与预设舒适阈值比较得出的，通常在[0, 1]之间。越平稳，得分越高。

案例1（舒适）： AV规划的加速、减速和转向都非常平缓，最大加速度没有超过2.0 m/s²，最大jerk没有超过2.5m/s³。score_C 可能会得到 0.9 或更高。
案例2（不舒适）： AV规划了一个急刹车（比如加速度达到 -4.0 m/s²）或者一个非常突兀的转向（导致很大的侧向加速度或jerk）。score_C 可能会很低，比如 0.3。

实验

在这里插入图片描述
原始的自动驾驶数据集（如OpenScene）包含大量简单、无挑战性的场景（如静止、匀速直线行驶），这些场景无法有效评估高级自动驾驶算法的性能，因为简单的基线模型在这些场景下也能获得不错的评分。

图2(a) 直观展示了筛选后，简单基线模型的性能大幅下降，而人类驾驶员的性能略有提升，两者差距显著拉大，证明了筛选后数据集的挑战性显著提高。

图2(b)和 (c ) 展示了筛选后数据集在场景类型上的变化：减少了静止和单调的直线行驶场景，增加了转弯、变道等更复杂、更多样性的横向和纵向驾驶行为的比例。

在这里插入图片描述

1、自车状态信息的重要性：速度和加速度等信息对模型有益，但模型并非完全依赖它们，传感器数据起着关键作用。

2、传感器配置的权衡：摄像头：适度的广角视野（如3摄像头约140°-160°）优于单前视窄角摄像头，但盲目增加摄像头数量和视野，收益有限。

3、LiDAR：存在一个最佳的探测范围（默认的32米表现不错）。范围过小（16米）甚至不如不用LiDAR；范围过大（64米）也无益或有害，这可能与辅助任务的有效性有关。

4、辅助任务的价值：鸟瞰图语义分割对提升模型性能有积极作用，而3D物体检测在当前实验设置下的贡献不明显。

缺点

1、高PDMS得分不完全等同于高CLS得分 (缺乏真实反应性和误差累积考量)

NAVSIM 的 PDMS是通过一种“非反应式”开环仿真计算的，这意味着环境中的其他交通参与者不会对被测AV（自动驾驶车辆）的规划做出反应。同时，它评估的是一次性的短期规划，没有考虑在连续的闭环驾驶中，微小误差可能随时间累积并放大的效应。

2、PDMS继承了nuPlan CLS的某些固有缺陷

3、未考虑所有交通规则和效率指标

案例1 (交通规则-停止标志)： AV 接近一个停止标志（Stop Sign）。如果路口没有其他车辆，AV 可能规划了一个缓慢通过但不完全停稳的动作。只要这个动作没有导致碰撞、没有开出路面、TTC也安全，PDMS分数可能依然不错。但实际上，AV 违反了“停止标志前必须完全停止”的交通规则。NAVSIM 当前的评分体系可能不会直接惩罚这种违规。
案例2 (交通规则-红灯)：类似地，如果AV在一个没有其他车辆的红灯路口直接通过，只要没发生直接的危险（碰撞等），PDMS 可能不会充分反映这个闯红灯的严重违规行为。

4、“非过错方”追尾定义导致后向感知重要性降低

在 NAVSIM（以及 nuPlan CLS）当前的碰撞责任判定中，如果自车被后方车辆追尾，通常不被认为是自车的“过错”（at-fault）。
这就导致了车辆后方感知（比如后视摄像头、后向雷达）以及避免被追尾的驾驶策略（比如平稳减速、提前观察后方来车）在NAVSIM的评分体系中的重要性被削弱了。因为即使发生了这类追尾，如果自车不被判责，PDMS分数也不会因此大幅降低。

鉴于 NAVSIM 的这些局限性（尤其是其非反应式特性），作者强烈建议研究者在开发规划算法时，同时使用像 CARLA 这样的基于图形的闭环模拟器作为 NAVSIM 的补充基准测试工具。