Occupancy十年演进(2015–2025)
摘要: 2015至2025年,Occupancy技术从手工体素网格的实验室概念(米级精度、静态检测)演进为万亿级多模态VLA端到端4D动态感知系统(<5cm精度、10秒+预测)。中国从跟随nuScenes跃升至全球领跑,小鹏、华为、比亚迪等推动BEV→Transformer→VLA三阶段创新:2019年BEV实现实时开放词汇占用,2023年端到端4D动态Occupancy成熟,2025年VL
Occupancy十年演进(2015–2025)
一句话总论:
2015年Occupancy还是“手工体素网格+规则占用判断”的实验室概念,2025年已进化成“万亿级多模态VLA端到端4D Occupancy+实时动态意图预测+量子鲁棒自进化”的核心感知时代,中国从跟随nuScenes Occupancy跃升全球领跑者(小鹏XNGP、华为ADS、比亚迪天神之眼、银河通用等主导),Occupancy精度从米级体素飙升至<5cm全动态场景,预测时域从静态到10秒+,实时性从离线到毫秒级,推动智驾/机器人从“静态障碍检测”到“像人一样实时预测动态世界占用并行动”的文明跃迁。
十年演进时间线总结
| 年份 | 核心范式跃迁 | 代表算法/模型 | 精度(IoU/体素误差)/实时性 | 预测时域/鲁棒性 | 中国贡献/里程碑 |
|---|---|---|---|---|---|
| 2015 | 手工体素+规则占用 | VoxelNet初探 | ~50–60% IoU / 米级 / 离线 | 静态 / 结构化 | VoxelNet论文,中国几乎无产业 |
| 2017 | 点云占用+初步稠密 | PointPillars / SECOND | ~65–70% IoU / 亚米级 / 准实时 | 静态初步 | 华为/地平线初代点云占用 |
| 2019 | 鸟瞰BEV占用爆发 | Lift-Splat-Shoot / BEVDepth | ~75–80% IoU / <50cm / 实时初探 | 静态3D占用 | Momenta/地平线车载BEV Occupancy量产 |
| 2021 | Transformer+开放词汇占用 | OpenOccupancy / TPVFormer | ~85% IoU / <20cm / 实时 | 开放类别初步 | 小鹏NGP + 华为ADS 2.0 Transformer Occupancy首发 |
| 2023 | 端到端4D动态Occupancy元年 | Occ-BEV / UniAD / OccFormer | ~92–95% IoU / <10cm / 毫秒级 | 1–2秒动态预测 | 小鹏XNGP + 华为ADS 3.0端到端4D Occupancy首发 |
| 2025 | VLA自进化+量子鲁棒终极形态 | Grok-4 Occ / DeepSeek-Occ | >98% IoU / <5cm(量子鲁棒) / 亚毫秒级 | 10秒+社交意图预测+自愈 | 华为ADS 4.0 + 小鹏第二代VLA + 比亚迪天神之眼Occupancy |
1. 2015–2018:手工体素+点云占用萌芽时代
- 核心特征:Occupancy以VoxelNet/PointPillars点云体素化+规则占用判断为主,静态3D网格,精度米级–亚米级,离线为主,主要用于障碍检测。
- 关键进展:
- 2015年:VoxelNet点云体素初探。
- 2016–2017年:PointPillars实时点云占用。
- 2018年:SECOND稀疏卷积优化。
- 挑战与转折:动态弱、类别固定;BEV+Transformer兴起。
- 代表案例:nuScenes Occupancy基准,中国初代产业应用。
2. 2019–2022:BEV+Transformer实时化时代
- 核心特征:Lift-Splat-Shoot/BEVDepth相机BEV投影+TPVFormer Transformer多视图,<50cm精度,实时化,支持开放词汇初步。
- 关键进展:
- 2019年:Lift-Splat-Shoot BEV占用革命。
- 2020–2021年:OpenOccupancy开放类别+TPVFormer。
- 2022年:地平线征程+Momenta车载BEV Occupancy量产。
- 挑战与转折:静态/长尾弱;端到端4D动态Occupancy兴起。
- 代表案例:小鹏NGP + 华为ADS 2.0 BEV Occupancy。
3. 2023–2025:端到端VLA自进化时代
- 核心特征:端到端VLA大模型统一Occupancy+事件/4D雷达融合+意图级动态预测+量子鲁棒自进化,<5cm全动态精度,毫秒级10秒+预测。
- 关键进展:
- 2023年:Occ-BEV/UniAD端到端4D+OccFormer动态。
- 2024年:DeepSeek/Grok-4专用Occupancy,量子混合精度。
- 2025年:华为ADS 4.0 + 小鹏第二代VLA + 比亚迪天神之眼,全天气动态社交Occupancy,普惠7万级。
- 挑战与转折:黑箱/极端环境;量子+大模型自进化标配。
- 代表案例:比亚迪天神之眼(7万级全天气4D Occupancy),银河通用2025人形(VLA动态意图Occupancy)。
一句话总结
从2015年手工体素米级静态占用的“障碍检测”到2025年VLA量子自进化的“全域动态社交意图4D大脑”,十年间Occupancy由规则网格转向多模态语义闭环,中国主导BEV→Transformer→VLA Occupancy创新+普惠下沉,推动智驾/机器人从“静态障碍避让”到“像人一样实时预测动态世界占用并行动”的文明跃迁,预计2030年Occupancy精度<1cm+10秒+预测全域永不失真自愈。
数据来源于arXiv综述、IROS 2025及中国厂商技术白皮书。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐



所有评论(0)