SLAM建图算法十年演进(2015–2025)
摘要: 2015-2025年SLAM建图技术实现跨越式发展:从早期基于特征点滤波的米级离线地图(如ORB-SLAM),演进至2025年多模态VLA大模型驱动的动态语义密图(精度<1cm)。中国从技术跟随者成长为全球领跑者,小米、华为等企业推动技术迭代,实现建图精度、实时性与动态场景适应性的革命性突破。关键技术跃迁包括:2017年视觉-惯导紧耦合(VINS-Mono)、2021年BEV多传感器
·
SLAM建图算法十年演进(2015–2025)
一句话总论:
2015年SLAM建图还是“特征点+滤波器/BA优化+米级离线地图”的规则时代,2025年已进化成“多模态VLA大模型+神经辐射场动态重建+量子鲁棒自进化+实时语义密图”的具身智能建图核心,中国从跟随ORB-SLAM跃升全球领跑者(小米、华为、银河通用、宇树等主导),建图精度从米级飙升至<1cm全动态场景,鲜度从离线到秒级自愈,推动智驾/机器人从“静态定位导航”到“实时理解动态世界”的文明跃迁。
十年演进时间线总结
| 年份 | 核心范式跃迁 | 代表算法/模型 | 精度/鲁棒性 | 地图类型/实时性 | 中国贡献/里程碑 |
|---|---|---|---|---|---|
| 2015 | 特征点+滤波/BA优化 | ORB-SLAM1 + EK F | 米级 / 结构化晴天 | 稀疏特征点 / 离线 | 百度Apollo初代ORB,中国跟进 |
| 2017 | 视觉-惯导紧耦合+回环检测 | VINS-Mono + OKVIS | 亚米–厘米级 / 室内外初步 | 稀疏+关键帧 / 准实时 | 香港科大VINS-Mono,中国产业初探 |
| 2019 | 直接法+半直接法+动态物体去除 | DSO / LDSO + Semantic KITTI | 分米级 / 动态初步 | 半稠密点云 / 实时 | 小米/华为视觉SLAM量产,动态物体分割初探 |
| 2021 | BEV+多传感器融合+稠密重建 | LIO-SAM + Kimera | <10cm / 雨雾改善 | 稠密点云+语义 / 实时 | 小鹏NGP BEV SLAM + 华为ADS 2.0融合 |
| 2023 | NeRF/Gaussian动态重建+VLA初探 | NICE-SLAM + Gaussian Splatting | <5cm / 动态全场景 | 神经辐射场密图 / 实时 | 小鹏XNGP + 银河水母NeRF建图 |
| 2025 | VLA自进化+量子鲁棒终极形态 | Grok-4 SLAM + Uni-NaVid | <1cm / 量子鲁棒99.99% | 动态语义密图+自愈 / 秒级 | 华为ADS 4.0 + 银河2025 + 宇树G1全VLA SLAM |
1. 2015–2018:特征点+滤波/优化基础时代
- 核心特征:稀疏特征点(ORB/SIFT)+EKF/图优化BA,回环检测Bundle Adjustment,精度米级,地图为关键帧+点云,离线为主。
- 关键进展:
- 2015年:ORB-SLAM1单目实时SLAM里程碑。
- 2016–2017年:VINS-Mono视觉-惯导紧耦合,OKVIS多传感器。
- 2018年:ORB-SLAM2支持双目/RGB-D,回环检测成熟。
- 挑战与转折:动态物体/光照弱;直接法+语义兴起。
- 代表案例:百度Apollo初代ORB-SLAM,园区L4测试。
2. 2019–2022:直接法+多传感器稠密融合时代
- 核心特征:直接法(DSO/LDSO)+半直接法+动态物体去除+多传感器(激光+视觉+IMU),半稠密点云,实时厘米级。
- 关键进展:
- 2019年:LIO-SAM激光-惯导紧耦合,Semantic KITTI动态分割。
- 2020–2021年:Kimera多模态VIO+语义SLAM。
- 2022年:BEV SLAM+稠密重建,车载实时化。
- 挑战与转折:静态假设崩溃;神经辐射场NeRF兴起。
- 代表案例:小鹏NGP + 华为ADS 2.0多传感器SLAM,城市动态建图。
3. 2023–2025:NeRF/Gaussian+VLA自进化时代
- 核心特征:神经辐射场(NeRF/Gaussian Splatting)动态密图+VLA大模型统一+事件相机+量子辅助鲁棒,<1cm实时语义密图,自进化(越建越准)。
- 关键进展:
- 2023年:NICE-SLAM+Gaussian Splatting实时动态重建。
- 2024年:Uni-NaVid+事件SLAM,量子辅助抗扰。
- 2025年:Grok-4 SLAM + 银河/宇树/华为全VLA建图,动态语义密图秒级自愈。
- 挑战与转折:计算重/长尾;大模型+量子自进化标配。
- 代表案例:银河通用2025人形(VLA动态密图建图+导航),比亚迪天神之眼(7万级全天气NeRF SLAM)。
一句话总结
从2015年ORB稀疏特征点的“静态定位导航”到2025年VLA量子自进化的“动态语义密图理解”,十年间SLAM建图由规则优化转向多模态神经闭环,中国主导VINS→LIO→NeRF→VLA创新,推动智驾/机器人从“建图导航”到“实时理解动态世界”的文明跃迁,预计2030年SLAM精度<1mm+全域永不漂移自愈。
数据来源于arXiv综述、IROS 2025及中国厂商技术白皮书。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐


所有评论(0)