从具身智能到基础模型:NVIDIA Research 团队在欧洲计算机视觉国际会议上展示前沿进展
NVIDIA 学习与感知研究副总裁 Jan Kautz、智能驾驶汽车应用研究总监 Jose Alvarez、AI 研究副总裁 Sanja Fidler 和智能驾驶汽车研究总监 Marco Pavone 担任组委会成员。在米兰举行的欧洲计算机视觉国际会议 (ECCV) 上,NVIDIA Research 展示了多项突破性的创新成果,共发表了 14 篇论文。*图片来源于论文“NeRFect Match

在米兰举行的欧洲计算机视觉国际会议 (ECCV) 上,NVIDIA Research 展示了多项突破性的创新成果,共发表了 14 篇论文。
本次 NVIDIA Research 所展示的领域从具身智能基础模型到检索增强生成和神经辐射场。其中大部分展示的成果都在汽车研究领域,包括:
- RealGen:RealGen 是一种新颖的基于检索、在上下文中学习的新型交通场景生成框架,此可控交通场景检索增强生成的灵感来自大语言模型中检索增强生成的成功经验,它可以通过组合多个检索示例的行为合成新的场景。
- NeRFect Match:探索用于视觉定位的 NeRF 特征,研究视觉定位,即确定查询图像相对于 3D 环境的摄像机姿态。在 3D 环境中定位智能体是自动驾驶等应用的一项基础能力。
- Dolphins:拟人驾驶多模态语言模型介绍了一种新型视觉语言模型 Dolphins,该模型专为深入学习类似人类的驾驶能力而构建。Dolphins 善于处理由视频或图像数据、文本指令和历史控制信号组成的多模态输入,以此生成与所提供的指令相对应的输出。
此外,NVIDIA 首席研究科学家 Tsung-Yi Lin 荣获了 Koenderink 奖。该奖项旨在表彰为计算机视觉领域作出重要贡献并且能够经受住时间考验的研究。Koenderink 奖每两年颁发一次,颁发给 10 年前在 ECCV 上发表过有影响力论文的研究者。今年的 Koenderink 奖颁发给了 2014 年发表“Microsoft COCO:上下文中的常见对象”一文的研究者,Lin 是该论文的共同作者。
NVIDIA 研究人员共同组织了多场 ECCV 研讨会并发表了演讲。其中,具身智能合作智能研讨会受到了关注,该研讨会主要探讨了多代理自主系统中的合作智能。以视觉为中心的智能驾驶研讨会则探讨了适用于智能驾驶的视觉感知和视觉语言模型以及驾驶场景神经渲染。
NVIDIA 高级研究经理 Laura Leal-Taixé 担任本次会议主席。NVIDIA 学习与感知研究副总裁 Jan Kautz、智能驾驶汽车应用研究总监 Jose Alvarez、AI 研究副总裁 Sanja Fidler 和智能驾驶汽车研究总监 Marco Pavone 担任组委会成员。
NVIDIA 在 ECCV 上发表的全部论文如下:
https://arxiv.org/abs/2312.13303
https://arxiv.org/pdf/2403.09577
https://vlm-driver.github.io/
https://research.nvidia.com/labs/toronto-ai/DiPIR/
https://arxiv.org/pdf/2311.14671
https://github.com/nv-dvl/segment-anything-lidar
https://www.arxiv.org/pdf/2407.06683
https://arxiv.org/pdf/2404.11426
https://arxiv.org/pdf/2312.02139
https://arxiv.org/abs/2403.19046
https://arxiv.org/pdf/2305.03713
https://arxiv.org/abs/2408.16426
https://arxiv.org/abs/2312.13764
https://arxiv.org/abs/2404.03620
了解有关 NVIDIA Research 的更多信息请访问:
https://www.nvidia.cn/research/
查看往期 NVIDIA 自动驾驶实验室系列视频, 深入探究自动驾驶算法:
https://www.nvidia.cn/self-driving-cars/drive-videos/
*图片来源于论文“NeRFect Match:探索用于视觉定位的 NeRF 特征”,若您有任何疑问或需要使用本文中图片,请联系论文作者。
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐




所有评论(0)