对于NVIDIA CEO黄仁勋的主题演讲,我们虽不预期会脱离其核心的AI与商业叙事,但仍可期待一些足以定义未来的关键讯号:或许是路线图的悄然更新,或许是Blackwell Ultra的规模化部署进展,抑或是下一代Rubin架构将如何再次颠覆AI性能的边界。而这,正是GTC DC25超越一场普通技术发布的意义所在——它是一次关于智能世界基础设施与产业应用的集中预演。
在这里插入图片描述

一、AI 走进运营:英伟达 × Palantir 构建运营型智能栈

本届 GTC 的最大亮点之一,是英伟达与 Palantir Technologies 宣布联合打造面向“运营型 AI”的一体化技术栈。
该方案融合 Palantir 的 Ontology 数据语义系统 与英伟达的 GPU 加速计算、开源模型与 CUDA-X 数据科学库,让企业与政府能以语境感知推理驱动业务决策。
在这里插入图片描述
这意味着 AI 不再仅用于模型训练,而是直接嵌入运营流程。例如美国零售商 Lowe’s 已基于该系统构建全球供应链数字孪生,实现 AI 持续优化。正如黄仁勋所言:“我们正在让 AI 成为企业的操作系统。”

二、AI-原生 6G:无线网络的再定义

在通信领域,英伟达宣布了美国首个 AI-原生 6G 无线栈。该项目联合 Booz Allen、Cisco、MITRE、ODC 与 T-Mobile 等公司,仅用六个月便完成原型验证,实现首个 AI 驱动无线通话。该系统基于 NVIDIA Aerial 平台,结合 ODC 的 5G RAN 软件与 Cisco 的安全网络功能,使无线网络可同时执行通信与 AI 推理任务。
在这里插入图片描述
相较传统方案,小区容量提升 7 倍,功率效率提高 3.5 倍。此外,英伟达与 诺基亚(Nokia) 合作推出 AI-RAN 系统,目标是让运营商以软件升级方式从 5G Advanced 平滑迈向 6G。这套架构将通信与 AI 工作负载统一到软件定义、加速的底层基础设施中,为未来分布式 AI 网络奠定基础。

三、AI 驱动制造与机器人:从工厂到人形机器人

制造业同样是本次大会的重要主题。英伟达发布了 “Mega Omniverse Blueprint”,用于构建可模拟工厂与机器人车队的数字孪生系统。包括 Siemens、Foxconn、Toyota、TSMC 等均已采用 Omniverse 进行 AI 工厂设计与仿真。
在这里插入图片描述
在人形机器人领域,Figure AI、Agility Robotics、Amazon Robotics 等公司正基于 Isaac 平台 与 Jetson AGX Thor 推进机器人智能体训练,使机器人在工业、仓储、甚至家庭环境中执行复杂任务。英伟达还推出企业级边缘平台 IGX Thor,以支持下一代工业与医用 AI 应用。

四、自动驾驶与边缘智能:构建全球最大 L4 自动驾驶网络

在自动驾驶领域,英伟达宣布与 Uber 深度合作,计划共同打造全球最大、可支持 L4 级自动驾驶 的出行与配送网络。这一网络将基于 Uber 的下一代 Robotaxi 与无人配送车队,全面采用 NVIDIA DRIVE AGX Hyperion 10 平台 与 DRIVE AV 自动驾驶软件栈。
英伟达将助力 Uber 在 2027 年前扩展至 10 万辆自动驾驶车辆,同时利用 NVIDIA Cosmos 数据工厂 构建统一的数据闭环,加速自动驾驶算法的训练与验证。
在这里插入图片描述

Hyperion 10 平台集成了两颗 DRIVE AGX Thor 芯片,基于 Blackwell 架构,单车算力可达 2000 FP4 TFLOPS,支持实时 Transformer、VLA(视觉-语言-行动)模型运行。该平台搭载 14 路摄像头、9 个雷达、1 个激光雷达与 12 个超声波传感器,为车企提供即插即用的 L4 级软硬件参考设计。除 Uber 外,Stellantis、Lucid、Mercedes-Benz、Foxconn 等也将采用该平台开发 L4 级别 Robotaxi 和高端自动驾驶汽车;同时,Aurora、Volvo、Waabi 正基于 DRIVE AGX Thor 打造自动驾驶卡车,将英伟达 AI 能力延展至商用货运场景。
在这里插入图片描述

英伟达还发布了 全球最大多模态自动驾驶数据集,涵盖 25 个国家、1700 小时实景感知数据,用于支持大模型训练与验证。此外,全新的 NVIDIA Halos 安全体系 从云端到车端提供全栈安全与网络防护,确保自动驾驶模型在功能与伦理层面可控、可信。
通过 DRIVE、Cosmos 与 Halos 的结合,英伟达正从芯片到系统层面构建自动驾驶的“全栈生态”,让智能出行真正具备规模化落地的可能。

五、Vera Rubin 超级芯片:AI 算力的下一跃

大会的高潮来自 Vera Rubin Superchip 的首次实机亮相。主板上集成了一颗 Vera CPU 与两颗 Rubin GPU,搭载 32 组 LPDDR 系统内存与 HBM4 显存,采用台积电最新制程。每颗 GPU 拥有 8 个 HBM4 接口与双 Reticle 级 GPU 核心,而 Vera CPU 则采用 88 个定制 Arm 核心 / 176 线程 的设计。
在这里插入图片描述

技术规格方面:
●Vera Rubin NVL144平台集成两颗新型芯片
●Rubin GPU采用双光罩尺寸核心,FP4运算性能达50 PFLOPs
●配备288GB新一代HBM4内存
●88核Vera CPU通过NVLINK-C2C互联技术实现1.8 TB/s传输速率
性能提升显著:
●FP4推理性能达3.6 Exaflops,FP8训练性能1.2 Exaflops
●较GB300 NVL72提升3.3倍
●HBM4内存带宽13 TB/s,高速内存容量75 TB
●NVLINK与CX9传输能力分别提升至260 TB/s与28.8 TB/s
在这里插入图片描述

第二代平台Rubin Ultra计划于2027年下半年亮相,将NVL系统规模从144扩展至576。虽然CPU架构保持不变,但Rubin Ultra GPU采用四光罩尺寸核心,FP4性能跃升至100 PFLOPs,并通过16个HBM4e位点实现1TB海量内存。
在这里插入图片描述
终极性能表现:
●FP4推理性能15 Exaflops,FP8训练性能5 Exaflops
●较GB300 NVL72实现14倍跨越
●HBM4内存带宽达4.6 PB/s,高速内存容量365 TB
●NVLINK与CX9传输能力分别飙升至1.5 PB/s与115.2 TB/s
这不仅是硬件的迭代,更意味着英伟达正为未来大模型训练、自治智能系统与生成式工业 AI 构建全新算力底座。
在这里插入图片描述

六、结语:从芯片到算力生态的落地

从 Vera Rubin 到 DRIVE Thor,从 AI-原生 6G 到数字孪生工厂,GTC DC25 展示了 AI 正在从“模型革命”迈向“系统革命”。AI 不再只是算法的竞争,而是算力、连接与应用协同的生态重塑。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐