NVIDIA RTX PRO™ 4000 性能测评

NVIDIA 最新发布的单插槽 GPU NVIDIA RTX PRO™ 4000 Blackwell,相比较上一代 NVIDIA RTX™ 4000 Ada,采用最新 Blackwell 架构,配备 24GB 超高速显存、第五代 Tensor Core 和第四代 RT Core,可处理大型数据集,加速生成式 AI 工作流程,并以极快的速度渲染逼真的场景。接下来,我们将通过图形测试、实时渲染、AIGC 应用以及工业软件多个维度,为大家带来全面性能评测,看看相比上代究竟有多少性能提升。

1.参数对比

2.测试数据

测试环境

测试内容

图形性能

1、SPECviewperf 2020 v3.0

SPECviewperf是一个专业级、符合工业标准的OpenGL图形显卡效能测试分析软件,使用C语言编写,用于测量运行在OpenGL应用程序接口之下硬件的3D图形性能。其中包含了 3ds max、catia、creo、energy、maya、medical、snx、solidworks 共8款软件的性能测试。

从测试结果来看:

RTX PRO 4000 相较 RTX 4000 Ada 综合提升约 27%。

2、3D Mark

3DMark是一个由UL开发的智能设备性能评测软件,可用于评测设备的3D图形渲染能力。我们主要测试了 Port Royal 和 Speed Way 两个场景。

在 Port Royal 场景中,RTX PRO 4000 相较 RTX 4000 Ada 提升约 44%;

在 Speed Way 场景中,RTX PRO 4000 相较 RTX 4000 Ada 提升约 41%;

3、V-Ray Benchmark 6.00.01

V-Ray Benchmark 是一款免费的独立渲染速度测试软件,用于测试计算机的渲染速度。

RTX PRO 4000 相较 RTX 4000 Ada 提升约 64%。

4、OctaneBench

OctaneBench 是一种专有基准测试工具(也是当今最流行的GPU渲染基准测试),用于测量以每小时OctaneBench 点数(OBh)表示的GPU渲染速度,用于标准化和基准测试GPU性能。

RTX PRO 4000 相较 RTX 4000 Ada 提升约 35%。

实时渲染性能(4K)

1、Blender

RTX PRO 4000 相较 RTX 4000 Ada 提升约 16%。

2、Houdini

RTX PRO 4000 相较 RTX 4000 Ada 提升约 118%。

3、Maya

RTX PRO 4000 相较 RTX 4000 Ada 提升约 38%。

4、UE5

RTX PRO 4000 相较 RTX 4000 Ada 提升约 71%。

5、NVIDIA Omniverse™

RTX PRO 4000 相较 RTX 4000 Ada 提升约 69%。

AI 性能

1、Stable Diffusion

测试项目:SD文生图

生成尺寸:1024*1280

RTX PRO 4000 相较 RTX 4000 Ada 提升约 21%。

测试项目:FLUX 文生图

生成尺寸:1024*1280

RTX PRO 4000 相较 RTX 4000 Ada 提升约 24%。

测试项目:SDXL文生图

生成尺寸:1280*720

RTX PRO 4000 相较 RTX 4000 Ada 提升约 20%。

2、ComfyUI

测试项目:FLUX 文生图

生成尺寸:1280*720

RTX PRO 4000 相较 RTX 4000 Ada 提升约 59%。

测试项目:Hunyuan3D 模型生成

RTX PRO 4000 相较 RTX 4000 Ada 提升约 33%。

测试项目:Wan2.2 图生视频

RTX PRO 4000 相较 RTX 4000 Ada 提升约 44%。

工业软件性能

1、UG NX 应用测试

UG NX 作为面向高端制造的三维设计软件,在复杂装配体设计、多物理场仿真等场景中应用广泛,本次选取五类模型,从简单到复杂覆盖不同负载需求,详细测试内容见下表:

测试结果:

1、中小型场景

2、大型复杂场景

大型复杂模型场景测试瞄准中大型制造企业的复杂设计需求,为构建更复杂的模型,评测组将YL-777 电梯实训装置、智能装配生产线、睿抗机器人工程三个复杂模型组合到一起,组建三合一模型进行极限环境下的显卡性能测试,三合一模型总计包含零部件数量约2.1万个,型文件总大小1.5G,含大量高精度曲面、关联特征与运动信息,对显卡图形处理能力与显存容量要求极高。

从三合一模型的载入速度看,RTX PRO 4000、RTX 4000 Ada 分别是12秒和13秒,差别不大,编辑、旋转和缩放等操作流畅度。工程图生成,RTX PRO 4000 耗费29秒,RTX 4000 Ada 耗费32秒,约10%左右的性能差距。

在仿真稳定性方面,评测小组分别对 RTX PRO 4000 与 RTX 4000 Ada 进行2个小时的连续运行,整个过程无崩溃、无掉帧、无卡顿,显现出较好的仿真性能;高保真渲染环节,两款显卡用时相近,过程流畅,无卡顿。

2、Solidworks 性能测试

Solidworks 以易用性与兼容性著称,广泛应用于通用机械、模具设计等领域,本次测试选取两款模型,贴合不同用户的实际应用场景。

测试结果:

在载入、编辑、旋转、缩放、工程图生成等操作中,RTX PRO 4000 与 RTX 4000 Ada表现出极佳的性能,流畅完成厂房布局调整与设备关联编辑;稳定性方面,凭借更大显存带宽,两款显卡连续运行3小时后温度仍控制在 65℃以下,无降频或崩溃现象;只是在渲染和仿真过程中系统提示内存占用过高,从而影响显卡性能表现。

在复杂模型渲染或仿真时,硬件平台的性能瓶颈可能成为制约显卡性能发挥的关键因素。针对这一问题,我们认为对于厂房等大型模型设计,推荐用32GB或更大内存,极力避免因平台性能不足而导致显卡性能无法发挥全部性能的情况。

申请显卡测试

https://my.feishu.cn/share/base/form/shrcnEmbNj6oRKsQ58SNldkb3yfmy.feishu.cn/share/base/form/shrcnEmbNj6oRKsQ58SNldkb3yfhttps://link.zhihu.com/?target=https%3A//my.feishu.cn/share/base/form/shrcnEmbNj6oRKsQ58SNldkb3yf

*与 NVIDIA 产品相关的图片或视频(完整或部分)的版权均归 NVIDIA Corporation 所有。

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐