最新单插槽 GPU:NVIDIA RTX PRO™ 4000 Blackwell 性能测评
大型复杂模型场景测试瞄准中大型制造企业的复杂设计需求,为构建更复杂的模型,评测组将YL-777 电梯实训装置、智能装配生产线、睿抗机器人工程三个复杂模型组合到一起,组建三合一模型进行极限环境下的显卡性能测试,三合一模型总计包含零部件数量约2.1万个,型文件总大小1.5G,含大量高精度曲面、关联特征与运动信息,对显卡图形处理能力与显存容量要求极高。从三合一模型的载入速度看,RTX PRO 4000、
NVIDIA RTX PRO™ 4000 性能测评
NVIDIA 最新发布的单插槽 GPU NVIDIA RTX PRO™ 4000 Blackwell,相比较上一代 NVIDIA RTX™ 4000 Ada,采用最新 Blackwell 架构,配备 24GB 超高速显存、第五代 Tensor Core 和第四代 RT Core,可处理大型数据集,加速生成式 AI 工作流程,并以极快的速度渲染逼真的场景。接下来,我们将通过图形测试、实时渲染、AIGC 应用以及工业软件多个维度,为大家带来全面性能评测,看看相比上代究竟有多少性能提升。
1.参数对比

2.测试数据
测试环境

测试内容

图形性能
1、SPECviewperf 2020 v3.0
SPECviewperf是一个专业级、符合工业标准的OpenGL图形显卡效能测试分析软件,使用C语言编写,用于测量运行在OpenGL应用程序接口之下硬件的3D图形性能。其中包含了 3ds max、catia、creo、energy、maya、medical、snx、solidworks 共8款软件的性能测试。

从测试结果来看:
RTX PRO 4000 相较 RTX 4000 Ada 综合提升约 27%。
2、3D Mark
3DMark是一个由UL开发的智能设备性能评测软件,可用于评测设备的3D图形渲染能力。我们主要测试了 Port Royal 和 Speed Way 两个场景。

在 Port Royal 场景中,RTX PRO 4000 相较 RTX 4000 Ada 提升约 44%;
在 Speed Way 场景中,RTX PRO 4000 相较 RTX 4000 Ada 提升约 41%;
3、V-Ray Benchmark 6.00.01
V-Ray Benchmark 是一款免费的独立渲染速度测试软件,用于测试计算机的渲染速度。

RTX PRO 4000 相较 RTX 4000 Ada 提升约 64%。
4、OctaneBench
OctaneBench 是一种专有基准测试工具(也是当今最流行的GPU渲染基准测试),用于测量以每小时OctaneBench 点数(OBh)表示的GPU渲染速度,用于标准化和基准测试GPU性能。

RTX PRO 4000 相较 RTX 4000 Ada 提升约 35%。
实时渲染性能(4K)
1、Blender

RTX PRO 4000 相较 RTX 4000 Ada 提升约 16%。
2、Houdini

RTX PRO 4000 相较 RTX 4000 Ada 提升约 118%。
3、Maya

RTX PRO 4000 相较 RTX 4000 Ada 提升约 38%。
4、UE5

RTX PRO 4000 相较 RTX 4000 Ada 提升约 71%。
5、NVIDIA Omniverse™

RTX PRO 4000 相较 RTX 4000 Ada 提升约 69%。
AI 性能
1、Stable Diffusion
测试项目:SD文生图
生成尺寸:1024*1280

RTX PRO 4000 相较 RTX 4000 Ada 提升约 21%。
测试项目:FLUX 文生图
生成尺寸:1024*1280

RTX PRO 4000 相较 RTX 4000 Ada 提升约 24%。
测试项目:SDXL文生图
生成尺寸:1280*720

RTX PRO 4000 相较 RTX 4000 Ada 提升约 20%。
2、ComfyUI
测试项目:FLUX 文生图
生成尺寸:1280*720

RTX PRO 4000 相较 RTX 4000 Ada 提升约 59%。
测试项目:Hunyuan3D 模型生成

RTX PRO 4000 相较 RTX 4000 Ada 提升约 33%。
测试项目:Wan2.2 图生视频

RTX PRO 4000 相较 RTX 4000 Ada 提升约 44%。
工业软件性能
1、UG NX 应用测试
UG NX 作为面向高端制造的三维设计软件,在复杂装配体设计、多物理场仿真等场景中应用广泛,本次选取五类模型,从简单到复杂覆盖不同负载需求,详细测试内容见下表:

测试结果:
1、中小型场景

2、大型复杂场景
大型复杂模型场景测试瞄准中大型制造企业的复杂设计需求,为构建更复杂的模型,评测组将YL-777 电梯实训装置、智能装配生产线、睿抗机器人工程三个复杂模型组合到一起,组建三合一模型进行极限环境下的显卡性能测试,三合一模型总计包含零部件数量约2.1万个,型文件总大小1.5G,含大量高精度曲面、关联特征与运动信息,对显卡图形处理能力与显存容量要求极高。

从三合一模型的载入速度看,RTX PRO 4000、RTX 4000 Ada 分别是12秒和13秒,差别不大,编辑、旋转和缩放等操作流畅度。工程图生成,RTX PRO 4000 耗费29秒,RTX 4000 Ada 耗费32秒,约10%左右的性能差距。
在仿真稳定性方面,评测小组分别对 RTX PRO 4000 与 RTX 4000 Ada 进行2个小时的连续运行,整个过程无崩溃、无掉帧、无卡顿,显现出较好的仿真性能;高保真渲染环节,两款显卡用时相近,过程流畅,无卡顿。
2、Solidworks 性能测试
Solidworks 以易用性与兼容性著称,广泛应用于通用机械、模具设计等领域,本次测试选取两款模型,贴合不同用户的实际应用场景。

测试结果:

在载入、编辑、旋转、缩放、工程图生成等操作中,RTX PRO 4000 与 RTX 4000 Ada表现出极佳的性能,流畅完成厂房布局调整与设备关联编辑;稳定性方面,凭借更大显存带宽,两款显卡连续运行3小时后温度仍控制在 65℃以下,无降频或崩溃现象;只是在渲染和仿真过程中系统提示内存占用过高,从而影响显卡性能表现。
在复杂模型渲染或仿真时,硬件平台的性能瓶颈可能成为制约显卡性能发挥的关键因素。针对这一问题,我们认为对于厂房等大型模型设计,推荐用32GB或更大内存,极力避免因平台性能不足而导致显卡性能无法发挥全部性能的情况。
申请显卡测试
*与 NVIDIA 产品相关的图片或视频(完整或部分)的版权均归 NVIDIA Corporation 所有。

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐



所有评论(0)