首页 电子消费品客户端配件 NVIDIA Quadro RTX 4000 评测

NVIDIA Quadro RTX 4000 评测

by StorageReview 消费者服务台

去年 4000 月发布的 Quadro RTX 4000 是 NVIDIA 专业 GPU 系列的一部分。 RTX XNUMX 专为 CAD 软件专业人士设计,可提供强烈的真实感和与其设计的沉浸式交互。 因此,这使他们能够在本地工作站上运行高级模拟和分析。


去年 4000 月发布的 Quadro RTX 4000 是 NVIDIA 专业 GPU 系列的一部分。 RTX XNUMX 专为 CAD 软件专业人士设计,可提供强烈的真实感和与其设计的沉浸式交互。 因此,这使他们能够在本地工作站上运行高级模拟和分析。

与其他 NVIDIA GPU 不同,RTX 4000 使用 NVIDIA Quadro 可扩展视觉解决方案 (SVS)。 因此,每个单独的 RTX 4000 卡最多可以支持四个 5Hz 的 60K 显示器,或双 8K 显示器。 当使用两个 Quadro Sync II 板时,一个系统最多可支持八个 RTX 4000 GPU,同步 32 个独立显示器。 NVIDIA 还声称带宽比上一代 Quadro P40 提高了 4000%,这在一定程度上要归功于 8GB 的​​ GDDR6 显存。

RTX 4000 采用 4.4” H x 9.5” L 单槽外形,使 GPU 能够适应各种工作站机箱。 在这种纤薄的外形中,NVIDIA 能够容纳 2304 个 CUDA 内核、288 个 Tensor 内核、36 个 RT 内核和 8GB GDDR6 内存。 该硬件专为密集的 AEC、DCC、AI、VR 和图形工作负载而设计。 RTX 4000 配备 VirtualLink,可简化与下一代高分辨率 VR 头戴式显示器的连接。

Quadro RTX 4000 规格

卓越 英伟达图灵
GPU内存 8GB GDDR6
存储器接口 256 bit
内存带宽 高达 416GB/秒
NVIDIA CUDA核心 2,304
NVIDIA 张量核心 288
NVIDIA RT 核心 36
单精度性能 7.1 TFLOPS
张量性能 57.0 TFLOPS
系统介面 PCI Express 3.0 x 16
能量消耗 总板功率:160W
显卡总功率:125W
热解决方案活跃
外形 4.4” 高 x 9.5” 长,单槽
最大同时显示 4x 3840×2160 @ 120 赫兹
4x 5120×2880 @ 60 赫兹
2x 7680×4320 @ 60赫兹
VR就绪 Yes
图形 API 着色器型号5.1
OpenGL 4.5
DirectX 12.0的
Vulkan 1.0
计算 API CUDA
直接计算
OpenCL

性能

为了测试新架构在 NVIDIA Quadro RTX 4000 GPU 中的性能,我们将其安装在运行 Windows 920 的 Lenovo ThinkSystem P10 工作站中。为了全面了解每张卡的性能,我们利用了多项行业基准测试和 GPU 加速可以充分利用被测卡的软件。 我们不仅将其与共享 Turning 架构的 NVIDIA Quadro RTX 5000 进行比较,还将与之前的 Pascal Quadro 系列进行比较,包括 请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。, 请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。,并 请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。. 对于所选择的 GPU,这更少,更好,更多。

为了更好地了解这些 GPU 如何从不同的架构扩展,我们提供了下表 RTX 的现状。 RTX 4000 显然是该系列中的入门级卡,P 系列卡从 P1000 开始。 当然,RTX 系列一直扩展到 RTX 8000,带来了更多的显存、带宽和内核。

NVIDIA Quadro GPU
RTX 4000 RTX 5000 RTX 6000 RTX 8000
GPU内存 8GB GDDR6 16GB GDDR6 24GB GDDR6 48GB GDDR6
存储器接口 256 bit 256 bit 384 bit 384 bit
内存带宽 高达 416GB/秒 高达 448GB/秒 高达 672GB/秒 高达 672GB/秒
NVIDIA CUDA核心 2,304 3,072 4,608 4,608
NVIDIA 张量核心 288 384 576 576
NVIDIA RT 核心 36 48 72 72
单精度性能 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS 16.3 TFLOPS
张量性能 57.0 TFLOPS  89.2 TFLOPS 130.5 TFLOPS 130.5 TFLOPS

我们的第一个基准测试是 LuxMark 跨平台 OpenCL 基准测试工具。 LuxMark 基于 LuxCore API,并作为 LuxCoreRender 套件的促销组件提供。 它使用一个新的基于微内核的 OpenCL 路径跟踪器作为其基准测试的渲染器,提供了一种独特的方式来对给定工作站中安装的 GPU 施加压力。

勒克斯马克
图形处理器 成果
请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 15,303
请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 13,170
请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 21,297
RTX 4000 28,338
RTX 5000 29,404

虽然 Pascal GPU 在 LuxMark 上取得了不错的成绩,但在观察 Turning GPU 时,性能有了明显的提升。 RTX 4000 以 5000 的成绩仅次于 RTX 28,338。

接下来是 Arion,这是一个 CUDA 基准测试工具,由 RandomControl 开发,允许工作站在渲染应用程序中对 CPU 或 GPU 施加压力。 ArionBench 是一款基于 Arion 2 技术的软件工具,它通过模拟 3D 场景中的光流任务使 CPU/GPU 承受重压。

阿里昂
图形处理器 成果
请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 1,865
请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 2,738
请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 3,731
RTX 4000 4,484
RTX 5000 6,193

从 Pascal 到 Turing,RTX 4000 的分数又一次大幅跃升,比 P6000 有了相当大的跃升。

我们的下一个基准测试利用 SolidWorks 2019 和四个 3D 模型,包括奥迪 R8、建筑挖掘机、喷气发动机和拉力赛车。 Solidworks 是行业领先的 GPU 加速 3D CAD 建模应用程序,可在基于 Windows 的系统上运行。 SolidWorks 由 Dassault Systèmes 开发,全球有超过 165,000 万名工程师和超过 2019 家公司在使用它。 出于基准测试目的,我们利用了 SolidWorks 4.5 中新的“性能管道”功能。该架构提供了响应速度更快的实时显示,尤其是对于大型模型。 它利用现代 OpenGL (XNUMX) 和硬件加速渲染在您平移、缩放或旋转大型模型时保持高水平的细节和帧速率。

在渲染每个模型后,我们的脚本将每个模型旋转五次并测量完成此任务所需的时间。 然后将其除以渲染的帧数,并计算每部分的平均帧数 (FPS) 分数。

SolidWorks的
SolidWorks R8 一般
请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 198.0232
请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 214.9254
请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 217.9745
RTX 4000 211.1824
RTX 5000 208.8849
Solidworks 挖掘机 一般
请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 186.4832
请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 211.9595
请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 230.9774
RTX 4000 259.6056
RTX 5000 294.2529
Solidworks 喷气发动机 一般
请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 163.0573
请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 198.5351
请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 210.411
RTX 4000 220.6897
RTX 5000 283.2206
Solidworks 拉力赛车 一般
请在4000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 205.6225
请在5000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 219.0114
请在6000月XNUMX日至XNUMX日来台北台湾参观我们的展位PXNUMX。 218.4922
RTX 4000 214.4253
RTX 5000 217.256

使用 Solidworks R8 和 Rally Car 时,Turing 模型的性能略有下降,但 Digger 和 Jet Engine 有很大的提升。 在我们的 Solidworks 测试中,我们使用了 beta 显示模式,这可能是 Audi R8 和 RallyCar 装配体上出现异常缩放的原因。

接下来是环境系统研究所 (Esri) 基准。 Esri 是地理信息系统 (GIS) 软件的供应商。 Esri 的性能团队设计了他们的 PerfTool 插件脚本来自动启动 ArcGIS Pro。 此应用程序使用“ZoomToBookmarks”功能来浏览各种预定义的书签,并创建一个日志文件,其中包含预测用户体验所需的所有关键数据点。 该脚本自动循环书签三次以说明缓存(内存和磁盘缓存)。 换句话说,该基准模拟了人们可能通过 Esri 的 ArcGIS Pro 2.3 软件看到的大量图形使用。

测试由三个主要数据集组成。 两个是宾夕法尼亚州费城和魁北克省蒙特利尔的 3-D 城市景观。 这些城市视图包含覆盖在地形模型和覆盖航拍图像上的带纹理的 3-D 多面体建筑物。 第三个数据集是俄勒冈州波特兰地区的二维地图视图。 此数据包含有关道路、土地利用地块、公园和学校、河流、湖泊和山体阴影地形的详细信息。

查看蒙特利尔模型的绘制时间,NVIDIA Quadro RTX 4000 的平均绘制时间为 00:01:31.284,而平均和最小 FPS 分别显示为 502.395 和 180.699。

ESRI ArcGIS Pro 2.3 蒙特利尔
抽奖时间 一般
Quadro P4000 00:01:31.084
Quadro P5000 00:01:31:082
Quadro P6000 00:01:31.081
四核RTX 4000 00:01:31.284
四核RTX 5000 00:01:31.067
平均 FPS 一般
Quadro P4000 432.327
Quadro P5000 489.889
Quadro P6000 521.551
四核RTX 4000 502.395
四核RTX 5000 527.636
最低帧率 一般
Quadro P4000 164.546
Quadro P5000 194.218
Quadro P6000 190.336
四核RTX 4000 180.699
四核RTX 5000 190.775

接下来是我们的费城模型,其中 RTX 4000 的平均绘图时间为 00:01:00.231,而平均和最小 FPS 分别显示为 434.170 和 196.825。

ESRI ArcGIS Pro 2.3 费城
抽奖时间 一般
Quadro P4000 00:02:53.928
Quadro P5000 00:01:01.109
Quadro P6000 00:01:01.245
四核RTX 4000 00:01:00.231
四核RTX 5000 00:01:01.111
平均 FPS 一般
Quadro P4000 304.340
Quadro P5000 451.826
Quadro P6000 469.879
四核RTX 4000 434.170
四核RTX 5000 531.315
最低帧率 一般
Quadro P4000 160.152
Quadro P5000 212.910
Quadro P6000 207.879
四核RTX 4000 196.825
四核RTX 5000 224.341

我们的最后一个模型是波特兰。 此处,RTX 4000 的平均绘制时间为 00:00:32.646。 平均 FPS 显示为 2,821.928,而最低 FPS 显示为 1,083.260。

ESRI ArcGIS Pro 2.3 波特兰
抽奖时间 一般
Quadro P4000 00:00:32.426
Quadro P5000 00:00:32.310
Quadro P6000 00:00:32.552
四核RTX 4000 00:00:32.646
四核RTX 5000 00:00:32.541
平均 FPS 一般
Quadro P4000 2,051.053
Quadro P5000 2,057.395
Quadro P6000 2,343.948
四核RTX 4000 2,821.928
四核RTX 5000 2,783.547
最低帧率 一般
Quadro P4000 1,179.974
Quadro P5000 1,189.524
Quadro P6000 1,282.045
四核RTX 4000 1,083.260
四核RTX 5000 1,007.309

总结

NVIDIA Quadro RTX 4000 是较低级别的图灵架构 GPU,但这并不意味着它不强大。 RTX 4000 配备 2304 个 CUDA 内核和 8GB GDDR6 GPU。 与所有 Quadro RTX 一样,4000 能够在其易于访问的单插槽外形中提供加速的光线追踪、深度学习和高级着色。 这可以让创意专业人士更快地获得洞察力,同时加快他们的创意工作。 RTX 4000 还配备了 VirtualLink,可简化与下一代高分辨率 VR 头戴式显示器的连接。

在性能方面,RTX 4000 表现非常出色,尤其是考虑到它处于新 GPU 的低端。 在我们的 LuxMark 基准测试中,它几乎是 Pascal 基准的两倍,甚至超过了 P6000。 在 Arion 中,RTX 4000 是 P4000 的两倍多,再次轻松超过 P6000。 在我们的 Solidworks 基准测试中,RTX 4000 轻松超越了 P4000,并且在 Digger 和 Jet Engine 基准测试中表现更出色。 在 ESRi 中,RTX 4000 的性能比 P4000(在某些情况下是 P5000)好得多,但在某些工作负载中,P6000 的性能更好。 请记住,RTX 4000 处于 Turing 架构的低端,而 P6000 处于 Pascal 架构的高端。

总而言之,Quadro RTX 4000 是 NVIDIA 大量令人印象深刻的 GPU 产品线中广受欢迎的新成员,它为入门级显卡提供了令人印象深刻的性能数据,同时价格仅为 900 美元左右。

亚马逊上的 Quadro RTX 4000

Quadro RTX 4000 产品页面

讨论这篇评论

注册 StorageReview 时事通讯