AMD Radeon PRO W7900 和 W7800 是 AMD 全新的最高端工作站 GPU。 这些是首款芯片组 GPU,也是首款支持 DisplayPort 2.1 的芯片组 GPU。 观看我们将这些卡与 NVIDIA 的 RTX A6000 进行比较,看看高端工作站用户是否有可行的新 GPU 选择来满足他们最苛刻的 AI、渲染和其他专业应用程序工作负载。
AMD Radeon PRO W7900 和 W7800 是 AMD 全新的最高端工作站 GPU。 这些是首款芯片组 GPU,也是首款支持 DisplayPort 2.1 的芯片组 GPU。 观看我们将这些卡与 NVIDIA 的 RTX A6000 进行比较,看看高端工作站用户是否有可行的新 GPU 选择来满足他们最苛刻的 AI、渲染和其他专业应用程序工作负载。
AMD Radeon PRO W7900 和 W7800 规格
新的 Radeon PRO W7900 和 W7800 使用 AMD 的第三代图形架构 RDNA 3。这一代的根本变化是转向小芯片架构,该架构结合了来自不同工艺节点的芯片,以提高灵活性、功率和成本效率。
相比之下,上一代 RNDA 2 架构是整体式的,所有组件都采用相同的 7nm 工艺制造。 RDNA 3 将 5nm 芯片用于性能部件,将 6nm 芯片用于内存缓存。
AMD 表示 RDNA 3 还带来了下一代光线追踪加速器。 计算单元具有内置的“人工智能加速器”,可以提高数据推理性能。 对于媒体,RNDA 3 添加了硬件加速的 AV1 编码,最高可达 8K60。 它还支持 AVC 和 HEVC 的两个同步编码或解码流。
请参阅下方 Radeon PRO W7800 和 W7900 的完整规格,并以上一代 Radeon PRO W6800 为参考。 我们的分析如下。
Radeon PRO W7900 | Radeon PRO W7800 | Radeon PRO W6800 | |
GPU架构 | AMD RDNA 3 | AMD RDNA 2 | |
晶体管计数 | 57.7亿(5nm GDC 6nm MCD) | 26.8亿(7nm制程) | |
流处理器 | 6144(96 个计算单元) | 4480(70 个计算单元) | 3840(60 个计算单元) |
峰值 FP16 吞吐量(半精度) | 122.64 Teraflops | 90.50 Teraflops | 35.66 Teraflops |
峰值 FP32 吞吐量(单精度) | 61.32 Teraflops | 45.25 Teraflops | 17.83 Teraflops |
AMD 无限高速缓存 (L3) | 96MB | 64MB | 128MB |
专用显存 | 48GB GDDR6 | 32GB GDDR6 | 32GB GDDR6 |
Magistrala pamięci | 384 bit | 256 bit | 256 bit |
峰值内存带宽 | 864 GB /秒 | 576 GB /秒 | 512 GB /秒 |
PCI Express 支持 | 4.0 (x4)/3.0 向后兼容性 | ||
纠错码 (ECC) 支持 | 有的 | ||
显示连接器 | 3 个显示端口 1.2; 1 个增强型迷你 DisplayPort 2.1 | 6 个带 DSC 的 Mini-DisplayPort 1.4 | |
显示输出 |
|
|
|
主板总功率 | 295W 瓦 | 260W 瓦 | 250W 瓦 |
电源连接器 | 2x 8针 | 6针+ 8针 | |
电源推荐 | 最低 650 瓦 | ||
电路板尺寸 | 全高,3 槽,11 英寸(280 毫米)长 | 全高,2 槽,11 英寸(280 毫米)长 | 全高,2 槽,10.5 英寸(267 毫米) |
Radeon PRO W7800 几乎在每个领域都击败了上一代产品。 晶体管数量增加了一倍多,从 26.8 亿增加到 57.7 亿,峰值 FP16 和 FP32 吞吐量也是如此。 W7800 的 Infinity Cache 更小(64MB 而不是 128MB),但它在其他地方更强大,包括内存带宽,尽管它保持 256 位总线。 尽管如此,总电路板功率仅增加了 10 瓦,达到 260 瓦。 AMD 并不是在开玩笑说 RDNA 3 架构更节能。
然后是 AMD Radeon PRO W7900 怪物。 它与 W7800 的晶体管数量相同,但在其他方面遥遥领先; 它有 96 个而不是 70 个计算单元,这意味着更多的计算能力。 (这在我们的基准测试中很明显。)
同样值得注意的是它更大的 Infinity Cache(96MB 对 64MB)和更宽的 384 位内存总线,与 W864 的 7800 GB/s 相比,它的峰值内存带宽为 576 GB/s。 该性能确实是以更大的 3 槽卡设计和板卡功率从 260 瓦特相对适度增加到 295 瓦特为代价的。
有趣的是,新的 Radeon PRO 卡支持两个 8K 未压缩显示器或一个 12K(12,288 x 6,912 像素)显示器,只要后者上市。 (8K 显示器很难找到。)说到显示输出,AMD 表示这些新的 Radeon PRO 卡是第一个支持 DisplayPort 2.1 的产品,它提供 54 Gbps 的带宽,是带有 DisplayPort 2 的 RDNA 1.4 卡支持的两倍。
在最重要的软件方面,Radeon PRO W7800 和 W7900 具有可通过 AMD Software: PRO Edition 获得的特殊驱动程序。 AMD 通过其独立软件供应商 (ISV) 计划使用 100 多个应用程序对这些卡进行认证,并拥有零日 ISV 认证计划。 AMD 还鼓励开发人员通过扩展 HIP 性能 API 为其和其他 GPU 编写可移植代码。
AMD Radeon PRO W7900 对比。 NVIDIA RTX A6000 Ada 一代
现在让我们把 AMD 和 NVIDIA 的旗舰工作站卡放在一起,Radeon PRO W7900 和 RTX A6000 Ada Generation。 我还包括上一代 RTX A6000,我们将使用该卡进行性能比较。 我只包含了某些规格,因为许多规格不会是橙子对橙子; 卡之间的架构实在是太不同了。
(见 NVIDIA公司 了解更多技术信息。)
AMD Radeon PRO W7900 | NVIDIA RTX A6000 Ada 一代 | 英伟达 RTX A6000 | |
内存 | 48GB GDDR6 纠错码 | ||
存储器接口 | 384 bit | ||
内存带宽 | 864 GB /秒 | 960 GB /秒 | 768 GB /秒 |
单精度性能 | 61.32 Teraflops | 91.1 Teraflops | 38.7 Teraflops |
主板总功率 | 295瓦 | 300瓦 | |
外形 | 11” 长,3 槽 | 10.5” 长,2 槽 | |
电源连接器 | 2x 8针 | 1 个 PCIe CEM5 16 针 | 1x 8针 |
显示连接器 | 3 个显示端口 1.2; 1 个增强型迷你 DisplayPort 2.1 | 4 个显示端口 1.2a |
这三个都有一个 48GB GDDR6 ECC 帧缓冲区和一个 384 位内存总线。 我没有包括 NVIDIA Tensor/CUDA 核心或 AMD Compute 核心数量,因为它们没有可比性,即使在 NVIDIA 的生态系统中也是如此,但单精度性能提供了一个很好的基准。 Radeon PRO W7900 在该指标上显然比 RTX A6000 高出一步,但不是 RTX A6000 Ada Generation。
NVIDIA 卡具有尺寸优势,只需要两个插槽,而 Radeon PRO W7900 长半英寸,需要三个插槽。 所有卡的总板功率大致相同。 AMD 在支持 DisplayPort 2.1 方面可能具有优势,但您需要一个支持显示器。
AMD Radeon PRO W7900 和 W7800 设计
AMD Radeon PRO W7900 和 W7800 是工作站卡,因此我们不会看到任何华丽的 RGB 灯或花哨的冷却器。 这两款卡的长度均为 11 英寸(280 毫米),配备了适合工作站气流的鼓风机式冷却器。 所有冷却废气都从卡的背面排出。
插槽高度是卡的不同之处; Radeon PRO W7800 占用两个插槽,而 W7900 占用三个插槽。
这两款卡都使用传统的 2x 8 针电源设置。 AMD 建议至少使用 650 瓦的电源。
将卡片翻过来,我们再次看不到任何花哨的东西,但这张卡片完全是关于性能的,除了鼓风机冷却器上的简单品牌之外,它还保持了最低限度的美感。
AMD Radeon PRO W7900 和 W7800 性能
我们用的是自建的 StorageReview 测试台 用于性能测试; 桌面配置如下:
- 带液体冷却的英特尔酷睿 i9-12900K CPU
- 华硕 ROG Strix Z690-E Gaming WiFi 主板
- Microsoft Windows的11的
- 32GB 金士顿 Fury DDR5-5200 内存(2 个 16GB)
- 希捷 FireCuda 530 2TB SSD
这不是工作站,因为它不使用工作站或服务器级 CPU,但它具有支持 PCIe 4.0 的优势,考虑到这些新显卡需要多少带宽,我们需要它。
我们正在将 Radeon PRO 卡与 NVIDIA 进行比较 RTX-A6000. 这是上一代卡,不是基于 Ada Generation 架构的卡,但它仍将提供可靠的比较。 我们为这次审查重新测试了该卡。
请注意,我们在将显示器分辨率设置为 3840 x 2160 (4K/UHD) 的情况下运行了所有测试。 让我们开始测试吧。
UL 实验室 Procyon AI 基准测试
拥有来自顶级供应商的一系列人工智能推理引擎, UL Procyon 人工智能推理基准 迎合广泛的硬件设置和要求。 基准分数提供了设备上推理性能的方便和标准化的总结。 这使我们能够比较和对比现实世界中的不同硬件设置,而无需内部解决方案。
重要的是要考虑 AMD 卡不能运行 Tensor 基准测试。 但是,我们将其包括在内以展示性能差异。 我们选择了 Windows AI 测试,并将新的 W7900 和 W7800 与 NVIDIA 的 A6000 进行了比较。 新的 AMD Radeon PRO W7900 在某些测试中的 AI 推理以及总分中设法领先于 NVIDIA A6000,但重要的是要查看每个测试的详细结果。
测试 | A6000 张量(参考) |
A6000 视窗人工智能 |
W7900 Windows 人工智能 |
W7800
视窗人工智能 |
总体得分 | 1068 | 818 | 846 | 729 |
MobileNet V3 平均值推理时间 | 0.57 | 0.68 | 0.46 | 0.48 |
ResNet 50 平均。 推理时间 | 1.45 | 1.64 | 1.60 | 2.14 |
开始 V4 平均。 推理时间 | 4.56 | 4.06 | 6.65 | 7.44 |
DeepLab V3 平均。 推理时间 | 4.99 | 14.58 | 15.50 | 17.63 |
YOLO V3 平均推理时间 | 4.38 | 6.31 | 6.92 | 8.39 |
REAL-ESRGAN 平均值推理时间 | 127.24 | 125.34 | 80.74 | 92.22 |
规格viewperf2020
SPECviewperf 2020 基准测试是衡量在 OpenGL 和 Direct X 应用程序编程接口下运行的专业应用程序图形性能的全球标准。 视图集(或基准)表示来自实际应用程序的图形内容和行为,而无需自己安装应用程序。 这些视图集包括 3D Max、CATIA、Creo、Energy、Maya、Medical、Siemens NX 和 Solidworks。 数字越高越好。
Radeon PRO W7900 和 RTX A6000 之间存在一些拉锯战,战利品通常属于后者。 Radeon PRO W7800 紧随其更强大的同类产品,W7900 的性能高出约 15% 至 34%。 这是有道理的; Radeon PRO W7900 的计算单元比 W37 多 7800%(96 对 70)。
视图集 | AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | NVIDIA公司 RTX-A6000 |
3dsmax-07 | 112.84 | 98.44 | 141.57 |
卡地亚-06 | 19.01 | 18.3 | 102.24 |
Creo-03 | 150.26 | 125.2 | 159.46 |
能量-03 | 67.22 | 49.99 | 42.59 |
玛雅06 | 301.14 | 230.9 | 352.93 |
医疗-03 | 75.78 | 56.26 | 34.75 |
SNX-04 | 322.58 | 282.52 | 449.85 |
Solidworks-05 | 204.29 | 153.82 | 169.7 |
ESRI
接下来是环境系统研究所 (Esri) 基准。 Esri 是地理信息系统 (GIS) 软件的供应商。 Esri 的性能团队设计了他们的 PerfTool 插件脚本来自动启动 ArcGIS Pro。 此应用程序使用“ZoomToBookmarks”功能浏览各种预定义的书签,并创建一个日志文件,其中包含预测用户体验所需的所有关键数据点。 该脚本自动循环书签三次以说明缓存(内存和磁盘缓存)。 换句话说,该基准模拟了人们可能会通过 Esri 的 ArcGIS Pro 软件看到的大量图形使用。
测试由三个主要数据集组成。 两个是宾夕法尼亚州费城和魁北克省蒙特利尔的 3-D 城市景观。 这些城市视图包含覆盖在地形模型和覆盖航拍图像上的带纹理的 3-D 多面体建筑物。 第三个数据集是俄勒冈州波特兰地区的二维地图视图。 此数据包含有关道路、土地利用地块、公园和学校、河流、湖泊和山体阴影地形的详细信息。
蒙特利尔动画是第一个。 作为即将到来的迹象,RTX A6000 击败了 AMD 双人组。 根据平均 fps 数字,Radeon PRO W7900 相对于 W7800 的性能优势高达 44%。
ESRI ArcGIS Pro 2.3 蒙特利尔 | |
平均 FPS | 一般 |
AMD Radeon PRO W7900 | 265.07 |
AMD Radeon PRO W7800 | 183.44 |
英伟达 RTX A6000 | 601.50 |
最低帧率 | 一般 |
AMD Radeon PRO W7900 | 108.65 |
AMD Radeon PRO W7800 | 88.10 |
英伟达 RTX A6000 | 324.85 |
接下来是费城视图集; RTX A6000 的卓越性能得以延续。 Radeon PRO W7900 相对于 W7800 的优势在这里不太明显。
ESRI ArcGIS Pro 2.3 费城 | |
平均 FPS | 一般 |
AMD Radeon PRO W7900 | 252.36 |
AMD Radeon PRO W7800 | 199.17 |
英伟达 RTX A6000 | 474.97 |
最低帧率 | 一般 |
AMD Radeon PRO W7900 | 107.28 |
AMD Radeon PRO W7800 | 106.99 |
英伟达 RTX A6000 | 276.65 |
最后是波特兰,RTX A6000 就跑了。 Radeon PRO W7800 和 W7900 的性能几乎相同,因为此子测试受 CPU 限制。
ESRI ArcGIS Pro 2.3 波特兰 | |
平均 FPS | 一般 |
AMD Radeon PRO W7900 | 332.23 |
AMD Radeon PRO W7800 | 322.56 |
英伟达 RTX A6000 | 3,513.32 |
最低帧率 | 一般 |
AMD Radeon PRO W7900 | 201.55 |
AMD Radeon PRO W7800 | 208.67 |
英伟达 RTX A6000 | 1,641.34 |
乐士马克
我们将关注的另一个 3D 基准测试是 LuxMark,它是一个 OpenCL GPU 基准测试实用程序。 在这里,Radeon PRO W7900 比 RTX A6000 有可观的提升; Radeon PRO W7800 与 RTX A6000 不在同一级别。
LuxMark(越高越好) | |||
分类 | AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | 英伟达 RTX A6000 |
大厅长凳 | 22,538 | 16,692 | 20,867 |
食品 | 10,264 | 5,542 | 7,869 |
搅拌机优化
接下来是 Blender,一个开源 3D 建模应用程序。 该基准测试使用 Blender Benchmark 实用程序运行,并使用 NVIDIA OptiX 作为所选的渲染方法。 分数以每分钟采样数为单位,越高越好。
该基准测试似乎确实针对 NVIDIA 进行了优化,并且表明; RTX A6000 甚至远远领先于 Radeon PRO W7900。
Blender OptiX,每分钟采样数(越高越好) | |||
分类 | AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | 英伟达 RTX A6000 |
怪物 | 1,820.20 | 1,268.35 | 2,818.73 |
旧货店 | 960.66 | 684.83 | 1,794.18 |
课堂 | 843.99 | 635.85 | 1,535.98 |
Blackmagic RAW 速度测试
我们的最后一个测试是新的 Blackmagic RAW 速度测试。 OpenCL 上的 Radeon PRO 无法赶上带有 CUDA 的 RTX A6000。
Blackmagic RAW(越高越好) | |||
AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | 英伟达 RTX A6000 | |
8K显卡 | FPS 36 | FPS 35 | FPS 139 |
总结
AMD Radeon PRO W7900 和 W7800 在我们的基准测试中通常没有赶上 NVIDIA RTX A6000,尽管它们取得了一些胜利。 也就是说,AMD 从未声称 Radeon PRO W7900 最终会击败 RTX A6000——或多或少,目标是赶上它并以更低的价格提供新的 AMD GPU 系列。 定价是这些卡片的一个关键概念,尤其是在 AI 中,许多组织都在尝试衡量他们的 AI 投资,直到他们更好地处理业务影响。
工作站显卡的购买过程很大程度上取决于您使用的软件以及 AMD 或 NVIDIA 对软件的支持程度,这主要决定了显卡的性能。 我们运行的 SPECviewperf2020 基准测试可能提供了对 3D OpenGL 和 DirectX 的期望的最一般视图。 这是 Radeon PRO W7900 和 RTX A6000 相互交锋的唯一测试之一——一些子测试接近,另一些则非常有利于一张或另一张卡。 因此,Radeon PRO W7900 在某些情况下可以占据优势。
在 Blackmagic RAW 或 Procyon 等 CUDA 或 Tensor 优化发挥作用的领域,NVIDIA 产品仍然占据显着领先地位。 这有点像先有鸡还是先有蛋的情况。 GPU 优化遵循市场饱和,因此随着特定型号的流行,针对它们的优化也会随之而来。 如果我们从这里的性能数据中学到了什么,很明显 AMD 正朝着非常积极的方向前进,这当然有助于它们的采用。
如前所述,AMD 真正的王牌是定价。 Radeon PRO W7900 的厂商建议零售价为 3,999 美元,而 NVIDIA RTX A6000 Ada Generation 的建议零售价约为 6,800 美元,而我们在此进行比较的非 Ada 大约为 5,400 美元。 使用 AMD 卡每美元获得的相对性能通常对它有利。
总的来说,我们很高兴新的 Radeon PRO 卡将小芯片架构引入 GPU。 我们也喜欢 AMD 的前瞻性技术,尤其是首次包含 DisplayPort 2.1。 这些来自 Team Red 的新产品在某些情况下可以胜过 NVIDIA,而在其他情况下则不能,而且总体而言,就其价格点和受众而言,它们的表现似乎不错。 拥有更多选择对行业来说是一场胜利,很明显,AMD 表明它打算成为工作站 GPU 市场的有力竞争者。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | Discord | RSS订阅