AMD Radeon PRO W7900 和 W7800 是 AMD 全新的最高端工作站 GPU。 這些是首款芯片組 GPU,也是首款支持 DisplayPort 2.1 的芯片組 GPU。 觀看我們將這些卡與 NVIDIA 的 RTX A6000 進行比較,看看高端工作站用戶是否有可行的新 GPU 選擇來滿足他們最苛刻的 AI、渲染和其他專業應用程序工作負載。
AMD Radeon PRO W7900 和 W7800 是 AMD 全新的最高端工作站 GPU。 這些是首款芯片組 GPU,也是首款支持 DisplayPort 2.1 的芯片組 GPU。 觀看我們將這些卡與 NVIDIA 的 RTX A6000 進行比較,看看高端工作站用戶是否有可行的新 GPU 選擇來滿足他們最苛刻的 AI、渲染和其他專業應用程序工作負載。
AMD Radeon PRO W7900 和 W7800 規格
新的 Radeon PRO W7900 和 W7800 使用 AMD 的第三代圖形架構 RDNA 3。這一代的根本變化是轉向小芯片架構,該架構結合了來自不同工藝節點的芯片,以提高靈活性、功率和成本效率。
相比之下,上一代 RNDA 2 架構是整體式的,所有組件都採用相同的 7nm 工藝製造。 RDNA 3 將 5nm 芯片用於性能部件,將 6nm 芯片用於內存緩存。
AMD 表示 RDNA 3 還帶來了下一代光線追踪加速器。 計算單元具有內置的“人工智能加速器”,可以提高數據推理性能。 對於媒體,RNDA 3 添加了硬件加速的 AV1 編碼,最高可達 8K60。 它還支持 AVC 和 HEVC 的兩個同步編碼或解碼流。
請參閱下方 Radeon PRO W7800 和 W7900 的完整規格,並以上一代 Radeon PRO W6800 為參考。 我們的分析如下。
Radeon PRO W7900 | Radeon PRO W7800 | Radeon PRO W6800 | |
GPU架構 | AMD RDNA 3 | AMD RDNA 2 | |
晶體管計數 | 57.7億(5nm GDC 6nm MCD) | 26.8億(7nm製程) | |
流處理器 | 6144(96 個計算單元) | 4480(70 個計算單元) | 3840(60 個計算單元) |
峰值 FP16 吞吐量(半精度) | 122.64 Teraflops | 90.50 Teraflops | 35.66 Teraflops |
峰值 FP32 吞吐量(單精度) | 61.32 Teraflops | 45.25 Teraflops | 17.83 Teraflops |
AMD 無限高速緩存 (L3) | 96MB | 64MB | 128MB |
專用顯存 | 48GB GDDR6 | 32GB GDDR6 | 32GB GDDR6 |
內存總線 | 384-位 | 256-位 | 256-位 |
峰值內存帶寬 | 864 GB / s | 576 GB / s | 512 GB / s |
PCI Express 支持 | 4.0 (x4)/3.0 向後兼容性 | ||
糾錯碼 (ECC) 支持 | 充足 | ||
顯示器連接器 | 3 個顯示端口 1.2; 1 個增強型迷你 DisplayPort 2.1 | 6 個帶 DSC 的 Mini-DisplayPort 1.4 | |
顯示輸出 |
|
|
|
主板總功率 | 295W¯¯ | 260W¯¯ | 250W¯¯ |
電源連接器 | 2x 8 針 | 6 針 + 8 針 | |
電源推薦 | 最低 650 瓦 | ||
電路板尺寸 | 全高,3 槽,11 英寸(280 毫米)長 | 全高,2 槽,11 英寸(280 毫米)長 | 全高,2 槽,10.5 英寸(267 毫米) |
Radeon PRO W7800 幾乎在每個領域都擊敗了上一代產品。 晶體管數量增加了一倍多,從 26.8 億增加到 57.7 億,峰值 FP16 和 FP32 吞吐量也是如此。 W7800 的 Infinity Cache 更小(64MB 而不是 128MB),但它在其他地方更強大,包括內存帶寬,儘管它保持 256 位總線。 儘管如此,總電路板功率僅增加了 10 瓦,達到 260 瓦。 AMD 並不是在開玩笑說 RDNA 3 架構更節能。
然後是 AMD Radeon PRO W7900 怪物。 它與 W7800 的晶體管數量相同,但在其他方面遙遙領先; 它有 96 個而不是 70 個計算單元,這意味著更多的計算能力。 (這在我們的基準測試中很明顯。)
同樣值得注意的是它更大的 Infinity Cache(96MB 對 64MB)和更寬的 384 位內存總線,與 W864 的 7800 GB/s 相比,它的峰值內存帶寬為 576 GB/s。 該性能確實是以更大的 3 槽卡設計和闆卡功率從 260 瓦特相對適度增加到 295 瓦特為代價的。
有趣的是,新的 Radeon PRO 卡支持兩個 8K 未壓縮顯示器或一個 12K(12,288 x 6,912 像素)顯示器,只要後者上市。 (8K 顯示器很難找到。)說到顯示輸出,AMD 表示這些新的 Radeon PRO 卡是第一個支持 DisplayPort 2.1 的產品,它提供 54 Gbps 的帶寬,是帶有 DisplayPort 2 的 RDNA 1.4 卡支持的兩倍。
在最重要的軟件方面,Radeon PRO W7800 和 W7900 具有可通過 AMD Software: PRO Edition 獲得的特殊驅動程序。 AMD 通過其獨立軟件供應商 (ISV) 計劃使用 100 多個應用程序對這些卡進行認證,並擁有零日 ISV 認證計劃。 AMD 還鼓勵開發人員通過擴展 HIP 性能 API 為其和其他 GPU 編寫可移植代碼。
AMD Radeon PRO W7900 對比。 NVIDIA RTX A6000 Ada 一代
現在讓我們把 AMD 和 NVIDIA 的旗艦工作站卡放在一起,Radeon PRO W7900 和 RTX A6000 Ada Generation。 我還包括上一代 RTX A6000,我們將使用該卡進行性能比較。 我只包含了某些規格,因為許多規格不會是橙子對橙子; 卡之間的架構實在是太不同了。
(見 NVIDIA 了解更多技術信息。)
AMD Radeon PRO W7900 | NVIDIA RTX A6000 Ada 一代 | 英偉達 RTX A6000 | |
記憶體應用 | 48GB GDDR6 糾錯碼 | ||
存儲器接口 | 384-位 | ||
內存帶寬 | 864 GB / s | 960 GB / s | 768 GB / s |
單精度性能 | 61.32 Teraflops | 91.1 Teraflops | 38.7 Teraflops |
主板總功率 | 295瓦 | 300瓦 | |
外形 | 11” 長,3 槽 | 10.5” 長,2 槽 | |
電源連接器 | 2x 8 針 | 1 個 PCIe CEM5 16 針 | 1x 8 針 |
顯示器連接器 | 3 個顯示端口 1.2; 1 個增強型迷你 DisplayPort 2.1 | 4 個顯示端口 1.2a |
這三個都有一個 48GB GDDR6 ECC 幀緩衝區和一個 384 位內存總線。 我沒有包括 NVIDIA Tensor/CUDA 核心或 AMD Compute 核心數量,因為它們沒有可比性,即使在 NVIDIA 的生態系統中也是如此,但單精度性能提供了一個很好的基準。 Radeon PRO W7900 在該指標上顯然比 RTX A6000 高出一步,但不是 RTX A6000 Ada Generation。
NVIDIA 卡具有尺寸優勢,只需要兩個插槽,而 Radeon PRO W7900 長半英寸,需要三個插槽。 所有卡的總板功率大致相同。 AMD 在支持 DisplayPort 2.1 方面可能具有優勢,但您需要一個支持顯示器。
AMD Radeon PRO W7900 和 W7800 設計
AMD Radeon PRO W7900 和 W7800 是工作站卡,因此我們不會看到任何華麗的 RGB 燈或花哨的冷卻器。 這兩款卡的長度均為 11 英寸(280 毫米),配備了適合工作站氣流的鼓風機式冷卻器。 所有冷卻廢氣都從卡的背面排出。
插槽高度是卡的不同之處; Radeon PRO W7800 佔用兩個插槽,而 W7900 佔用三個插槽。
這兩款卡都使用傳統的 2x 8 針電源設置。 AMD 建議至少使用 650 瓦的電源。
將卡片翻過來,我們再次看不到任何花哨的東西,但這張卡片完全是關於性能的,除了鼓風機冷卻器上的簡單品牌之外,它還保持了最低限度的美感。
AMD Radeon PRO W7900 和 W7800 性能
我們用的是自建的 StorageReview 測試台 用於性能測試; 桌面配置如下:
- 帶液體冷卻的英特爾酷睿 i9-12900K CPU
- 華碩 ROG Strix Z690-E Gaming WiFi 主板
- Microsoft Windows的11的
- 32GB 金士頓 Fury DDR5-5200 內存(2 個 16GB)
- 希捷 FireCuda 530 2TB SSD
這不是工作站,因為它不使用工作站或服務器級 CPU,但它具有支持 PCIe 4.0 的優勢,考慮到這些新顯卡需要多少帶寬,我們需要它。
我們正在將 Radeon PRO 卡與 NVIDIA 進行比較 RTX-A6000. 這是上一代卡,不是基於 Ada Generation 架構的卡,但它仍將提供可靠的比較。 我們為這次審查重新測試了該卡。
請注意,我們在將顯示器分辨率設置為 3840 x 2160 (4K/UHD) 的情況下運行了所有測試。 讓我們開始測試吧。
UL 實驗室 Procyon AI 基準測試
擁有來自頂級供應商的一系列人工智能推理引擎, UL Procyon 人工智能推理基準 迎合廣泛的硬件設置和要求。 基準分數提供了設備上推理性能的方便和標準化的總結。 這使我們能夠比較和對比現實世界中的不同硬件設置,而無需內部解決方案。
重要的是要考慮 AMD 卡不能運行 Tensor 基準測試。 但是,我們將其包括在內以展示性能差異。 我們選擇了 Windows AI 測試,並將新的 W7900 和 W7800 與 NVIDIA 的 A6000 進行了比較。 新的 AMD Radeon PRO W7900 在某些測試中的 AI 推理以及總分中設法領先於 NVIDIA A6000,但重要的是要查看每個測試的詳細結果。
測試 | A6000 張量(參考) |
A6000 視窗人工智能 |
W7900 Windows 人工智能 |
W7800
視窗人工智能 |
總體得分 | 1068 | 818 | 846 | 729 |
MobileNet V3 平均值推理時間 | 0.57 | 0.68 | 0.46 | 0.48 |
ResNet 50 平均。 推理時間 | 1.45 | 1.64 | 1.60 | 2.14 |
開始 V4 平均。 推理時間 | 4.56 | 4.06 | 6.65 | 7.44 |
DeepLab V3 平均。 推理時間 | 4.99 | 14.58 | 15.50 | 17.63 |
YOLO V3 平均推理時間 | 4.38 | 6.31 | 6.92 | 8.39 |
REAL-ESRGAN 平均值推理時間 | 127.24 | 125.34 | 80.74 | 92.22 |
規格viewperf2020
SPECviewperf 2020 基準測試是衡量在 OpenGL 和 Direct X 應用程序編程接口下運行的專業應用程序圖形性能的全球標準。 視圖集(或基準)表示來自實際應用程序的圖形內容和行為,而無需自己安裝應用程序。 這些視圖集包括 3D Max、CATIA、Creo、Energy、Maya、Medical、Siemens NX 和 Solidworks。 數字越高越好。
Radeon PRO W7900 和 RTX A6000 之間存在一些拉鋸戰,戰利品通常屬於後者。 Radeon PRO W7800 緊隨其更強大的同類產品,W7900 的性能高出約 15% 至 34%。 這是有道理的; Radeon PRO W7900 的計算單元比 W37 多 7800%(96 對 70)。
視圖集 | AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | NVIDIA RTX-A6000 |
3dsmax-07 | 112.84 | 98.44 | 141.57 |
卡地亞-06 | 19.01 | 18.3 | 102.24 |
Creo-03 | 150.26 | 125.2 | 159.46 |
能量-03 | 67.22 | 49.99 | 42.59 |
瑪雅-06 | 301.14 | 230.9 | 352.93 |
醫療-03 | 75.78 | 56.26 | 34.75 |
SNX-04 | 322.58 | 282.52 | 449.85 |
Solidworks-05 | 204.29 | 153.82 | 169.7 |
ESRI
接下來是環境系統研究所 (Esri) 基準。 Esri 是地理信息系統 (GIS) 軟件的供應商。 Esri 的性能團隊設計了他們的 PerfTool 插件腳本來自動啟動 ArcGIS Pro。 此應用程序使用“ZoomToBookmarks”功能瀏覽各種預定義的書籤,並創建一個日誌文件,其中包含預測用戶體驗所需的所有關鍵數據點。 該腳本自動循環書籤三次以說明緩存(內存和磁盤緩存)。 換句話說,該基準模擬了人們可能會通過 Esri 的 ArcGIS Pro 軟件看到的大量圖形使用。
測試由三個主要數據集組成。 兩個是賓夕法尼亞州費城和魁北克省蒙特利爾的 3-D 城市景觀。 這些城市視圖包含覆蓋在地形模型和覆蓋航拍圖像上的帶紋理的 3-D 多面體建築物。 第三個數據集是俄勒岡州波特蘭地區的二維地圖視圖。 此數據包含有關道路、土地利用地塊、公園和學校、河流、湖泊和山體陰影地形的詳細信息。
蒙特利爾動畫是第一個。 作為即將到來的跡象,RTX A6000 擊敗了 AMD 雙人組。 根據平均 fps 數字,Radeon PRO W7900 相對於 W7800 的性能優勢高達 44%。
ESRI ArcGIS Pro 2.3 蒙特利爾 | |
平均 FPS | 中等 |
AMD Radeon PRO W7900 | 265.07 |
AMD Radeon PRO W7800 | 183.44 |
英偉達 RTX A6000 | 601.50 |
最低幀率 | 中等 |
AMD Radeon PRO W7900 | 108.65 |
AMD Radeon PRO W7800 | 88.10 |
英偉達 RTX A6000 | 324.85 |
接下來是費城視圖集; RTX A6000 的卓越性能得以延續。 Radeon PRO W7900 相對於 W7800 的優勢在這裡不太明顯。
ESRI ArcGIS Pro 2.3 費城 | |
平均 FPS | 中等 |
AMD Radeon PRO W7900 | 252.36 |
AMD Radeon PRO W7800 | 199.17 |
英偉達 RTX A6000 | 474.97 |
最低幀率 | 中等 |
AMD Radeon PRO W7900 | 107.28 |
AMD Radeon PRO W7800 | 106.99 |
英偉達 RTX A6000 | 276.65 |
最後是波特蘭,RTX A6000 就跑了。 Radeon PRO W7800 和 W7900 的性能幾乎相同,因為此子測試受 CPU 限制。
ESRI ArcGIS Pro 2.3 波特蘭 | |
平均 FPS | 中等 |
AMD Radeon PRO W7900 | 332.23 |
AMD Radeon PRO W7800 | 322.56 |
英偉達 RTX A6000 | 3,513.32 |
最低幀率 | 中等 |
AMD Radeon PRO W7900 | 201.55 |
AMD Radeon PRO W7800 | 208.67 |
英偉達 RTX A6000 | 1,641.34 |
樂士馬克
我們將關注的另一個 3D 基準測試是 LuxMark,它是一個 OpenCL GPU 基準測試實用程序。 在這裡,Radeon PRO W7900 比 RTX A6000 有可觀的提升; Radeon PRO W7800 與 RTX A6000 不在同一級別。
LuxMark(越高越好) | |||
類別 | AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | 英偉達 RTX A6000 |
大廳長凳 | 22,538 | 16,692 | 20,867 |
餐飲 | 10,264 | 5,542 | 7,869 |
攪拌機優化
接下來是 Blender,一個開源 3D 建模應用程序。 該基準測試使用 Blender Benchmark 實用程序運行,並使用 NVIDIA OptiX 作為所選的渲染方法。 分數以每分鐘採樣數為單位,越高越好。
該基準測試似乎確實針對 NVIDIA 進行了優化,並且表明; RTX A6000 甚至遠遠領先於 Radeon PRO W7900。
Blender OptiX,每分鐘採樣數(越高越好) | |||
類別 | AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | 英偉達 RTX A6000 |
Monster | 1,820.20 | 1,268.35 | 2,818.73 |
舊貨店 | 960.66 | 684.83 | 1,794.18 |
課堂 | 843.99 | 635.85 | 1,535.98 |
Blackmagic RAW 速度測試
我們的最後一個測試是新的 Blackmagic RAW 速度測試。 OpenCL 上的 Radeon PRO 無法趕上帶有 CUDA 的 RTX A6000。
Blackmagic RAW(越高越好) | |||
AMD Radeon PRO W7900 | AMD Radeon PRO W7800 | 英偉達 RTX A6000 | |
8K顯卡 | FPS 36 | FPS 35 | FPS 139 |
結論
AMD Radeon PRO W7900 和 W7800 在我們的基準測試中通常沒有趕上 NVIDIA RTX A6000,儘管它們取得了一些勝利。 也就是說,AMD 從未聲稱 Radeon PRO W7900 最終會擊敗 RTX A6000——或多或少,目標是趕上它並以更低的價格提供新的 AMD GPU 系列。 定價是這些卡的一個關鍵概念,尤其是在 AI 中,許多組織都在嘗試衡量他們的 AI 投資,直到他們更好地處理業務影響。
工作站顯卡的購買過程很大程度上取決於您使用的軟件以及 AMD 或 NVIDIA 對軟件的支持程度,這主要決定了顯卡的性能。 我們運行的 SPECviewperf2020 基準測試可能提供了對 3D OpenGL 和 DirectX 的期望的最一般視圖。 這是 Radeon PRO W7900 和 RTX A6000 相互交鋒的唯一測試之一——一些子測試接近,另一些則非常有利於一張卡或另一張。 因此,Radeon PRO W7900 在某些情況下可以佔據優勢。
在 Blackmagic RAW 或 Procyon 等 CUDA 或 Tensor 優化發揮作用的領域,NVIDIA 產品仍然佔據顯著領先地位。 這有點像先有雞還是先有蛋的情況。 GPU 優化遵循市場飽和,因此隨著特定型號的流行,針對它們的優化也會隨之而來。 如果我們從這裡的性能數字中學到了什麼,很明顯 AMD 正朝著非常積極的方向前進,這當然有助於它們的採用。
如前所述,AMD 真正的王牌是定價。 Radeon PRO W7900 的廠商建議零售價為 3,999 美元,而 NVIDIA RTX A6000 Ada Generation 的建議零售價約為 6,800 美元,而我們在此進行比較的非 Ada 大約為 5,400 美元。 使用 AMD 卡每美元獲得的相對性能通常對它有利。
總的來說,我們很高興新的 Radeon PRO 卡將小芯片架構引入 GPU。 我們也喜歡 AMD 的前瞻性技術,尤其是首次包含 DisplayPort 2.1。 這些來自 Team Red 的新產品在某些情況下可以勝過 NVIDIA,而在其他情況下則不能,而且總體而言,就其價格點和受眾而言,它們的表現似乎不錯。 擁有更多選擇對行業來說是一場胜利,很明顯,AMD 表明它打算成為工作站 GPU 市場的有力競爭者。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | 不和 | RSS訂閱