NVIDIA RTX A4000 是該公司最新桌面專業 GPU 系列的一部分,適用於需要高性能實時光線追踪、AI 加速計算和高性能圖形的桌面工作站。 利用第二代 RTX 架構,NVIDIA 聲稱 A4000 是市場上最強大的專業級單槽 GPU。
NVIDIA RTX A4000 是該公司最新桌面專業 GPU 系列的一部分,適用於需要高性能實時光線追踪、AI 加速計算和高性能圖形的桌面工作站。 利用第二代 RTX 架構,NVIDIA 聲稱 A4000 是市場上最強大的專業級單槽 GPU。
A4000 位於 RTX A5000 的正後方, RTX-A6000 在 NVIDIA 的新系列專業 RTX 卡中,具有 48 個 RT 核心(2nd gen)、192 個第三代 Tensor 核心和 6,144 個 CUDA 核心以及 16 GB 顯存。 雖然 NVIDIA 放棄了 Quadro 名稱以區分其專業產品線,但 RTX A4000 仍具有與 Quadro 產品線相同的專業功能、硬件和軟件認證以及經過認證的驅動程序。
對於連接性,4.4 英寸高 x 9.5 英寸長的 A4000 具有四個 DisplayPort 1.4a 端口和常用的 1 個 6 針 PCIe 電源端口。 通風沿著每個 DisplayPort 的頂部和卡的正面運行,而較小的風扇位於另一側。
NVIDIA RTX A4000 與 Quadro RTX 4000
NVIDIA 認為 RTX A4000 是 四核RTX 4000,一張老化的卡,在本次審查時已經使用了幾年。 在我們 2019 年的評測中,RTX 4000 作為一款入門級顯卡展示了一些令人印象深刻的性能,使其成為該公司令人印象深刻的產品組合的重要補充,同時發佈時的價格僅為 900 美元左右。 也就是說,隨著 NVIDIA 最近在其 GPU 架構方面取得的進步,我們總是很高興看到他們為工作站級卡存儲的內容。
您馬上就會看到 A4000 將 Quadro 卡的 GPU 內存增加了一倍,達到 16GB,同時幾乎將 CUDA 核心數量增加了三倍。 再加上內存帶寬 (448GB/s) 的輕微增加,新的 A4000 看起來已經好得多了。 這些規格使其更符合 NVIDIA 的高性能桌面消費卡 RTX 3070。
NVIDIA安培
正如我們在我們的 RTX A6000 評測,公司下一代專業顯卡最重要的升級是 NVIDIA安培. 這才是真正的性能飛躍所在。 這種新架構的亮點在於利用三星的 8 納米 NVIDIA 定制工藝和 28 億個晶體管。 它還具有改進的流式多處理器和第二代光線追踪核心(提高光線追踪硬件加速)和第三代張量核心,後者提高了 AI 推理性能和 DLSS,從而在更高分辨率下獲得更好的性能。
與上一代模型相比,Ampere 架構還將 CUDA 內核增加了兩倍的單精度浮點數。 這意味著在 3D 模型開發和計算機輔助工程桌面模擬等任務方面的性能顯著提高。
NVIDIA RTX A3 提供 4000 年保修,根據品牌的不同,售價約為 2,000 美元。
NVIDIA RTX A4000 規格
GPU顯存 | 16 GB GDDR6 |
記憶體介面 | 256-位 |
內存帶寬 | 448 GB / s |
糾錯碼 (ECC) | 充足 |
基於 NVIDIA Ampere 架構的 CUDA 內核 | 6,144 |
NVIDIA 第三代 Tensor Cores | 192 |
NVIDIA 第二代 RT Cores | 48 |
單精度性能 | 19.2 TFLOPS3 |
RT 核心性能 | 37.4 萬億次浮點運算3 |
張量性能 | 153.4 萬億次浮點運算4 |
系統介面 | PCI Express 4.0 x16 |
能量消耗 | 總板功率:140 W |
散熱解決方案 | 活躍 |
外形尺寸 | 4.4” 高 x 9.5” 長,
單槽 |
顯示連接器 | 4 個顯示端口 1.4a |
最大同時顯示 | 4x 4096 x 2160 @ 120 赫茲,
4x 5120 x 2880 @ 60 赫茲, 2x 7680 x 4320 @ 60 赫茲 |
電源連接器 | 1 個 6 針 PCIe |
編碼/解碼引擎 | 1x 編碼,1x 解碼(+AV1 解碼) |
VR就緒 | 充足 |
圖形 API | DirectX 12.075,著色器模型 5.175,
OpenGL 4.686,凡爾康 1.26 |
計算 API | CUDA、DirectCompute、OpenCL™ |
英偉達 RTX A4000 性能
為了衡量其性能,我們對 RTX A4000 進行了一系列資源密集型測試,並將其與更高級別的 RTX A6000 進行了比較,以向您展示第二代 RTX 架構頻譜兩端的差異。 我們將 A4000 和 A6000 安裝在一個 聯想ThinkStation P620 惠普 ZCentral 4R 供測試用。
惠普 ZCentral 4R:
- Intel Xeon 2295(3.0 GHz 基本頻率,採用 Intel vPro 技術最高可達 4.6 GHz)
- 64GB DDR4-2933 ECC 內存
- 1TB M.2 固態硬盤
聯想 ThinkStation P620:
- AMD Ryzen Threadripper Pro 3995WX 處理器(2.70 GHz,最高 4.20 GHz Max Boost,64 核,128 線程,32 MB 緩存)
- DDR64 RAM的4GB
- 1TB PM981 固態硬盤
SPECviewperf 2020
首先是 SPECviewperf 2020 基準測試,這是衡量在 OpenGL 和 Direct X 應用程序編程接口下運行的專業應用程序圖形性能的全球標準。 視圖集(或基準)表示來自實際應用程序的圖形內容和行為,而無需自己安裝應用程序。 這些視圖集包括 3D Max、CATIA、Creo、Energy、Maya、Medical、Siemens NX 和 Solidworks。
視圖集 | NVIDIA RTX 4000 聯想 ThinkStation P620 |
英偉達 RTX A4000 惠普 ZCentral 4R |
英偉達 RTX A6000 聯想ThinkStation P620 | NVIDIA RTX A6000 惠普 ZCentral 4R |
3dsmax-07 | 90.29 | 90.8 | 131.96 | 127.89 |
卡地亞-06 | 67.54 | 58.75 | 90.99 | 75.32 |
Creo-03 | 103.84 | 90.65 | 125.88 | 99.54 |
能量-03 | 21.97 | 22.16 | 42.22 | 38.83 |
瑪雅-06 | 224.81 | 215.15 | 314.82 | 273.01 |
醫療-03 | 22.55 | 21.53 | 34.87 | 30.58 |
SNX-04 | 322.7 | 328.37 | 450.72 | 422.01 |
SW-05 | 107.06 | 108.76 | 161.4 | 152.19 |
對於此基準測試,由於採用了新的 Ampere 架構,RTX A4000 在 Lenovo 和 HP 系統中均表現出出色的性能(結果非常相似)。 您會在我們的其他基準測試中註意到相同的趨勢。
儘管高端型號 (A6000) 的性能差異有時很明顯,但 A4000 仍然可以為最密集的用例提供充足的性能。
接下來,我們運行了 SPECworkstation3,這是一項專門用於測試工作站性能所有關鍵方面的基準測試; 它使用 30 多個工作負載來測試 CPU、圖形、I/O 和內存帶寬。 工作負載屬於更廣泛的類別,例如媒體和娛樂、金融服務、產品開發、能源、生命科學和一般運營。 我們將列出每個類別的大類結果,而不是單獨的工作負載。 結果是每個類別中所有單個工作負載的平均值。
SPEC工作站3
類別 | NVIDIA RTX A4000 聯想 ThinkStation P620 | NVIDIA RTX A4000 惠普 ZCentral 4R |
NVIDIA RTX A6000 聯想 ThinkStation P620 | NVIDIA RTX A6000 HP ZCentral 4R |
我 | 5.87 | 3.37 | 6.04 | 3.49 |
產品開發 | 5.01 | 3.35 | 5.49 | 3.63 |
生命科學 | 3.99 | 3.51 | 4.61 | 3.76 |
能源 | 4.68 | 2.58 | 5.58 | 2.79 |
FSI | 9.46 | 3.96 | 9.49 | 3.38 |
通用操作 | 2.2 | 1.59 | 2.14 | 1.63 |
GPU計算 | 5.25 | 5.19 | 7.44 | 7.22 |
總體而言,我們看到將 A4000 安裝在 P620 內部時的性能更令人印象深刻,有時甚至可以提供與 A6000 相似甚至更好的結果(特別是一般運營和金融服務類別)。 當安裝在 HP ZCentral 工作站內時,A4000 顯示的數字明顯較低,但 GPU 計算類別除外。
環境系統研究所 (Esri)
接下來是環境系統研究所 (Esri) 基準。 Esri 是地理信息系統 (GIS) 軟件的供應商,而他們的性能團隊設計了他們的 PerfTool 插件腳本來自動啟動 ArcGIS Pro。
此應用程序使用“ZoomToBookmarks”功能瀏覽各種預定義的書籤,並創建一個日誌文件,其中包含預測用戶體驗所需的所有關鍵數據點。 該腳本自動循環書籤三次以說明緩存(內存和磁盤緩存)。 換句話說,該基準模擬了人們可能會通過 Esri 的 ArcGIS Pro 軟件看到的大量圖形使用。
測試由三個主要數據集組成。 兩個是賓夕法尼亞州費城和魁北克省蒙特利爾的 3-D 城市景觀。 這些城市視圖包含覆蓋在地形模型和覆蓋航拍圖像上的帶紋理的 3-D 多面體建築物。 第三個數據集是波特蘭或地區的二維地圖視圖。 此數據包含有關道路、土地利用地塊、公園和學校、河流、湖泊和山丘陰影地形的詳細信息。
首先是蒙特利爾。 在這裡,RTX A4000 在 P471.31 中達到了 194.66 的平均 FPS 和 620 的最低 FPS。 HP ZCentral 4R 配置顯示平均 FPS 為 349.32,最低 FPS 為 167.86。
ESRI ArcGIS Pro 2.3 蒙特利爾 | |
平均 FPS | |
NVIDIA RTX A4000(ThinkStation P620) | 471.31 |
NVIDIA RTX A4000(HP ZCentral 4R) | 349.32 |
英偉達 RTX A6000 | 614.03 |
最低幀率 | |
NVIDIA RTX A4000(ThinkStation P620) | 194.66 |
NVIDIA RTX A4000(HP ZCentral 4R) | 167.86 |
英偉達 RTX A6000 | 238.18 |
接下來是費城。 在這裡,RTX A4000 的平均 FPS 為 323.15,P164.68 的最低 FPS 為 620。 HP ZCentral 4R 配置顯示平均和最低 FPS 分別為 363.24 和 202.02。
ESRI ArcGIS Pro 2.3 費城 | |
平均 FPS | |
NVIDIA RTX A4000(ThinkStation P620) | 323.15 |
NVIDIA RTX A4000(HP ZCentral 4R) | 363.24 |
英偉達 RTX A6000 | 542.70 |
最低幀率 | |
NVIDIA RTX A4000(ThinkStation P620) | 164.68 |
NVIDIA RTX A4000(HP ZCentral 4R) | 202.02 |
英偉達 RTX A6000 | 237.54 |
我們的最後一個模型是波特蘭,其中 RTX A4000 的平均 FPS 為 2,305.81,P790.43 內的最低 FPS 為 620。 HP ZCentral 4R 配置顯示平均和最低 FPS 分別為 1,694.04 和 637.65。
ESRI ArcGIS Pro 2.3 波特蘭 | |
平均 FPS | |
NVIDIA RTX A4000(ThinkStation P620) | 2,305.81 |
NVIDIA RTX A4000(HP ZCentral 4R) | 1,694.04 |
英偉達 RTX A6000 | 2,756.82 |
最低幀率 | |
NVIDIA RTX A4000(ThinkStation P620) | 790.43 |
NVIDIA RTX A4000(HP ZCentral 4R) | 637.65 |
英偉達 RTX A6000 | 906.17 |
混合器
接下來是無處不在的 Blender,這是一款開源 3D 建模應用程序。 該基準測試是使用 Blender Benchmark 實用程序運行的。 NVIDIA OptiX 是選擇的渲染方法,而不是 CUDA,因為 A4000(如更高端的 A6000)可以使用 RTX。 在這個以秒為單位的基準測試中,越低越好。
雖然 A6000 安裝在 P620 和 HP ZCentral 4R 中時速度幾乎是原來的兩倍,但這是意料之中的,A4000 仍然顯示出同類產品的下一代結果。
勒克斯馬克
LuxMark 是開源 3D 渲染引擎 LuxRender 維護人員的 OpenCL 跨平台基準測試工具。 該工具著眼於 3D 建模、照明和視頻工作領域的 GPU 性能。 對於這次審查,我們使用了最新版本 v4alpha0。 在 LuxMark 中,分數越高越好。
在聯想 P620 內部,RTX A4000 在食物渲染類別中得分為 4,627,而 Hallbench 得分為 12,314。 這些落後於大多數測試驅動器,但同樣,結果仍然不錯,因為其他測試的 GPU 配備了性能更高的組件。
在 HP ZCentral 4R 中,RTX A4000 在食品和 Hallbench 類別中的得分分別為 12,117 和 4,540。
辛烷值台
最後,我們看看 OctaneBench。 這是 OctaneRender 和另一個支持 RTX 的 3D 渲染器(類似於 V-Ray)的基準測試實用程序。
RTX A4000總分:392.47 | |||||
聯想ThinkStation P620 | |||||
風景 | 核心 | 毫秒/秒 | 比 | 重量 | 總分 |
內部(由 Julia Lynen 設計) | 資訊頻道 | 239.64 | 4.651 | 10 | 11.63 |
內部(由 Julia Lynen 設計) | 直接照明 | 71.47 | 4.015 | 40 | 40.15 |
內部(由 Julia Lynen 設計) | 路徑追踪 | 35.13 | 4.113 | 50 | 51.41 |
想法(胡里奧·卡耶塔諾) | 資訊頻道 | 247.17 | 2.874 | 10 | 7.19 |
想法(胡里奧·卡耶塔諾) | 直接照明 | 66.43 | 3.156 | 40 | 31.56 |
想法(胡里奧·卡耶塔諾) | 路徑追踪 | 60.06 | 3.099 | 50 | 38.74 |
亞視(於爾根·阿列克謝耶夫) | 資訊頻道 | 223.54 | 7.121 | 10 | 17.80 |
亞視(於爾根·阿列克謝耶夫) | 直接照明 | 67.25 | 4.421 | 40 | 44.21 |
亞視(於爾根·阿列克謝耶夫) | 路徑追踪 | 57.24 | 4.430 | 50 | 55.38 |
盒子(Enrico Cerica 設計) | 資訊頻道 | 259.13 | 3.941 | 10 | 9.85 |
盒子(Enrico Cerica 設計) | 直接照明 | 55.13 | 3.983 | 40 | 39.83 |
盒子(Enrico Cerica 設計) | 路徑追踪 | 48.12 | 3.578 | 50 | 44.72 |
RTX A4000總分:391.72 | |||||
惠普 ZCentral 4R | |||||
風景 | 核心 | 毫秒/秒 | 比 | 重量 | 總分 |
內部(由 Julia Lynen 設計) | 資訊頻道 | 238.19 | 4.623 | 10 | 11.56 |
內部(由 Julia Lynen 設計) | 直接照明 | 71.49 | 4.017 | 40 | 40.17 |
內部(由 Julia Lynen 設計) | 路徑追踪 | 35.14 | 4.114 | 50 | 51.43 |
想法(胡里奧·卡耶塔諾) | 資訊頻道 | 244.42 | 2.842 | 10 | 7.11 |
想法(胡里奧·卡耶塔諾) | 直接照明 | 66.26 | 3.148 | 40 | 31.48 |
想法(胡里奧·卡耶塔諾) | 路徑追踪 | 59.98 | 3.095 | 50 | 38.68 |
亞視(於爾根·阿列克謝耶夫) | 資訊頻道 | 222.32 | 7.083 | 10 | 17.71 |
亞視(於爾根·阿列克謝耶夫) | 直接照明 | 67.12 | 4.413 | 40 | 44.13 |
亞視(於爾根·阿列克謝耶夫) | 路徑追踪 | 57.19 | 4.426 | 50 | 55.33 |
盒子(Enrico Cerica 設計) | 資訊頻道 | 257.61 | 3.918 | 10 | 9.80 |
盒子(Enrico Cerica 設計) | 直接照明 | 54.97 | 3.971 | 40 | 39.71 |
盒子(Enrico Cerica 設計) | 路徑追踪 | 48.02 | 3.570 | 50 | 44.63 |
在這裡,我們看到在 HP 和 Lenovo 工作站內填充時的總分分別為 392.47 和 391.72。 這大約是 A8000 能力的一半; 然而,對於入門級卡來說,這是一個令人印象深刻的結果,並且肯定比其前身有了跨越式發展。
與更高端的消費級顯卡相比,OctaneBench 官方網站為強大的 RTX 3070 和 3060 TI 以及 RTX 3080(筆記本電腦型號)分別打出了 400 分和 376 分,而 四核RTX 4000 在他們的圖表中僅顯示 228。
結論
RTX A4000 是 NVIDIA 基於第二代 RTX 架構的專業 GPU 產品組合的最新中端版本。 雖然 A6000 是性能卓越且價格昂貴的顯卡,但新的 A4000 是該系列中最實惠的顯卡,具有 6,144 個 CUDA 處理內核、48 個下一代 RT 內核、HDCP 2.2 支持和 PCI Express 4.0 x16 接口。 它還可以連接到最多四個 4096 x 2160 分辨率為 120Hz 的顯示器。 該卡適用於需求適中且預算較少的專業人士,但它仍然可以處理各種資源密集型專業工作負載。
NVIDIA表示這本質上是Quadro RTX 4000的替代品; 但這肯定是一種輕描淡寫的說法,因為新的 A4000 在各個方面都將它從水中吹了出來。 性能更符合廣受歡迎且功能強大的 RTX 3070 的台式機版本。也就是說,新的 NVIDIA 卡將 RTX 4000 的 GPU 內存大小增加了一倍,達到 16GB GDDR6,這使其性能更高在處理複雜的 3D 數據集時。
正如我們之前提到的,這種顯著的性能提升主要歸功於 NVIDIA Ampere,這是一種使用三星 8 納米 NVIDIA 定制工藝的下一代架構。 它還通過改進的流式多處理器、第二代光線追踪核心和相當好的光線追踪硬件加速來突出顯示。
此外,Ampere 使用第三代 Tensor Core 提高 AI 推理性能,而 DLSS 在更高分辨率下顯著提高性能。 Ampere 還有很多,但所有這一切僅僅意味著 RTX A3(與 A4000 一樣)是 GPU 技術的巨大飛躍,與上一代相比,即使是像這樣的入門卡也能顯示出巨大的性能提升。 通過此版本,NVIDIA 為那些買不起高端工作站 GPU 的人提供了使用這一令人印象深刻的架構的機會。
那麼,RTX A4000 適合誰? 使用高級專業應用程序且不需要高端工作站 GPU 的工程師和建築師肯定會發現 A4000 是他們工作負載的理想選擇。 那些需要工作站發揮最佳性能(啟動預算要大得多)的人可能會選擇 NVIDIA 的旗艦產品 RTX-A6000 和介於兩者之間的 A5000。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS訂閱