早在 5000 月的 SIGGRAPH 上,NVIDIA 就宣布了全新的圖形架構 Turing,以及全新的 Quadro RTX GPU。 在當時宣布的幾款新 GPU 中,今天我們將特別關注 NVIDIA Quadro RTX 5000 GPU。 號稱是第一款還使用深度學習和高級著色的光線追踪 GPU。 RTX XNUMX 專為下一代工作負載而設計,具有實時渲染逼真的場景的潛力,這對視頻編輯以及汽車和建築設計師來說是一個福音。
早在 5000 月的 SIGGRAPH 上,NVIDIA 就宣布了全新的圖形架構 Turing,以及全新的 Quadro RTX GPU。 在當時宣布的幾款新 GPU 中,今天我們將特別關注 NVIDIA Quadro RTX 5000 GPU。 號稱是第一款還使用深度學習和高級著色的光線追踪 GPU。 RTX XNUMX 專為下一代工作負載而設計,具有實時渲染逼真的場景的潛力,這對視頻編輯以及汽車和建築設計師來說是一個福音。
新一輪 GPU 浪潮背後的驅動力是 NVIDIA 新圖靈架構。 該公司因其在 GPU 方面的領導地位而備受推崇,並在此基礎上推出了全新的核心 GPU 架構。 體系結構的主題有點太深了,無法進入這裡,但總結一下:圖靈使用了多項硬件改進來取得令人印象深刻的新成果。 對於光線追踪,該架構利用稱為 RT 內核的處理器,可將光和聲音在 3D 環境中傳播的計算速度提高至每秒 10 Giga Rays。 流式多處理器提高了光柵性能並添加了增強的圖形管道和新的可編程著色技術。 Turing 配備了新的 Tensor Core,每秒可提供 500 萬億次張量運算。 Turing 允許用戶利用更多的 CUDA 內核來支持高達每秒 16 萬億次並行浮點運算和 16 萬億次整數運算。
NVIDIA Quadro RTX 5000 專為需要快速有效地處理複雜項目的創意專業人士而設計。 GPU 擁有 3,072 個 CUDA 核心、384 個 Tensor 核心、48 個 RT 核心和 16GB GDDR6 顯存。 如此龐大的硬件數量能夠渲染複雜的模型和具有物理上準確的陰影、反射和折射的場景。 RTX 5000 支持 NVIDIA NVLink,讓用戶可以通過多個 GPU 配置擴展內存和性能。 假設他們的工作站有空間,用戶可以連接兩個 Quadro RTX 5000 GPU,以獲得高達 50GB/s 的帶寬和 32GB 的 GDDR6 顯存。 GPU 還配備了 VirtualLink,可連接到下一代高分辨率 VR 頭戴式顯示器。
NVIDIA Quadro RTX 5000 規格
架構 | 英偉達圖靈 |
GPU內存 | 16GB GDDR6 |
存儲器接口 | 256-位 |
內存帶寬 | 高達 448 GB/秒 |
ECC | 充足 |
NVIDIA CUDA 內核 | 3,072 |
NVIDIA 張量核心 | 384 |
NVIDIA RT 核心 | 48 |
單精度性能 | 11.2 TFLOPS |
張量性能 | 89.2 TFLOPS |
NVIDIA NVLink | 連接 2 個 Quadro RTX 5000 GPU |
NVIDIA NVLink 帶寬 | 50GB/秒(雙向) |
系統介面 | PCI Express 3.0 x 16 |
電源消耗功率 | 總板功率:265W 顯卡總功率:230W 熱解決方案活躍 |
外形 | 4.4” 高 x 10.5” 長,雙槽,全高 |
顯示器連接器 | 4xDP 1.4、1x USB-C |
最大同時顯示 | 4x 4096×2160 @ 120 赫茲 4x 5120×2880 @ 60 赫茲 2x 7680×4320 @ 60赫茲 |
編碼/解碼引擎 | 1X 編碼,2X 解碼 |
VR就緒 | 充足 |
圖形 API | DirectX的12.0 著色器型號5.1 OpenGL 4.5 Vulkan 1.0 計算 API CUDA 直接計算 OpenCL |
性能
為了測試新架構在 NVIDIA Quadro RTX 5000 GPU 中的性能,我們將其安裝在運行 Windows 920 的 Lenovo ThinkSystem P10 工作站中。為了全面了解每張卡的性能,我們利用了多個行業基準測試和 GPU 加速可以充分利用被測卡的軟件。 我們不僅將它與共享 Turning 架構的 NVIDIA Quadro RTX 4000 進行比較,還將與之前的 Pascal Quadro 系列進行比較,包括 P6000是, P5000和 P4000. 對於所選擇的 GPU,這更少,更好,更多。
為了更好地了解這些 GPU 如何從不同的架構擴展,我們提供了下表,總結了 RTX 系列的現狀。 RTX 5000 位於中間插槽,比入門級 RTX 4000 高出一個台階,在兩個更強大的 RTX 6000 和 RTX 8000 兄弟姐妹下方。
NVIDIA Quadro GPU | ||||
---|---|---|---|---|
RTX 4000 | RTX 5000 | RTX 6000 | RTX 8000 | |
GPU內存 | 8GB GDDR6 | 16GB GDDR6 | 24GB GDDR6 | 48GB GDDR6 |
存儲器接口 | 256-位 | 256-位 | 384-位 | 384-位 |
內存帶寬 | 高達 416GB/秒 | 高達 448GB/秒 | 高達 672GB/秒 | 高達 672GB/秒 |
NVIDIA CUDA 內核 | 2,304 | 3,072 | 4,608 | 4,608 |
NVIDIA 張量核心 | 288 | 384 | 576 | 576 |
NVIDIA RT 核心 | 36 | 48 | 72 | 72 |
單精度性能 | 7.1 TFLOPS | 11.2 TFLOPS | 16.3 TFLOPS | 16.3 TFLOPS |
張量性能 | 57.0 TFLOPS | 89.2 TFLOPS | 130.5 TFLOPS | 130.5 TFLOPS |
我們的第一個基準測試是 LuxMark 跨平台 OpenCL 基準測試工具。 LuxMark 基於 LuxCore API,並作為 LuxCoreRender 套件的促銷組件提供。 它使用一個新的基於微內核的 OpenCL 路徑跟踪器作為其基準測試的渲染器,提供了一種獨特的方式來對給定工作站中安裝的 GPU 施加壓力。
勒克斯馬克 | |
---|---|
圖形處理器 | 成績 |
P4000 | 15,303 |
P5000 | 13,170 |
P6000 | 21,297 |
RTX 4000 | 28,338 |
RTX 5000 | 29,404 |
雖然 Pascal GPU 在 LuxMark 上取得了不錯的成績,但在觀察 Turning GPU 時,性能有了明顯的提升。 RTX 5000 以 29,404 分的成績位居榜首,這不足為奇。
接下來是 Arion,這是一個 CUDA 基準測試工具,由 RandomControl 開發,允許工作站在渲染應用程序中對 CPU 或 GPU 施加壓力。 ArionBench 是一款基於 Arion 2 技術的軟件工具,它通過模擬 3D 場景中的光流任務使 CPU/GPU 承受重壓。
阿里昂 | |
---|---|
圖形處理器 | 成績 |
P4000 | 1,865 |
P5000 | 2,738 |
P6000 | 3,731 |
RTX 4000 | 4,484 |
RTX 5000 | 6,193 |
從 Pascal 到 Turing,RTX 5000 的得分又一次大幅躍升,遠遠領先於其他顯卡,明顯快於 P6000。
我們的下一個基準測試利用 SolidWorks 2019 和四個 3D 模型,包括奧迪 R8、建築挖掘機、噴氣發動機和拉力賽車。 Solidworks 是行業領先的 GPU 加速 3D CAD 建模應用程序,可在基於 Windows 的系統上運行。 SolidWorks 由 Dassault Systèmes 開發,全球有超過 165,000 萬名工程師和超過 2019 家公司在使用它。 出於基準測試目的,我們利用了 SolidWorks 4.5 中新的“性能管道”功能。該架構提供了響應速度更快的實時顯示,尤其是對於大型模型。 它利用現代 OpenGL (XNUMX) 和硬件加速渲染在您平移、縮放或旋轉大型模型時保持高水平的細節和幀速率。
在渲染每個模型後,我們的腳本將每個模型旋轉五次並測量完成此任務所需的時間。 然後將其除以渲染的幀數,併計算每部分的平均幀數 (FPS) 分數。
SolidWorks的 | |
---|---|
SolidWorks R8 | 平均 FPS |
P4000 | 198.0232 |
P5000 | 214.9254 |
P6000 | 217.9745 |
RTX 4000 | 211.1824 |
RTX 5000 | 208.8849 |
Solidworks 挖掘機 | 平均 FPS |
P4000 | 186.4832 |
P5000 | 211.9595 |
P6000 | 230.9774 |
RTX 4000 | 259.6056 |
RTX 5000 | 294.2529 |
Solidworks 噴氣發動機 | 平均 FPS |
P4000 | 163.0573 |
P5000 | 198.5351 |
P6000 | 210.411 |
RTX 4000 | 220.6897 |
RTX 5000 | 283.2206 |
Solidworks 拉力賽車 | 平均 FPS |
P4000 | 205.6225 |
P5000 | 219.0114 |
P6000 | 218.4922 |
RTX 4000 | 214.4253 |
RTX 5000 | 217.256 |
有趣的是,與 Pascal 相比,Solidworks R8 和 Rally Car 中的 Turing GPU 的性能略有下降,儘管這些文件可能無法充分利用較新的 GPU。 RTX 5000 確實在 Digger 和 Jet Engine 方面提供了卓越的性能,大大優於其他顯卡。 在我們的 Solidworks 中,我們使用了 beta 顯示模式,這可能是 Audi R8 和 RallyCar 裝配體上出現異常縮放的原因。
接下來是環境系統研究所 (Esri) 基準。 Esri 是地理信息系統 (GIS) 軟件的供應商。 Esri 的性能團隊設計了他們的 PerfTool 插件腳本來自動啟動 ArcGIS Pro。 此應用程序使用“ZoomToBookmarks”功能來瀏覽各種預定義的書籤,並創建一個日誌文件,其中包含預測用戶體驗所需的所有關鍵數據點。 該腳本自動循環書籤三次以說明緩存(內存和磁盤緩存)。 換句話說,該基準模擬了人們可能會通過 Esri 的 ArcGIS Pro 2.3 軟件看到的大量圖形使用。
測試由三個主要數據集組成。 兩個是賓夕法尼亞州費城和魁北克省蒙特利爾的 3-D 城市景觀。 這些城市視圖包含覆蓋在地形模型和覆蓋航拍圖像上的帶紋理的 3-D 多面體建築物。 第三個數據集是俄勒岡州波特蘭地區的二維地圖視圖。 此數據包含有關道路、土地利用地塊、公園和學校、河流、湖泊和山體陰影地形的詳細信息。
查看蒙特利爾模型的繪圖時間,NVIDIA Quadro RTX 5000 的平均繪圖時間為 00:01:31.067,而平均和最小 FPS 分別顯示為 527.636 和 190.775。
ESRI ArcGIS Pro 2.3 蒙特利爾 | |
---|---|
抽獎時間 | 中等 |
Quadro P4000 | 00:01:31.084 |
Quadro P5000 | 00:01:31:082 |
Quadro P6000 | 00:01:31.081 |
四核RTX 4000 | 00:01:31.284 |
四核RTX 5000 | 00:01:31.067 |
平均 FPS | 中等 |
Quadro P4000 | 432.327 |
Quadro P5000 | 489.889 |
Quadro P6000 | 521.551 |
四核RTX 4000 | 502.395 |
四核RTX 5000 | 527.636 |
最低幀率 | 中等 |
Quadro P4000 | 164.546 |
Quadro P5000 | 194.218 |
Quadro P6000 | 190.336 |
四核RTX 4000 | 180.699 |
四核RTX 5000 | 190.775 |
接下來是我們的費城模型,其中 RTX 5000 的平均繪圖時間為 00:01:01.111,而平均和最小 FPS 分別顯示為 531.315 和 224.341。
ESRI ArcGIS Pro 2.3 費城 | |
---|---|
抽獎時間 | 中等 |
Quadro P4000 | 00:02:53.928 |
Quadro P5000 | 00:01:01.109 |
Quadro P6000 | 00:01:01.245 |
四核RTX 4000 | 00:01:00.231 |
四核RTX 5000 | 00:01:01.111 |
平均 FPS | 中等 |
Quadro P4000 | 304.340 |
Quadro P5000 | 451.826 |
Quadro P6000 | 469.879 |
四核RTX 4000 | 434.170 |
四核RTX 5000 | 531.315 |
最低幀率 | 中等 |
Quadro P4000 | 160.152 |
Quadro P5000 | 212.910 |
Quadro P6000 | 207.879 |
四核RTX 4000 | 196.825 |
四核RTX 5000 | 224.341 |
我們的最後一個模型是波特蘭。 此處,RTX 5000 的平均繪製時間為 00:00:32.541。 平均 FPS 顯示為 2,783.547,而最低 FPS 顯示為 1,007.309。
ESRI ArcGIS Pro 2.3 波特蘭 | |
---|---|
抽獎時間 | 中等 |
Quadro P4000 | 00:00:32.426 |
Quadro P5000 | 00:00:32.310 |
Quadro P6000 | 00:00:32.552 |
四核RTX 4000 | 00:00:32.646 |
四核RTX 5000 | 00:00:32.541 |
平均 FPS | 中等 |
Quadro P4000 | 2,051.053 |
Quadro P5000 | 2,057.395 |
Quadro P6000 | 2,343.948 |
四核RTX 4000 | 2,821.928 |
四核RTX 5000 | 2,783.547 |
最低幀率 | 中等 |
Quadro P4000 | 1,179.974 |
Quadro P5000 | 1,189.524 |
Quadro P6000 | 1,282.045 |
四核RTX 4000 | 1,083.260 |
四核RTX 5000 | 1,007.309 |
結論
NVIDIA Quadro RTX 5000 是該公司基於其圖靈架構的較新 GPU 之一。 Turing 將成為 GPU 架構的全新體現,因為 NVIDIA 正在著眼於未來的發展,同時尋求改變現狀。 RTX 5000 面向擁有需要高效快速工作的複雜項目的創意專業人士,其引擎蓋下的硬件令人印象深刻,包括 3,072 個 CUDA 內核、384 個 Tensor 內核、48 個 RT 內核和 16GB GDDR6 內存。 對於需要更高 GPU 性能的用戶,RTX 可以通過 NVIDIA NVLink 使用第二個 GPU 進行擴展。
對於所有應該帶來卓越性能的組件,我們對其進行了一系列新舊測試,只是為了看看它能做什麼。 不出所料,NVIDIA Quadro RTX 5000 在我們的大多數測試中表現最佳。 在 LuxMark 和 Arion 中,RTX 5000 的得分是 P5000 的兩倍多。 RTX 5000 在 Solidworks Digger 和 Jet Engine 基準測試中表現出色。 應該記住,RTX 5000 儘管功能強大,但並不是 Turing GPU 中的頂級產品。
如果創意專業人士正在尋求在大多數領域實現更大的性能飛躍,那麼 NVIDIA Quadro RTX 5000 將符合這一要求。 我們上面的性能結果突出了 RTX 5000 的亮點以及基於 Pascal 的 GPU 表現足夠好的幾個地方。 總體而言,NVIDIA 憑藉 RTX 系列出色地完成了工作,繼續突破桌面創意的可用範圍。 就其本身而言,RTX 5000 很好地填補了中端產品,提供了性能和價格的良好平衡。