首頁 消費者客戶端配件 NVIDIA RTX A6000 評測

NVIDIA RTX A6000 評測

by 萊爾·史密斯
英偉達 RTX A6000

NVIDIA RTX A6000 是該公司採用第二代 RTX 架構的最新版本。 新 GPU 將 10,752 個 CUDA 處理核心與其 84 個下一代 RT 核心相結合,在實時光線追踪和專業的最終幀光線追踪輸出方面提供一流的性能。 儘管 NVIDIA 將 RTX A6000 視為 RTX 6000 的繼任者,但它本質上是 RTX 8000 的直接替代品。

NVIDIA RTX A6000 是該公司採用第二代 RTX 架構的最新版本。 新 GPU 將 10,752 個 CUDA 處理核心與其 84 個下一代 RT 核心相結合,在實時光線追踪和專業的最終幀光線追踪輸出方面提供一流的性能。 儘管 NVIDIA 將 RTX A6000 視為 RTX 6000 的後繼產品,但它本質上是直接替代 RTX 8000.

截至本次評測,RTX 8000 已有大約 3 年曆史,因此很高興終於看到 NVIDIA 以前最好的工作站 GPU 的替代品。 該公司最近停止使用 Quadro 名稱來標識其專業解決方案; 然而,RTX A6000 仍然具有與 Quadro 系列相同的所有專業功能、硬件和軟件認證、認證驅動程序。

英偉達 RTX A6000

NVIDIA RTX A6000 對比 RTX 6000 對比 RTX 8000

RTX A6000 是一個巨大的升級,無論你將它與哪一張上一代卡進行比較,提供更逼真的運動物體輸出並支持硬件加速運動模糊(後者用於在渲染時提高最終圖像的整體真實感移動物體)。 它還具有加速的 AI 去噪功能,這意味著使用更少的渲染通道獲得更高質量的輸出,從而縮短渲染時間。 而且,A6000是NVIDIA首款支持PCIe Gen4標準的專業顯卡。

新的 NVIDIA 卡將 RTX 6000 的內存大小增加了一倍,達到 48GB 的​​ GDDR6(與 RTX 8000 相同),使其能夠處理更大的 3D 數據集。 這也意味著創意專業人士可以渲染大型 3D 場景,而無需降低場景的複雜性。 對於預算和工作量較大且需要超過 48GB 內存的專業人士,可以通過 NVIDIA NVLink 連接兩張 A6000 卡以獲得 96GB 的組合 GPU 內存。

Nvidia RTX A6000 風扇特寫

也許 RTX A6000 最重要的升級是 NVIDIA安培,採用三星 8 納米 NVIDIA 定制工藝的全新架構,擁有 28 億個晶體管。 正如您將在下面的性能圖表中看到的那樣,在我們的大多數測試中,這種新架構將使 RTX 6000 脫穎而出。

安培的其他亮點包括:

  • 改進的流式多處理器
  • 第二代光線追踪核心,改進了光線追踪硬件加速
  • 第三代 Tensor Cores,提高 AI 推理性能和 DLSS,從而在更高分辨率下實現更好的性能

與上一代模型相比,Ampere 架構還將 CUDA 內核增加了兩倍的單精度浮點數。 這意味著 3D 模型開發和計算機輔助工程的桌面模擬等計算領域的性能顯著提高。

NVIDIA RTX A6000 與 RTX 3090

是的,RTX A6000 是 RTX 8000 的直接替代品,技術上是 RTX 6000 的繼任者,但實際上它在許多方面更符合 RTX 3090,就規格和潛在性能輸出而言。 這兩款卡都採用了新的 Ampere (8nm) 架構,並具有相似的 CUDA 和 RT 內核數。

兩張卡之間的任何性能差異都可能是由於 RTX 3090 改進了驅動程序優化和更新的 RAM(3090 的 GDDR6X 與 A6000 的 GDDR6)。 儘管如此,RTX A6000 是 NVIDIA 的大規模發布,並且在某些領域的性能幾乎優於市場上的任何其他產品,因此決定哪種卡最適合您實際上取決於您的特定用例,正如我們的評測基準將顯示的那樣。

英偉達RTX A6000正面

NVIDIA RTX A6000 規格

GPU RTX-A6000
卓越的建築 安培
鑄造廠 Samsung
進程大小 8nm
晶體管 28.3十億
模具尺寸 628.4 mm2
CUDA 並行處理核心 10,752
NVIDIA 張量核心 336
NVIDIA RT 核心 84
GPU內存 48 GB GDDR6 帶 ECC
存儲器接口 384-位
內存帶寬 768 GB / s
最大功耗 300W
圖形總線 PCI Express 4.0 x16
顯示器連接器 DP 1.4 (4)
外形 4.4” 高 x 10.5” 長雙槽
產品重量 1.179克
散熱解決方案 上架中
vGPU 軟件支持 NVIDIA GRID、NVIDIA Quadro 虛擬數據中心工作站、NVIDIA 虛擬計算服務器
支持的 vGPU 配置文件 1GB、2GB、3GB、4GB、6GB、8GB、

12 GB,16 GB,24 GB,48 GB

NVIDIA® 3D Vision® 和 3D Vision Pro 通過 3 針迷你 DIN 支持
幀鎖 兼容(與 Quadro Sync II)
NVLink 2 路薄型(2 槽和 3 槽橋)

連接 2 個 RTX A6000

NVLink 互連 112.5 GB/秒(雙向)
電源連接器 1 個 8 針 CPU
NVENC | NVDEC公司 1x | 2x(+AV1 解碼)

性能

為了衡量其性能,我們對 RTX A6000 進行了一系列資源密集型測試,並將其與 RTX 8000 和 RTX 3090 FE 進行了比較。 我們在這兩個地方都安裝了 RTX A6000 惠普 ZCentral 4RP620 工作站,RTX 8000 也在我們的一些基準測試中使用了它:

惠普 ZCentral 4R:

  • Intel Xeon 2295(3.0 GHz 基本頻率,採用 Intel vPro 技術最高可達 4.6 GHz)
  • 64GB DDR4-2933 ECC 內存
  • 1TB M.2 固態硬盤

聯想 ThinkStation P620:

  • AMD Ryzen Threadripper Pro 3995WX 處理器(2.70 GHz,最高 4.20 GHz Max Boost,64 核,128 線程,32 MB 緩存)
  • DDR64 RAM的4GB
  • 1TB PM981 固態硬盤

我們在定制的消費者版本中安裝了 RTX 8000 和 RTX 3090,用於我們的 Blender 和 LuxMark 測試:

  • AMD Ryzen 9 3900X
  • 4x8GB (32GB) G.Skill TridentZ Neo 3600MHz CL16
  • 2TB 三星 970 Pro
  • 華擎 X570 太極 (BIOS v4.00, PCIe Gen4)

SPECviewperf 2020

首先是 SPECviewperf 2020 基準測試,這是衡量在 OpenGL 和 Direct X 應用程序編程接口下運行的專業應用程序圖形性能的全球標準。 視圖集(或基準)表示來自實際應用程序的圖形內容和行為,而無需自己安裝應用程序。 這些視圖集包括 3D Max、CATIA、Creo、Energy、Maya、Medical、Siemens NX 和 Solidworks。

備註:我們在本次測試中使用了 4K 分辨率 (3800 x 2120),兩者均安裝在 HP ZCentral 4R 中。

視圖集 英偉達 RTX A6000
聯想ThinkStation P620
英偉達 RTX A6000
惠普 ZCentral 4R
英偉達 RTX 8000
聯想ThinkStation P620
3dsmax-07 131.96 127.89 110.01
卡地亞-06 90.99 75.32 69.37
Creo-03 125.88 99.54 108.11
能量-03 42.22 38.83 27.11
瑪雅-06 314.82 273.01 238.84
醫療-03 34.87 30.58 27.67
SNX-04 450.72 422.01 375.83
SW-05 161.4 152.19 136.5

對於此基準測試,RTX A6000 在兩個工作站中都比上一代模型有了顯著改進,尤其是在西門子 NX 類別中。 正如我們之前所說,Ampere 架構是性能的巨大飛躍,因此這當然是意料之中的,您會在我們的其他基準測試中看到這種性能趨勢。

接下來,我們運行了 SPECworkstation3,這是一項專門用於測試工作站性能所有關鍵方面的基準測試; 它使用 30 多個工作負載來測試 CPU、圖形、I/O 和內存帶寬。 工作負載屬於更廣泛的類別,例如媒體和娛樂、金融服務、產品開發、能源、生命科學和一般運營。 我們將列出每個類別的大類結果,而不是單獨的工作負載。 結果是每個類別中所有單個工作負載的平均值。

SPEC工作站3

分類 英偉達 RTX A6000
聯想ThinkStation P620
英偉達 RTX A6000
惠普 ZCentral 4R
NVIDIA RTX 8000
聯想ThinkStation P620
6.04 3.49 3.82
產品開發 5.49 3.63 3.97
生命科學 4.61 3.76 4.07
能源 5.58 2.79 沒有完成
FSI 9.49 3.38 4.08
通用操作 2.14 1.63 2.1
GPU計算 7.44 7.22 5.88

總的來說,當安裝在 P620 中時,我們看到大多數類別的性能又一次顯著飛躍,有時是 RTX 8000 的兩倍多。當在 HP ZCentral 工作站中安裝時,它顯示的數字較低,GPU 計算除外.

環境系統研究所 (Esri)

接下來是環境系統研究所 (Esri) 基準。 Esri 是地理信息系統 (GIS) 軟件的供應商,而他們的性能團隊設計了他們的 PerfTool 插件腳本來自動啟動 ArcGIS Pro。

此應用程序使用“ZoomToBookmarks”功能瀏覽各種預定義的書籤,並創建一個日誌文件,其中包含預測用戶體驗所需的所有關鍵數據點。 該腳本自動循環書籤三次以說明緩存(內存和磁盤緩存)。 換句話說,該基準模擬了人們可能會通過 Esri 的 ArcGIS Pro 軟件看到的大量圖形使用。

測試由三個主要數據集組成。 兩個是賓夕法尼亞州費城和魁北克省蒙特利爾的 3-D 城市景觀。 這些城市視圖包含覆蓋在地形模型和覆蓋航拍圖像上的帶紋理的 3-D 多面體建築物。 第三個數據集是俄勒岡州波特蘭地區的二維地圖視圖。 此數據包含有關道路、土地利用地塊、公園和學校、河流、湖泊和山丘陰影地形的詳細信息。

首先是蒙特利爾。 在這裡,RTX A6000 達到了 614.03 的平均 FPS 和 238.18 的最低 FPS。

ESRI ArcGIS Pro 2.3 蒙特利爾
平均 FPS
NVIDIA RTX 8000 471.58
英偉達 RTX A6000 614.03
最低幀率
NVIDIA RTX 8000 220.36
英偉達 RTX A6000 238.18

接下來是費城,RTX A6000 的平均 FPS 達到 542.70,最低 FPS 達到 237.54。

ESRI ArcGIS Pro 2.3 費城
平均 FPS
NVIDIA RTX 8000 509.31
英偉達 RTX A6000 542.70
最低幀率
NVIDIA RTX 8000 271.01
英偉達 RTX A6000 237.54

我們的最後一個模型是波特蘭。 在這裡,RTX A6000 的平均 FPS 為 2,756.82,最低 FPS 為 906.17。

ESRI ArcGIS Pro 2.3 波特蘭
平均 FPS
NVIDIA RTX 8000 2,270.52
英偉達 RTX A6000 2,756.82
最低幀率
NVIDIA RTX 8000 965.13
英偉達 RTX A6000 906.17

混合器

接下來是無處不在的 Blender,這是一款開源 3D 建模應用程序。 該基準測試是使用 Blender Benchmark 實用程序運行的。 NVIDIA OptiX 是選擇的渲染方法,而不是 CUDA,因為 A6000 及其同類產品可以使用 RTX。 在這個以秒為單位的基準測試中,越低越好。

在惠普和聯想工作站中,A6000 在所有類別(Koro 除外)上都比 RTX 8000 表現出巨大的進步。 儘管它在所有類別中都落後於 RTX 3090,但 RTX A6000 為遊戲巨頭 GPU 提供了資金支持。

NVIDIA RTX A6000 Blender 結果

勒克斯馬克

LuxMark 是開源 3D 渲染引擎 LuxRender 維護人員的 OpenCL 跨平台基準測試工具。 該工具著眼於 3D 建模、照明和視頻工作領域的 GPU 性能。 對於這次審查,我們使用了最新版本 v4alpha0。 在 LuxMark 中,分數越高越好。

在食品渲染類別中,RTX A6000 在聯想 P8,088 中得分為 620,是 RTX 8000(發布的 3,337)的兩倍多,略微落後於 RTX 3090(發布的 8,929)。 在 Hallbench 渲染類別中,新的 NVIDIA 卡再次以 20,983(對比 9,794)是上一代卡的兩倍多,同時落後於 RTX 3090 的 23,555。 在 HP ZCentral 4R 中,RTX A6000 在食品和 Hallbench 類別中的得分分別為 7,123 和 20,246。

NVIDIA RTX A6000 LuxMark 結果

辛烷值台

最後,我們看看 OctaneBench。 這是 OctaneRender 和另一個支持 RTX 的 3D 渲染器(類似於 V-Ray)的基準測試實用程序。

RTX A6000總分:664.40
聯想ThinkStation P620
風景 核心 小姐/秒 重量 總分
室內 資訊頻道 386.4874 7.502 10 18.75424
室內 直接照明 120.6423 6.778 40 67.77658
室內 路徑追踪 60.07888 7.035 50 87.93748
思維 資訊頻道 403.6568 4.694 10 11.73557
思維 直接照明 112.0406 5.323 40 53.22593
思維 路徑追踪 101.651 5.245 50 65.56436
亞視 資訊頻道 369.6832 11.777 10 29.44275
亞視 直接照明 114.5929 7.534 40 75.34053
亞視 路徑追踪 97.79354 7.569 50 94.61449
包裝盒 資訊頻道 423.7369 6.445 10 16.11167
包裝盒 直接照明 93.5092 6.756 40 67.56445
包裝盒 路徑追踪 82.13356 6.107 50 76.33231

 

RTX A6000總分:總分:651.2823
惠普 ZCentral 4R
風景 核心 小姐/秒 重量 總分
室內 資訊頻道 381.9805 7.414 10 18.53555
室內 直接照明 119.4807 6.712 40 67.12399
室內 路徑追踪 58.97741 6.906 50 86.32525
思維 資訊頻道 393.9745 4.582 10 11.45408
思維 直接照明 109.6025 5.207 40 52.06769
思維 路徑追踪 99.80163 5.15 50 64.37154
亞視 資訊頻道 363.1271 11.568 10 28.92061
亞視 直接照明 112.0573 7.367 40 73.67342
亞視 路徑追踪 95.76828 7.412 50 92.65507
包裝盒 資訊頻道 414.6209 6.306 10 15.76505
包裝盒 直接照明 91.09318 6.582 40 65.81877
包裝盒 路徑追踪 80.23866 5.966 50 74.57125

在這裡,我們看到在惠普和聯想工作站內部使用時的總分分別為 664.40 和 651.28,這與 RTX 3090(總分 671.02)非常相似。 此外,這比 RTX 8000(總分 315.02)的得分高出一倍多。

結論

至少可以說,RTX A6000 是 NVIDIA 發布的一款令人印象深刻的產品。 這款全新的專業顯卡擁有 10,752 個 CUDA 處理核心,84 個下一代 RT 核心,48GB GDDR6 內存,支持 PCI Express 4.0 x16 接口。 新的 NVIDIA 卡將 RTX 6000 的 GPU 內存大小增加了一倍,達到 48GB GDDR6,使其能夠處理更大、更複雜的 3D 數據集。 口袋更大且需要超過 48GB 內存的專業人士可以通過 NVIDIA NVLink 安裝兩張 A6000 卡,以獲得 96GB 的 DDR6 RAM。

雖然 RTX A6000 在技術上是 RTX 6000 的繼任者,但它更像是 RTX 8000 的直接替代品——NVIDIA 以前的頂級工作站 GPU。 即便如此,與上一代模型相比,它也不僅僅是一次迭代升級:它是性能上的巨大飛躍。rtx A6000特寫

那怎麼可能呢? 最重要的因素是 NVIDIA Ampere。 該架構採用三星的 8nm NVIDIA 定制工藝(具有 28 億個晶體管)、改進的流式多處理器、第二代光線追踪核心,以及大幅改進的光線追踪硬件加速。 它還使用第三代 Tensor Core,這有助於提高 AI 推理性能和 DLSS,從而在更高分辨率下獲得更好的性能。 這些只是 Ampere 帶來的一些亮點,因此允許 RTX A8000 提供 巨大 飛躍,這在我們的性能測試中是顯而易見的。

對於有能力(並且有必要)的人來說,另一個有趣的功能是 RTX A6000 對 Quadro Sync II 附加卡的支持。 這允許 GPU 在單個系統(或系統集群)內同步來自各種兼容 GPU 的顯示和圖像輸出,因為每個 Quadro Sync II 卡可以同步最多四個 RTX A6000 卡的輸出。 也就是說,用戶最多可以在一個系統上安裝兩個 Quadro Sync II 卡,這意味著一個帶有八個 GPU 的工作站(每個都有四個活動的獨立顯示輸出)能夠支持多達 32 個同步視頻顯示器。

儘管 RTX A6000 是 RTX 8000 的替代品,但它實際上與 RTX 3090 更具可比性,後者在我們的基準測試中略微落後。 正如我們之前提到的,這種微小的性能差異可能是由於 Quadro 驅動程序優化和更新的 RAM。

rtx a6000端口

那麼,RTX A6000 適合誰,我應該購買 RTX 3090 嗎? 這得看情況。 決定獲得哪個 GPU 應該基於您的工作流程是什麼或者它在短期內可能是什麼。 現在很難拿到任何 RTX 卡,但如果你有能力這樣做,RTX A6000 最適合那些主要從事 CAD 工作的人(更具體地說,在科學領域使用 Creo 和 CATIA 等應用程序) ,因為 RTX 3090 不提供 Quadro 系列卡附帶的必要驅動程序優化。 儘管我們沒有在任何遊戲體驗基準測試中測試 RTX A6000,但 RTX 3090 無疑是金錢所能買到的最好的遊戲 GPU,尤其是對於利用光線追踪和 DLSS 2.0 的遊戲。

綜上所述,基於 Ampere 的 RTX A6000 在某些領域的性能將大大優於市場上的幾乎所有其他產品,因此如果您是需要為桌面工作站配備強大視覺計算 GPU 的專業人士,RTX A6000 是目前最好的卡。

NVIDIA GPU

參與 StorageReview

電子報 | YouTube | LinkedIn | Instagram | Twitter | Facebook | 的TikTokRSS訂閱