首頁 Enterprise AMD 貝加莫/熱那亞-X 評測

AMD 貝加莫/熱那亞-X 評測

by 喬丹拉努斯

XNUMX 月,AMD 宣布更新其 第四代 AMD EPYC(霄龍)系列 專為滿足企業需求所需的專門工作負載而設計的處理器。 這些公告是在 AMD 數據中心和人工智能技術首映式開幕式上發布的,同時推出了第四代 AMD EPYC 4X97 處理器(之前代號為 AMD Bergamo)。 AMD EPYC 4X97 處理器針對 AI 應用程序和在雲中運行的應用程序提供更大的 vCPU 密度和更高的性能。

XNUMX 月,AMD 宣布更新其 第四代 AMD EPYC(霄龍)系列 專為滿足企業需求所需的專門工作負載而設計的處理器。 這些公告是在 AMD 數據中心和人工智能技術首映式開幕式上發布的,同時推出了第四代 AMD EPYC 4X97 處理器(之前代號為 AMD Bergamo)。 AMD EPYC 4X97 處理器針對 AI 應用程序和在雲中運行的應用程序提供更大的 vCPU 密度和更高的性能。

AMD 貝加莫 CPU 插槽

AMD貝加莫

配備 4D V-Cache 的 AMD EPYC Zen 3 處理器(代號 Genoa-X)在最近的一次技術計算中被認定為領先的 x86 服務器 CPU 規範.org 報告。 這些處理器將 3D V-Cache 引入 96 核 Zen 4 芯片,非常適合要求苛刻的技術計算工作負載。

AMD 貝加莫 CPU 9684X

AMD 表示,根據客戶環境調整其產品路線圖可以提供通用、雲原生和技術計算工作負載所需的性能。 AMD 採取的立場是,一種方法並不適用於所有情況。 這些新的 AMD EPYC 處理器就是圍繞這一概念而設計的,旨在為特定工作負載提供更高的性能。

AMD 貝加莫 CPU 9684X 和 9754

應用程序越來越多地針對雲原生工作負載進行設計,從而允許快速開發、部署和更新。 與 Ampere 相比,AMD EPYC 97X4 處理器擁有 128 個核心,可以提供更好的吞吐量,關鍵雲原生工作負載的性能提高了 3.7 倍。

型號 核心 最大線程數 默認熱設計功耗 (W) 基頻 (GHz) 升壓頻率1 (GHz) 三級緩存 (MB)
9754 128 256 360W 2.25 3.10 256
9754S 128 128 360W 2.25 3.10 256
9734 112 224 320W 2.20 3.00 256

為了滿足更快的設計迭代和全面模擬的需求,具有 4D V-Cache 的第四代 AMD EPYC 處理器為計算流體動力學 (CFD)、有限元分析 (FEA) 等技術計算工作負載提供一流的 x3 CPU 、電子設計自動化(EDA)和結構分析。 這些處理器擁有多達 86 個“Zen 96”核心和 4GB 以上的 L1 緩存,可以顯著加快產品開發速度。

型號 核心 最大線程數 默認熱設計功耗 (W) 基頻 (GHz) 升壓頻率1 (GHz) 三級緩存 (MB)
9684X 96 192 400W 2.55 3.70 1,152
9384X 32 64 320W 3.10 3.90 768
9184X 16 32 320W 3.55 4.20 768

AMD 貝加莫和 Genoa-X 基準測試

我們測試了兩個新的 CPU,並通過禁用 SMT 模擬了第三個。 在實驗室中,我們有 9754(128 核 256 線程 Bergamo 芯片)和 9684X(96 核 192 線程 Genoa-X 芯片),具有海量 1.1 GB 3D L3 緩存和比 Genoa 更高的時鐘。 為了模擬第三個,我們在 9754 上禁用了 SMT,因為 AMD 還發布了 9754S Bergamo 芯片,該芯片沒有多線程,只是純核心。 我們對 SMT 禁用芯片的測試將獨立於本次審查。

我們進行了一系列廣泛的基準測試來評估新發布的 AMD Bergamo 和 Genoa-X CPU 的性能。 我們首先對多核和單核配置進行 Cinebench R23 測試,該測試提供了有關這些處理器渲染功能的寶貴見解。

看來應用程序 Cinebench R23 本身在處理如此多線程方面受到限制。 我們注意到 128 個核心的上限,但 96 核心 Genoa-X 3D 緩存的性能確實很出色,這些主題在所有測試中都是常見的。

接下來,我們在 1 億和 10 億位數字級別運行 y-cruncher,以評估它們的計算能力,特別是涉及高度數字運算的任務。

這裡越低越好,我們的 2 處理器 96 核 Genoa 結果經過了一些廣泛的調整,並且能夠提供一些不錯的數字,Genoa-X 和 Bergamo 芯片的庫存配置顯示出一些有希望的調整和調整潛力,以提供一些更令人印象深刻的記錄設置數字。

然後,我們使用 Blender 基準測試,特別是 Monster、Junkshop 和 Classroom 測試,來衡量這些 CPU 在圖形密集型渲染場景中的表現。

在 Blender 基準測試中,512 線程的原始能力真正得到了體現,再次以庫存配置位居榜首。

最後,我們進行了 Geekbench 6 CPU 測試,該測試以廣泛檢查單核和多核操作中的處理器性能而聞名。 這套測試使我們能夠全面了解 AMD Bergamo 和 Genoa-X 處理器的整體功能、優勢和增量改進。

性能概述

以下是每個基準的原始分數。 請記住,我們花了幾個月的時間在 96 核 Genoa 系統上進行調優和配置,並且只運行了新 AMD Bergamo 的庫存配置。

基準 2p/96c 熱那亞 1p/96c 熱那亞-X 1p/128c 貝加莫 2p/128c 貝加莫
Cinebench R23 Multi 116744 93720 103876 102125
Cinebench R23 Single 1294 1301 1098 1089
Cinebench MP 比率 90.22 72.04 94.65 93.75
y 型破碎機 1b 8.882 10.296 9.568 9.184
y 型破碎機 10b 51.071 72.377 80.171 55.683
攪拌機怪物 1700.647985 879.580323 1031.49474 2038.714424
攪拌機垃圾店 1101.839271 605.445705 704.167826 1382.575225
攪拌機教室 869.476693 421.318478 506.665693 1045.959162
Geekbench 6 單CPU 2048 2093 1738 1723
Geekbench 6 CPU 多 20217 21329 18683 17916

AMD 貝加莫人工智能

配備一系列來自頂級供應商的人工智能推理引擎, UL Procyon 人工智能推理基準 迎合廣泛的硬件設置和要求。 基準分數提供了設備上推理性能的方便和標準化的總結。 這使我們能夠比較和對比現實世界中的不同硬件設置,而無需內部解決方案。

處理器 型號 平均推理時間 中位推理時間 總推論計數
2p/96c 熱那亞 移動網V3 3.61毫秒 3.63毫秒 45,800
1p/96c 熱那亞-X 移動網V3 2.71毫秒 2.72毫秒 58,631
1p/128c 貝加莫 移動網V3 3.90毫秒 3.91毫秒 41,538
2p/128c 貝加莫 移動網V3 4.10毫秒 4.16毫秒 40,008
2p/96c 熱那亞 殘差網絡 50 6.36毫秒 6.34毫秒 26,525
1p/96c 熱那亞-X 殘差網絡 50 6.66毫秒 6.64毫秒 25,049
1p/128c 貝加莫 殘差網絡 50 10.14毫秒 10.08毫秒 16,919
2p/128c 貝加莫 殘差網絡 50 8.21毫秒 8.22毫秒 20,842
2p/96c 熱那亞 盜夢空間V4 25.98毫秒 25.99毫秒 6,555
1p/96c 熱那亞-X 盜夢空間V4 29.19毫秒 29.18毫秒 5,879
1p/128c 貝加莫 盜夢空間V4 33.17毫秒 33.04毫秒 5,158
2p/128c 貝加莫 盜夢空間V4 30.63毫秒 30.68毫秒 5,573
2p/96c 熱那亞 深實驗室V3 25.51毫秒 25.33毫秒 5,660
1p/96c 熱那亞-X 深實驗室V3 28.26毫秒 27.86毫秒 5,394
1p/128c 貝加莫 深實驗室V3 32.16毫秒 32.09毫秒 4,708
2p/128c 貝加莫 深實驗室V3 31.16毫秒 30.57毫秒 4,807
2p/96c 熱那亞 優洛V3 34.10毫秒 34.13毫秒 4,818
1p/96c 熱那亞-X 優洛V3 43.59毫秒 43.58毫秒 3,831
1p/128c 貝加莫 優洛V3 44.50毫秒 44.39毫秒 3,739
2p/128c 貝加莫 優洛V3 41.35毫秒 41.38毫秒 4,001
2p/96c 熱那亞 真實ESRGAN 2540.04毫秒 2524.03毫秒 71
1p/96c 熱那亞-X 真實ESRGAN 3725.07毫秒 3720.35毫秒 49
1p/128c 貝加莫 真實ESRGAN 2734.77毫秒 2717.41毫秒 66
2p/128c 貝加莫 真實ESRGAN 2291.66毫秒 2301.35毫秒 79

最後的思考

我們對新的 128 核 AMD Bergamo CPU 進行的測試反映了核心數量增加帶來的預期收益。 就原始性能而言,新的 CPU 可以輕鬆地處理數據和計算密集型任務,幾乎毫不費力。 我們對 3D 渲染和計算應用程序的試驗尤其展示了這些額外核心的真正實力。

AMD Epyc Bergamo CPU 服務器

我們注意到,無論是否啟用 SMT,處理速度均較 96 核 Genoa 顯著提升,凸顯了 AMD 小芯片設計的效率。 隨著我們深入研究先進的超高核心數計算時代,這款 128 核心、256 線程的怪物在機架密度方面樹立了新的基準。

參與 StorageReview

電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱