XNUMX 月,AMD 宣布更新其 第四代 AMD EPYC(霄龍)系列 專為滿足企業需求所需的專門工作負載而設計的處理器。 這些公告是在 AMD 數據中心和人工智能技術首映式開幕式上發布的,同時推出了第四代 AMD EPYC 4X97 處理器(之前代號為 AMD Bergamo)。 AMD EPYC 4X97 處理器針對 AI 應用程序和在雲中運行的應用程序提供更大的 vCPU 密度和更高的性能。
XNUMX 月,AMD 宣布更新其 第四代 AMD EPYC(霄龍)系列 專為滿足企業需求所需的專門工作負載而設計的處理器。 這些公告是在 AMD 數據中心和人工智能技術首映式開幕式上發布的,同時推出了第四代 AMD EPYC 4X97 處理器(之前代號為 AMD Bergamo)。 AMD EPYC 4X97 處理器針對 AI 應用程序和在雲中運行的應用程序提供更大的 vCPU 密度和更高的性能。
AMD貝加莫
配備 4D V-Cache 的 AMD EPYC Zen 3 處理器(代號 Genoa-X)在最近的一次技術計算中被認定為領先的 x86 服務器 CPU 規範.org 報告。 這些處理器將 3D V-Cache 引入 96 核 Zen 4 芯片,非常適合要求苛刻的技術計算工作負載。
AMD 表示,根據客戶環境調整其產品路線圖可以提供通用、雲原生和技術計算工作負載所需的性能。 AMD 採取的立場是,一種方法並不適用於所有情況。 這些新的 AMD EPYC 處理器就是圍繞這一概念而設計的,旨在為特定工作負載提供更高的性能。
應用程序越來越多地針對雲原生工作負載進行設計,從而允許快速開發、部署和更新。 與 Ampere 相比,AMD EPYC 97X4 處理器擁有 128 個核心,可以提供更好的吞吐量,關鍵雲原生工作負載的性能提高了 3.7 倍。
型號 | 核心 | 最大線程數 | 默認熱設計功耗 (W) | 基頻 (GHz) | 升壓頻率1 (GHz) | 三級緩存 (MB) |
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.20 | 3.00 | 256 |
為了滿足更快的設計迭代和全面模擬的需求,具有 4D V-Cache 的第四代 AMD EPYC 處理器為計算流體動力學 (CFD)、有限元分析 (FEA) 等技術計算工作負載提供一流的 x3 CPU 、電子設計自動化(EDA)和結構分析。 這些處理器擁有多達 86 個“Zen 96”核心和 4GB 以上的 L1 緩存,可以顯著加快產品開發速度。
型號 | 核心 | 最大線程數 | 默認熱設計功耗 (W) | 基頻 (GHz) | 升壓頻率1 (GHz) | 三級緩存 (MB) |
9684X | 96 | 192 | 400W | 2.55 | 3.70 | 1,152 |
9384X | 32 | 64 | 320W | 3.10 | 3.90 | 768 |
9184X | 16 | 32 | 320W | 3.55 | 4.20 | 768 |
AMD 貝加莫和 Genoa-X 基準測試
我們測試了兩個新的 CPU,並通過禁用 SMT 模擬了第三個。 在實驗室中,我們有 9754(128 核 256 線程 Bergamo 芯片)和 9684X(96 核 192 線程 Genoa-X 芯片),具有海量 1.1 GB 3D L3 緩存和比 Genoa 更高的時鐘。 為了模擬第三個,我們在 9754 上禁用了 SMT,因為 AMD 還發布了 9754S Bergamo 芯片,該芯片沒有多線程,只是純核心。 我們對 SMT 禁用芯片的測試將獨立於本次審查。
我們進行了一系列廣泛的基準測試來評估新發布的 AMD Bergamo 和 Genoa-X CPU 的性能。 我們首先對多核和單核配置進行 Cinebench R23 測試,該測試提供了有關這些處理器渲染功能的寶貴見解。
看來應用程序 Cinebench R23 本身在處理如此多線程方面受到限制。 我們注意到 128 個核心的上限,但 96 核心 Genoa-X 3D 緩存的性能確實很出色,這些主題在所有測試中都是常見的。
接下來,我們在 1 億和 10 億位數字級別運行 y-cruncher,以評估它們的計算能力,特別是涉及高度數字運算的任務。
這裡越低越好,我們的 2 處理器 96 核 Genoa 結果經過了一些廣泛的調整,並且能夠提供一些不錯的數字,Genoa-X 和 Bergamo 芯片的庫存配置顯示出一些有希望的調整和調整潛力,以提供一些更令人印象深刻的記錄設置數字。
然後,我們使用 Blender 基準測試,特別是 Monster、Junkshop 和 Classroom 測試,來衡量這些 CPU 在圖形密集型渲染場景中的表現。
在 Blender 基準測試中,512 線程的原始能力真正得到了體現,再次以庫存配置位居榜首。
最後,我們進行了 Geekbench 6 CPU 測試,該測試以廣泛檢查單核和多核操作中的處理器性能而聞名。 這套測試使我們能夠全面了解 AMD Bergamo 和 Genoa-X 處理器的整體功能、優勢和增量改進。
性能概述
以下是每個基準的原始分數。 請記住,我們花了幾個月的時間在 96 核 Genoa 系統上進行調優和配置,並且只運行了新 AMD Bergamo 的庫存配置。
基準 | 2p/96c 熱那亞 | 1p/96c 熱那亞-X | 1p/128c 貝加莫 | 2p/128c 貝加莫 | |
---|---|---|---|---|---|
Cinebench R23 Multi | 116744 | 93720 | 103876 | 102125 | |
Cinebench R23 Single | 1294 | 1301 | 1098 | 1089 | |
Cinebench MP 比率 | 90.22 | 72.04 | 94.65 | 93.75 | |
y 型破碎機 1b | 8.882 | 10.296 | 9.568 | 9.184 | |
y 型破碎機 10b | 51.071 | 72.377 | 80.171 | 55.683 | |
攪拌機怪物 | 1700.647985 | 879.580323 | 1031.49474 | 2038.714424 | |
攪拌機垃圾店 | 1101.839271 | 605.445705 | 704.167826 | 1382.575225 | |
攪拌機教室 | 869.476693 | 421.318478 | 506.665693 | 1045.959162 | |
Geekbench 6 單CPU | 2048 | 2093 | 1738 | 1723 | |
Geekbench 6 CPU 多 | 20217 | 21329 | 18683 | 17916 |
AMD 貝加莫人工智能
配備一系列來自頂級供應商的人工智能推理引擎, UL Procyon 人工智能推理基準 迎合廣泛的硬件設置和要求。 基準分數提供了設備上推理性能的方便和標準化的總結。 這使我們能夠比較和對比現實世界中的不同硬件設置,而無需內部解決方案。
處理器 | 型號 | 平均推理時間 | 中位推理時間 | 總推論計數 |
---|---|---|---|---|
2p/96c 熱那亞 | 移動網V3 | 3.61毫秒 | 3.63毫秒 | 45,800 |
1p/96c 熱那亞-X | 移動網V3 | 2.71毫秒 | 2.72毫秒 | 58,631 |
1p/128c 貝加莫 | 移動網V3 | 3.90毫秒 | 3.91毫秒 | 41,538 |
2p/128c 貝加莫 | 移動網V3 | 4.10毫秒 | 4.16毫秒 | 40,008 |
2p/96c 熱那亞 | 殘差網絡 50 | 6.36毫秒 | 6.34毫秒 | 26,525 |
1p/96c 熱那亞-X | 殘差網絡 50 | 6.66毫秒 | 6.64毫秒 | 25,049 |
1p/128c 貝加莫 | 殘差網絡 50 | 10.14毫秒 | 10.08毫秒 | 16,919 |
2p/128c 貝加莫 | 殘差網絡 50 | 8.21毫秒 | 8.22毫秒 | 20,842 |
2p/96c 熱那亞 | 盜夢空間V4 | 25.98毫秒 | 25.99毫秒 | 6,555 |
1p/96c 熱那亞-X | 盜夢空間V4 | 29.19毫秒 | 29.18毫秒 | 5,879 |
1p/128c 貝加莫 | 盜夢空間V4 | 33.17毫秒 | 33.04毫秒 | 5,158 |
2p/128c 貝加莫 | 盜夢空間V4 | 30.63毫秒 | 30.68毫秒 | 5,573 |
2p/96c 熱那亞 | 深實驗室V3 | 25.51毫秒 | 25.33毫秒 | 5,660 |
1p/96c 熱那亞-X | 深實驗室V3 | 28.26毫秒 | 27.86毫秒 | 5,394 |
1p/128c 貝加莫 | 深實驗室V3 | 32.16毫秒 | 32.09毫秒 | 4,708 |
2p/128c 貝加莫 | 深實驗室V3 | 31.16毫秒 | 30.57毫秒 | 4,807 |
2p/96c 熱那亞 | 優洛V3 | 34.10毫秒 | 34.13毫秒 | 4,818 |
1p/96c 熱那亞-X | 優洛V3 | 43.59毫秒 | 43.58毫秒 | 3,831 |
1p/128c 貝加莫 | 優洛V3 | 44.50毫秒 | 44.39毫秒 | 3,739 |
2p/128c 貝加莫 | 優洛V3 | 41.35毫秒 | 41.38毫秒 | 4,001 |
2p/96c 熱那亞 | 真實ESRGAN | 2540.04毫秒 | 2524.03毫秒 | 71 |
1p/96c 熱那亞-X | 真實ESRGAN | 3725.07毫秒 | 3720.35毫秒 | 49 |
1p/128c 貝加莫 | 真實ESRGAN | 2734.77毫秒 | 2717.41毫秒 | 66 |
2p/128c 貝加莫 | 真實ESRGAN | 2291.66毫秒 | 2301.35毫秒 | 79 |
最後的思考
我們對新的 128 核 AMD Bergamo CPU 進行的測試反映了核心數量增加帶來的預期收益。 就原始性能而言,新的 CPU 可以輕鬆地處理數據和計算密集型任務,幾乎毫不費力。 我們對 3D 渲染和計算應用程序的試驗尤其展示了這些額外核心的真正實力。
我們注意到,無論是否啟用 SMT,處理速度均較 96 核 Genoa 顯著提升,凸顯了 AMD 小芯片設計的效率。 隨著我們深入研究先進的超高核心數計算時代,這款 128 核心、256 線程的怪物在機架密度方面樹立了新的基準。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱