對於需要尖端效能來應對高要求工作負載的專業人士來說,英特爾至強 w7-2595X CPU 是一次重大飛躍。
英特爾至強 w7-2595X 處理器是至強 W-2500 系列的最新成員,針對高效能工作站應用。它專為人工智慧開發、數據科學、媒體和工程工作負載而設計。這款 26 核心、52 執行緒處理器的最大時脈速度為 4.8 GHz,比以前的型號有所改進,並具有 48.75 MB 的 L3 智慧緩存,可協助處理資料量大的任務。
架構與特徵
Xeon w7-2595X基於Intel 7處理器,設計有26個個性能核心和52個執行緒。這使得它能夠處理繁重的平行工作負載,例如渲染、AI 推理和模擬。時脈速度高達 4.8 GHz,比前幾代有了相當大的改進,特別是在多執行緒應用中。
英特爾顯著擴展了至強 W 平台的運算能力,w7-2595X 受益於增加的 L2 和 L3 緩存,旨在優化資料存取並提高計算密集型場景中的效能。憑藉 48.75 MB 的智慧型緩存,該處理器可以處理大型資料集和密集的多任務處理,而不會出現明顯的延遲。
該處理器支援高達 2TB 的 DDR5 ECC RDIMM,以 4800MT/s 的速度運行,使其適合深度學習模型訓練或大規模模擬等記憶體密集型工作負載。根據英特爾估計,英特爾高階矩陣擴展 (AMX) 的引入進一步增強了人工智慧效能,將人工智慧推理工作負載提高了 3 倍。
另一個關鍵功能是 PCIe 5.0 支持,最多有 64 個通道直接連接到 CPU。這允許進行涉及多 GPU 設定、超快速儲存和網路介面的高級系統配置。無論是 NAS 部署還是高階渲染場,Xeon w7-2595X 都可以相應擴充。
平台整合
Xeon w7-2595X 與英特爾 W790 晶片組配合使用,該晶片組提供額外的 PCIe 通道、整合 Wi-Fi 6E 以及透過英特爾博銳技術增強的安全功能。這使得該平台功能強大,但在企業環境中也安全且易於管理。此外,我們的測試設定中使用的華擎 W790 WS R2.0 主機板展示了處理該處理器功能所需的頻寬和穩定性,特別是在運行多個 GPU 或儲存陣列時。
對於那些關心系統冷卻和電源效率的人來說,值得注意的是 Xeon w7-2595X 的 TDP 高達 250W。然而,透過適當的冷卻解決方案(例如我們的測試設定中使用的 Noctua NH-U14S),系統即使在多執行緒重負載下也能保持穩定。還支援超頻,包括 Intel XMP 3.0 記憶體配置文件,讓愛好者能夠進一步推動他們的系統。
效能聲明和工作負載適用性
英特爾的內部測試表明,Xeon w7-2595X 在從 3D 渲染到 AI 推理的各種專業工作負載中表現出色。 Blender、Adobe Premiere Pro 的 PugetBench 和 Cinebench R23 等基準測試都是處理器的亮點。具體來說,英特爾聲稱,當應用擴展封裝功耗時間視窗等最佳化時,多執行緒工作負載的效能比前幾代產品提高了 6%。
Xeon w7-2595X定位的另一個領域是AI模型訓練和推理。借助對 Intel AMX 的支持,該處理器可以加速矩陣乘法等運算,這對於深度學習工作負載至關重要。結合英特爾 OpenVINO 最佳化,w7-2595X 可提高跨框架的推理效能。
該處理器還透過英特爾博銳技術為企業帶來好處,增強系統安全性、遠端可管理性和穩定性。金融服務、媒體和娛樂以及工程等依賴這些關鍵任務系統的行業將發現這些功能高度相關。
可比較
如上所述,我們將把我們的裝備的結果(華擎 w790 主機板、8 個 96GB DDR5 金士頓 DIMM)與以下各項進行比較:
戴爾 Precision 3680(英特爾酷睿 i9-14900K)
Dell Precision 3680 配備最新一代英特爾酷睿 i9-14900K,這是一款專為遊戲和專業工作負載而設計的高效能 CPU。它採用 24 核心、32 執行緒處理器混合架構,混合了效能核心(P 核心)和高效核心(E 核心),提升時脈速度高達 6.0 GHz。這種架構使 i9-14900K 在受益於高單執行緒效能的應用程式中表現出色,同時仍提供強大的多執行緒處理能力。此設定搭配 64GB DDR5 RAM 和 NVIDIA RTX 6000 Ada Generation GPU,非常適合 3D 渲染、影片編輯和複雜模擬等任務。 i9-14900 K 的高時脈速度使其對於需要快速處理速度的單執行緒應用程式和工作負載特別有效。
AMD Ryzen 9 9950X(啟用 PBO)
AMD Ryzen 9 9950X 是 AMD Zen 5 架構的一部分,透過 16 核心 32 執行緒配置提供效能和效率的結合。我們的測試設備採用華碩 ROG CROSSHAIR X670E HERO 主機板,並由華碩 ROG RYUJIN III 360 AIO 進行冷卻。如前所述,Ryzen 9 9950X 旨在突破 Precision Boost Overdrive (PBO) 的極限。該技術允許 CPU 動態提高時脈速度,同時優化單執行緒和多執行緒任務的效能。它還支援 DDR5 記憶體和 PCIe Gen5,非常適合遊戲、內容創建和軟體開發等要求苛刻的工作負載。我們的測試設備還配備了 XFX Radeon 7900 GRE GPU。
基準測試結果
攪拌機優化
首先是 Blender 基準測試,它使用開源 3D 建模和渲染應用程式來評估效能。此基準測試衡量每分鐘處理的樣本數量,分數越高表示效能越好。
英特爾至強 w7-2595X 全面展現了令人尊敬的性能,在 Monster、Junkshop 和 Classroom 場景中每分鐘得分分別為 307.705、216.70 和 155.83 個樣本。雖然 AMD Ryzen 9 9950X 緊隨其後,但配備英特爾酷睿 i3680-9K 的戴爾 Precision 14900 的性能遠遠優於兩者,得分明顯更高。然而,值得注意的是,這種差異主要是由於戴爾系統對強大 GPU 的依賴,而不是 CPU 本身。
由於 Blender 的 OptiX 基準測試大量利用 GPU 資源,因此 Intel Xeon w7-2595X 的分數不應被視為其僅 CPU 效能的直接衡量標準,而應視為其 CPU 和 GPU 功能的組合。當僅關注 CPU 效能時,Xeon 表現出了穩定、一致的結果,尤其是在多線程任務中,因為它有 26 個核心和 52 個線程,在多核心工作負載方面超過了 Ryzen 9。
Blender OptiX(每分鐘採樣數,越高越好) | 英特爾至強 w7-2595X(26c、52t) | AMD 銳龍 9 9950X PBO(Zen5、16c、32t) | 戴爾Precision 3680 (英特爾酷睿 i9-14900K(24c、32t) |
Monster | 307.705 | 285.489 | 5,805.6 |
舊貨店 | 216.70 | 201.311 | 2,649.8 |
課堂 | 155.83 | 142.251 | 2,800.76 |
Blackmagic RAW 速度測試
我們也開始執行 Blackmagic 的 RAW 速度測試。此基準測試測試 CPU 在處理高解析度視訊播放方面的效能。
Intel Xeon w7-2595X 在 160K CPU 測試中以 8 fps 領先,這可能歸因於其更高的核心數量(26c、52t)。 Ryzen 9 9950X 以 101 fps 落後,配備英特爾酷睿 i3680-9K 的 Dell Precision 14900 也以 108 fps 落後。即使在 8K CUDA 測試中,新的 Xeon CPU 仍以 138 fps 保持競爭力。
Blackmagic RAW 速度測試(越高越好) | 英特爾至強 w7-2595X(26c、52t) | AMD 銳龍 9 9950X PBO(Zen5、16c、32t) | 戴爾Precision 3680 (英特爾酷睿 i9-14900K(24c、32t) |
8K CPU | FPS 160 | 101幀/秒 | FPS 108 |
8K 圖形處理器 | FPS 138 | FPS 119 | FPS 119 |
7-Zip 壓縮
7-Zip 壓縮基準測試評估 CPU 壓縮資料的能力,這項任務受益於高核心數和高效的記憶體處理。
英特爾至強 w7-2595X 在此測試中展現出卓越的性能,總評級為 210.255 GIPS(每秒千兆指令),遠高於上一代英特爾酷睿 i9-14900 K 的 162.318 GIPS。 Xeon 的高核心和執行緒數大大提高了其更有效地處理壓縮工作負載的能力,其卓越的 GIPS 評級和 CPU 使用率指標(例如,2718% 當前 CPU 使用率)就證明了這一點。
儘管 CPU 使用率較高,但 Xeon w7-2595X 仍保持了優於 Core i9 的一致性能優勢。它與 AMD Ryzen 9 9950X 密切競爭,後者在某些情況下獲得了稍高的評級(例如 225.200 GIPS)。這可能意味著 Xeon w7-2595X 特別針對高強度、多執行緒任務進行了最佳化,並且可以有效地利用其核心架構在以 CPU 為中心的應用程式中超越競爭對手。
7-Zip 壓縮基準(越高越好) | 英特爾至強 w7-2595X(26c、52t) | AMD 銳龍 9 9950X PBO(Zen5、16c、32t) | 戴爾Precision 3680 (英特爾酷睿 i9-14900K(24c、32t) |
當前 CPU 使用率 | 2,718% | 1,235% | 1,080% |
電流額定值/使用 | 7.562 吉普斯 | 14.050 吉普斯 | 11.763 吉普斯 |
額定電流 | 205.522 吉普斯 | 173.536 吉普斯 | 127.011 吉普斯 |
產生的 CPU 使用率 | 2714% | 1211% | 1,153% |
結果評級/使用 | 7.559 吉普斯 | 14.436 吉普斯 | 11.099 吉普斯 |
結果評級 | 205.518 吉普斯 | 174.506 吉普斯 | 127.542 吉普斯 |
當前 CPU 使用率 | 5,149% | 3,128% | 3,021% |
電流額定值/使用 | 4.176 吉普斯 | 8.879 吉普斯 | 6.521 吉普斯 |
額定電流 | 215.016 吉普斯 | 277.706 吉普斯 | 197.036 吉普斯 |
產生的 CPU 使用率 | 5095% | 3111% | 3,022% |
結果評級/使用 | 4.227 吉普斯 | 8.868 吉普斯 | 6.523 吉普斯 |
結果評級 | 215.331 吉普斯 | 275.894 吉普斯 | 197.094 吉普斯 |
總 CPU 使用率 | 3,905% | 2,161% | 2,087% |
總評分/使用情況 | 5.893 吉普斯 | 11.652 吉普斯 | 8.811 吉普斯 |
總評分 | 210.255 吉普斯 | 225.200 吉普斯 | 162.318 吉普斯 |
UL Procyon 人工智能推理
UL Procyon AI 推理基準測試 使用不同框架評估 CPU 的 AI 模型推理效能。英特爾至強 w7-2595X 顯示出強大的效能,主要是在使用英特爾的 OpenVINO 工具套件時,多個模型的平均推理時間明顯低於執行 Windows ML 的相同 CPU。例如,在 MobileNet V3 測試中,Xeon 使用 OpenVINO 實現了 0.75 毫秒,而使用 Windows ML 實現了 1.15 毫秒。同樣,對於 Inception V4 和 DeepLab V3 等更複雜的模型,OpenVINO 具有明顯的優勢,推理時間分別為 12.51ms 和 12.69ms,而使用 Windows ML 的推理時間為 15.94ms 和 21.75ms。
與 AMD Ryzen 9 9950X 和 Dell Precision 3680 相比,使用 OpenVINO 的 Xeon w7-2595X 始終優於這兩個系統,展示了優化的 AI 推理庫的優勢。雖然Ryzen 9 在某些模型(例如YOLO V3 和MobileNet V3)中的性能與Xeon 類似,但在測試要求更高的模型時,它通常會滯後,例如Real-ESRGAN,其中採用OpenVINO 的Xeon 完成時間為678.53 毫秒,而Ryzen 的則為2,029.39 毫秒XNUMX 毫秒。
在使用英特爾 OpenVINO 時,英特爾至強 w7-2595X 在此基準測試中表現最佳,並展示了其在 AI 推理任務中的效率。這使其適合涉及推理速度至關重要的人工智慧模型部署的工作負載。
UL Procyon 平均推理時間(越低越好) | 英特爾至強 w7-2595X(26c、52t) (Windows 機器學習) |
英特爾至強 w7-2595X(26c、52t) (英特爾 OpenVINO) |
AMD 銳龍 9 9950X PBO (Zen5、16c、32t) |
戴爾Precision 3680 (英特爾酷睿 i9-14900K(24c、32t) |
移動網V3 | 1.15ms | 0.75ms | 1.03ms | 0.89毫秒 |
殘差網絡 50 | 5.98ms | 5.07ms | 5.59ms | 7.13毫秒 |
盜夢空間V4 | 15.94ms | 12.51ms | 14.86ms | 20.79毫秒 |
深實驗室V3 | 21.75ms | 12.69ms | 21.49ms | 24.05毫秒 |
優洛V3 | 26.61ms | 37.99ms | 26.83ms | 50.92毫秒 |
真實ESRGAN | 1,215.30ms | 678.53ms | 2,029.39ms | 2,413.15毫秒 |
總體得分 | 242 | 316 | 232 | 184 |
y 粉碎機
y-cruncher 基準測試利用 CPU 的多核心和多執行緒功能來衡量計算大量 Pi 數字的運算效率和速度。自 2009 年推出以來,它已成為超頻玩家和硬體愛好者流行的基準測試和壓力測試應用程式。
在本次測試中,英特爾至強w7-2595X表現非常出色,僅用時1秒就完成了10.819億位數字的計算。這明顯快於 AMD Ryzen 9 9950X 和 Dell Precision 3680,後者分別需要 17.494 秒和 22.246 秒。
隨著計算量的增加,預期的效能差距會擴大。對於 2.5 億位數字,Xeon 在 31.393 秒內完成了任務,大大快於 Ryzen 的 50.120 秒和戴爾的 62.443 秒。在 5 億位大關上,Xeon 的優勢更加明顯,完成時間為 70.952 秒,而 Ryzen 為 116.049 秒,戴爾為 138.698 秒。
Xeon w7-2595X 在 y-cruncher 中的卓越效能可歸因於其高核心數量和資源的高效利用,使其能夠更有效地處理密集的運算工作負載。
y-cruncher(總計算時間以秒為單位;越低越好) | 英特爾至強 w7-2595X(26c、52t) | AMD 銳龍 9 9950X PBO(Zen5、16c、32t) | 戴爾Precision 3680 (英特爾酷睿 i9-14900K(24c、32t) |
十億位 | 10.819秒 | 17.494 秒 | 22.246 秒 |
2.5十億 | 31.393秒 | 50.120 秒 | 62.443 秒 |
5十億 | 70.952秒 | 116.049 秒 | 138.698 秒 |
y-粉碎機 BBP
y-cruncher BBP (Bailey-Borwein-Plouffe) 基準測試評估 CPU 在計算 Pi 的大十六進位數字時的效能,重點在於多核心效率和總計算時間。在此基準測試中,英特爾至強 w7-2595X 展示了其可靠的多核心性能和效率。
在1 BBP測試中,新款至強CPU耗時0.584秒,CPU利用率高達3,581.07%,多核心效率高達68.87%。 AMD Ryzen 9 9950X 以 0.326 秒的速度完成了這項測試,但 CPU 使用率 (732.71%) 和多核心效率 (22.90%) 明顯較低,這表明其可用核心的使用效率較低。至強的結果表明,在繁重的計算負載下,其核心的使用更加平衡和高效。
隨著BBP計算次數的增加,Xeon維持了較高的多核心效率,97.50 BBP時達到10%,99.73 BBP時達到100%,總時間分別為5.536秒和60.647秒。儘管 Ryzen CPU 在 1 BBP 測試中速度更快,但在更高的計數下表現出不太一致的效率。這種多核心效率和總計算時間的一致性使 Xeon w7-2595X 成為需要持續多核心效能的工作負載的有力競爭者。
基準 | 英特爾至強 w7-2595X (26c, 52t) |
AMD 銳龍 9 9950X PBO (Zen5、16c、32t) |
戴爾Precision 3680 (英特爾酷睿 i9-14900K(24c、32t) |
1 血壓 | · 總時間:0.584秒
|
|
不適用 |
10 血壓 |
|
|
不適用 |
100 血壓 |
|
|
不適用 |
Geekbench 6
Geekbench 6 基準測試衡量不同平台上的整體系統效能,強調 CPU 效能。此基準測試提供單核心和多核心效能的單獨分數,全面了解處理器在各種工作負載下的效能。您可以在以下位置找到與任何您想要的系統的比較 Geekbench 瀏覽器.
單核心性能
在 Geekbench 6 單核心測試中,英特爾至強 w7-2595X 得分為 2,436,低於 AMD Ryzen 9 9950X(3,346)和英特爾酷睿 i9-14900K(3,059)。這一結果是意料之中的,因為 Geekbench 更傾向於更高的 CPU 時脈速度而不是核心數量,而且 Ryzen 9 和 Core i9 都比 Xeon w7-2595X 具有更高的基礎時脈速度和增強時脈速度。 Ryzen 9 9950X 處於領先地位,這表明它在三者中具有最高的單線程性能,這使其成為嚴重依賴單核性能的任務(例如某些遊戲和輕度計算任務)的更穩健的選擇。
多核心性能
在多核心表現方面,英特爾至強 w7-2595X 的得分為 19,676,略落後於 AMD Ryzen 9 9950X 的 20,801,但優於英特爾酷睿 i9-14900 K 的得分 19,216。 Xeon 相對較高的多核心分數反映了其在工作負載方面的優勢,可以有效利用其 26 個核心和 52 個線程,例如視訊渲染、3D 建模和其他平行任務。儘管如此,Ryzen 9 9950X 在多核心效能方面仍處於領先地位,這可能是由於其結合了更高的時脈速度和高效的核心架構,從而為每個核心提供了更好的效能。與 Xeon 相比,Core i9-14900 K 的競爭性能因其核心數量較少而受到阻礙,儘管它仍然受益於其高時脈速度。
Geekbench 6 (越高越好) |
英特爾至強 w7-2595X(26c、52t) | AMD 銳龍 9 9950X PBO(Zen5、16c、32t) | 戴爾Precision 3680 (英特爾酷睿 i9-14900K(24c、32t) |
CPU單核 | 2,436 | 3,346 | 3,059 |
CPU 多核 | 19,676 | 20,801 | 19,216 |
Maxon Cinebench 結果
- Cinebench R15: 一種較舊的基準測試工具,使用場景渲染任務評估 CPU 效能,主要測量多核心效能。
- Cinebench R20: Cinebench R15 的更新版本,具有更複雜的場景和更高的運算要求,反映現實世界的使用情況並支援更新的指令集。
- Cinebench R23: 基於 R20 構建,具有更長的測試時間來評估熱節流,並包括多核心和單核分數以進行全面的 CPU 性能評估。
- Cinebench 2024 (R24): 最新版本具有要求嚴苛的渲染任務,針對現代 CPU 和擴充負載進行了最佳化,提供多核心和單核心效能結果。
Cinebench R15 多核心性能
在 Cinebench R15 多核心測試中,英特爾至強 w7-2595X 得分為 7,114 cb,緊隨 AMD Ryzen 9 9950X,後者得分為 7,168 cb。結果表明,儘管 Xeon 在此較舊的基準測試版本中並未充分利用其較高的核心數量,但兩種 CPU 在利用多個核心的工作負載中均能有效執行。
Cinebench R20 多核心性能
在 Cinebench R20 中,英特爾至強 w7-2595X 的得分提高到了 18,905 分,超過了 Ryzen 9 9950X 的 18,032 分。這顯示Xeon的26核心52執行緒配置在本次基準測試中開始更有效地利用其平行處理能力,與R15相比,該基準測試使用更複雜的場景,對CPU的要求更高。這使得至強成為可以使用其擴展核心數量的較新多執行緒工作負載的稍微更好的選擇。
Cinebench R23 性能
Cinebench R23 多核心結果顯示,英特爾至強w7-2595X 的領先優勢更為明顯,其得分為48,442 分,而AMD Ryzen 9 9950X 的得分為45,571 分,並且明顯優於戴爾Precision 3680 的上一代英特爾睿酷9K,得分14900 點。這一巨大優勢凸顯了至強在繁重的多執行緒任務中的優勢,可以充分利用其額外的核心和執行緒。然而,在Cinebench R35,108單核心測試中,Xeon得分為23分,落後於Ryzen 1,715 9X(9950分)和Core i2,296-9K(14900分)。這意味著,雖然至強在多執行緒任務中表現出色,但由於時脈速度較低,因此在單執行緒工作負載中競爭力較差。
Cinebench 2024 性能
Cinebench 2024 結果進一步深入了解了這些處理器之間的效能動態。在多核心測試中,英特爾至強w7-2595X得分為2,657分,優於戴爾Precision 3680的1,950分。新的 Xeon CPU 的優勢反映了它對隨著核心數量不斷擴展的工作負載的適用性。相比之下,Cinebench 2024 單核測試中 Xeon 得分為 103 分。這再次顯著低於 Core i9-14900 K 的 131 分,這進一步強化了 Xeon 在單執行緒效能至關重要的場景中的相對劣勢。
基準 | 中央處理器本體 | 英特爾至強 w7-2595X(26c、52t) | AMD 銳龍 9 9950X PBO(Zen5、16c、32t) | 戴爾 Precision 3680(英特爾酷睿 i9-14900K、24c、32t) |
Cinebench R15 | 多核 | 7,114 cb | 7,168 cb | 不適用 |
Cinebench R20 | 多核 | 18,905點 | 18,032點 | 不適用 |
Cinebench R23 | 多核 | 48,442點 | 45,571點 | 35,108點 |
Cinebench R23 | 單核 | 1,715點 | 2,296點 | 2,266點 |
Cinebench 2024 | 多核 | 2,657點 | 不適用 | 1,950點 |
Cinebench 2024 | 單核 | 103點 | 不適用 | 131點 |
但是工作站中的翡翠急流在哪裡?
當要求英特爾發表評論時,英特爾表示對 Emerald Rapids(也稱為第五代 Xeon 可擴展)所做的更改與工作站晶片組不相容,並且會導致 PCIe 通道限制。
結論
英特爾至強 w7-2595X 處理器為高效能工作站應用程式提供了強大的選擇,特別是在 3D 渲染、AI 開發和資料密集型模擬等多核心任務中。其 26 核心、52 執行緒設計、PCIe 5.0 支援以及適用於 AI 工作負載的 Intel AMX 提供了一個強大的平台。雖然與替代產品相比,其單核性能可能無法在基準測試中領先,但 Xeon w7-2595X 展示了可靠的多線程性能,使其成為那些尋求可擴展並行處理能力的人的可靠選擇。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱