英特爾推出了其第四代英特爾至強可擴展處理器(Sapphire Rapids)、英特爾至強 CPU Max 系列(Sapphire Rapids HBM)和英特爾數據中心 GPU Max 系列(Ponte Vecchio)。 它們專為提高數據中心的性能、效率、安全性和人工智能、雲計算、網絡、邊緣計算和超級計算機的能力而構建。 英特爾正在與客戶合作,使用新產品提供定制的解決方案和系統,以滿足大規模的計算需求。
英特爾推出了其第四代英特爾至強可擴展處理器(Sapphire Rapids)、英特爾至強 CPU Max 系列(Sapphire Rapids HBM)和英特爾數據中心 GPU Max 系列(Ponte Vecchio)。 它們專為提高數據中心的性能、效率、安全性和人工智能、雲計算、網絡、邊緣計算和超級計算機的能力而構建。 英特爾正在與客戶合作,使用新產品提供定制的解決方案和系統,以滿足大規模的計算需求。
目前全球有超過 100 億個獨立的 Xeon 處理器在使用。 為什麼他們如此受歡迎? 好吧,它們有多種配置可供選擇,並且設計為可擴展的,允許它們用於廣泛的應用程序和環境。 它們還可以針對特定工作負載或應用程序進行定制,提供一系列安全功能以幫助抵禦惡意軟件和數據洩露等威脅,並且非常節能。
第 4 代英特爾至強可擴展 CPU 型號
新的 Xeon 型號有六個類別,包括 Max 9400、Platinum 8000、Gold 6000、Gold 5000、Silver 4000 和 Bronze 3000,以及 Max 系列。 每個系列都有一系列不同的模型,可以深入到它們的目標用例:
- 性能通用
- 主線通用
- 液冷通用
- 單插座通用(“Q”系列)
- 長壽命使用 (IoT) 通用(“T”系列)
- IMDB/分析/虛擬化優化(“H”系列)
- 5G/網絡優化(“N”系列)
- 雲優化 IaaS(“P”、“V”和“M”系列)
- 存儲和超融合基礎架構優化(“S”系列)
- HPC 優化(即 Intel Xeon CPU Max 系列)
例如,強大的 鉑金8400 處理器專為高級數據分析、人工智能和混合雲數據中心而設計,提供高性能、平台功能和工作負載加速,以及增強的基於硬件的安全性和多路處理。 這些處理器還為每個處理器提供多達 60 個內核(與頂級處理器相比增加了 20 個內核 第三代至強模型)、八個內存通道和 Intel AMX 的 AI 加速。
英特爾至強金6400 黃金5400 處理器針對數據中心和多雲工作負載進行了優化。 它們提供增強的內存速度、容量、安全性和工作負載加速。 英特爾 至強銀 4400 處理器為入門級數據中心計算、網絡和存儲提供基本性能、改進的內存速度和能效。
以下是每個至強 CPU 及其目標用例的詳細概述:
功能 | 第四代英特爾至強可擴展處理器 | 英特爾至強 CPU Max 系列 | |
極限核心數 (XCC) | 中等核心數 (MCC) | 高帶寬內存 (HBM) | |
模具構造 |
使用 MDF 通過英特爾嵌入式多芯片互連橋接器 (EMIB) 連接四個拼貼塊 |
一顆單片機 |
使用 MDF 通過英特爾嵌入式多芯片互連橋接器 (EMIB) 連接四個拼貼塊 |
核心計數 | 多達 60 個活動核心 | 多達 32 個活動核心 | 多達 56 個活動核心 |
TDP範圍 | 225至350W | 125至350W | 350W |
記憶體應用 |
DDR5 @ 4800 (1 DPC)、4400 (2DPC)、16 Gb DRAM、8 通道
英特爾傲騰 PMem 300(Crow Pass)@4400 MT/s |
DDR5 @ 4800 (1 DPC), 4400 (2DPC), 8 通道
64 GB HBM2e 內存,最高 1.14 GB/核心 |
|
英特爾 UPI | UPI 2.0 @ 16 GT/s,最多 4 個超路徑互連 | UPI 2.0 @ 16 GT/s,最多 3 個超路徑互連 | UPI 2.0 @ 16 GT/s,最多 4 個超路徑互連 |
可擴展性 | 1 插座, 2 插座, 4 插座, 8 插座 | 1 插座, 2 插座, 4 插座 | 1個插座,2個插座 |
PCIe/Compute Express 鏈路 | PCIe 5.0(80 通道),
通過 Compute Express Link (CXL) 4 最多支持 1.1 個設備 |
||
安全性 | 英特爾SGX
最小 Enclave 頁面緩存 (EPC) 大小 256 MB |
英特爾 SGX(僅限平面模式) | |
集成 IP 加速器 | Intel QAT、DLB、IAA、DSA(每個最多 4 個設備) | Intel QAT、DLB(每個最多 2 個設備)、Intel DSA、IAA(每個 1 個設備) | 英特爾 DSA(4 台設備) |
第四代英特爾至強可擴展處理器旨在提高性能並應對與人工智能、分析、網絡、安全、存儲和高性能計算 (HPC) 相關的各種計算挑戰。 這些處理器以擁有所有 CPU 中最多的內置加速器而著稱。
據英特爾稱,第四代英特爾至強可擴展客戶可以期待以下方面的平均性能提升:
- 使用內置加速器時每瓦效率提高 9 倍,
- 在優化電源模式下,每個 CPU 可節省 70 瓦電源,性能損失最小,
- 與前幾代產品相比,總擁有成本和功耗降低了 XNUMX%。
第 4 代 Intel Xeon Scalable – 提高能效
新的優化電源模式可為特定工作負載提供高達 20% 的插座功耗節省和不到 5% 的性能影響。 空氣和液體冷卻方面的創新可以進一步降低數據中心的總能耗。
第 4 代英特爾至強可擴展 CPU 配備了大量內置加速器,有助於在平台級別節省功耗並減少額外加速的需求。 這可以幫助他們的客戶實現他們的可持續發展目標。 此外,新推出的優化電源模式預計可節省高達 20% 的插座電源,同時對特定工作負載的性能影響最小。
空氣和液體冷卻方面的創新可以進一步降低數據中心的總能耗。 第 4 代至強處理器也使用 90% 或更多的可再生電力在配備先進水回收設施的英特爾工廠製造。
人工智能性能的新進展
與上一代相比,第 4 代 Xeon 處理器通過使用其 Advanced Matrix Extension (Intel AMX) 加速器實現高達 10 倍的 PyTorch 實時推理和訓練性能,
PyTorch 是一種用於構建和訓練神經網絡的機器學習框架。 實時推理涉及使用經過訓練的神經網絡模型根據新的輸入數據進行實時預測或決策。 更高的 PyTorch 實時推理和訓練性能對於英特爾處理器至關重要,因為它允許它們更高效地運行涉及實時預測或決策的機器學習工作負載。
這在快速準確的預測或決策至關重要的應用程序中特別有用。 此外,機器學習任務的更高性能可以導致更快的模型訓練和更準確的預測,以及使用更大更複雜模型的能力。
因此,英特爾表示,他們新的第四代英特爾至強可擴展處理器可以為自然語言處理提供更多功能,聲稱在大型語言模型上的速度提高了 4 倍。
英特爾的 AI 軟件套件經過了 400 多個機器學習和深度學習 AI 模型的測試,涵蓋各個行業和應用程序,可與開發人員首選的 AI 工具一起使用,以提高生產力並加速 AI 開發。 該套件被設計為可移植的,允許它在工作站上使用並部署在邊緣和雲端。
網絡功能
第四代英特爾至強可擴展處理器還為高性能、低延遲網絡和邊緣工作負載提供專門優化的模型。 這些處理器在推動電信、零售、製造和智慧城市等行業更加軟件定義的未來方面發揮著至關重要的作用。 對於 4G 核心工作負載,內置加速器可幫助提高吞吐量並減少延遲,同時電源管理改進可增強平台的響應能力和效率。
與 3 相比,它們還可以將虛擬化無線電接入網絡 (vRAN) 容量增加一倍rd-gen Xeon 處理器(不消耗更多功率)。 一般來說,具有更高 vRAN 容量的處理器可以更高效、更有效地處理網絡數據流量,例如減少延遲和提高整體性能。 這對於需要實時通信的應用程序尤為重要。
英特爾表示,這將使通信服務提供商的每瓦性能提高一倍,並滿足他們的性能和能效需求。 隨著 vRAN 工作負載數量的變化,vRAN 的增加還將使組織能夠更輕鬆地向上或向下擴展,這意味著網絡資源具有更大的靈活性(例如,無需額外的硬件、電源或基礎設施)。
高性能計算
第四代英特爾至強可擴展和英特爾 Max 系列產品提供可擴展的平衡架構,將 CPU 和 GPU 與 oneAPI 的開放軟件生態系統相結合,用於 HPC 和 AI 中要求苛刻的計算工作負載。 英特爾聲稱,這種架構是專門為解決當今世界上最困難的問題而設計的。
OneAPI 開放軟件是一組工具和庫,允許開發人員使用一組編程接口編寫可在各種硬件平台(包括 CPU、GPU 和其他專用處理器)上運行的代碼。 這可以更輕鬆地為不同的計算環境開發和優化應用程序。
在英特爾的瓊斯農場,StorageReview 了解了 Borealis 的幕後情況。 英特爾、HPE 和阿貢國家實驗室正在努力交付 Aurora 超級計算機,該計算機將與今天宣布的新的第四代 Xeon 和數據中心 GPU 平台一起實施。
Borealis 是一個雙機架微型系統,位於俄勒岡州的瓊斯農場實驗室,用於驗證 Aurora 系統及其新技術。 它具有與 Aurora 相同的架構和設計,並且正在接受測試以驗證軟件和液體冷卻系統的所有組件,然後再在阿貢國家實驗室大規模安裝該系統。
Intel Xeon CPU / GPU Max 系列
英特爾至強 CPU Max 系列是第一款投放市場的具有高帶寬內存的 x86 處理器,無需更改代碼即可加速許多 HPC 工作負載。 該公司將英特爾數據中心 GPU Max 系列稱為其密度最高的處理器,將提供各種外形規格以滿足各種客戶需求。
Xeon CPU Max 系列提供 64GB 的封裝高帶寬內存,可顯著提高 HPC 和 AI 工作負載的數據吞吐量。 與高端的第三代英特爾至強可擴展處理器相比,至強 CPU Max 系列在能源和地球系統建模等各種現實應用中的性能提高了 3 倍。 CPU 帶寬對於 HPC 和 AI 工作負載至關重要,因為它們通常需要在 CPU 和內存之間處理和移動大量數據。 否則,它可能會成為系統性能的瓶頸並導致更長的處理時間。
數據中心 GPU Max 系列在 100 塊封裝中包含超過 47 億個晶體管,可為涉及物理、金融服務和生命科學的工作負載帶來更高的吞吐量。 當與Xeon CPU Max系列結合使用時,該平台在運行開源代碼LAMMPS(大規模原子/分子大規模並行模擬器)分子動力學模擬器時,可以實現比上一代高達12.8倍的性能提升。
英特爾推出了 數據中心 GPU Flex 系列 早在 2022 年 16 月,一款基於 Xe HPG 的卡具有多達 8 個(每個 GPU 16 個)X 內核、16 TFLOPS 和 XNUMXGB 內存容量。
英特爾點播
英特爾按需服務允許客戶擴展或升級大多數第四代英特爾至強可擴展處理器上可用的加速器和硬件增強功能。 該服務由英特爾和硬件供應商管理,包括一個用於許可證訂購的 API 和一個用於許可證配置和激活的軟件代理。
客戶可以選擇在購買時購買按需功能或作為購買後的升級,英特爾還在研究一種計量採用模型,在該模型中,可以根據需要打開和關閉這些功能,並根據費用進行支付用法。 第 4 代 Xeon 處理器的激活模型的引入允許客戶選擇功能齊全的高級 SKU 或在處理器的整個生命週期中隨時添加功能。
On-Demand 的初始供應商包括 H3C、Inspur、Lenovo、Supermicro 和 Variscale,英特爾正在與其他供應商合作制定他們的支持計劃。
芯片級 DRM 或數字版權管理是指控制對某些計算機芯片特性或功能的訪問的技術。 在 Intel On-Demand 的上下文中,芯片級 DRM 可能會用於限制對第四代 Intel Xeon 可擴展處理器的某些特性或功能的訪問,除非通過 On-Demand 服務購買或激活。 這可能會影響維修權,因為這可能會使個人或獨立維修店更難訪問和維修配備英特爾按需服務的系統的某些方面。
在使用和處置技術產品(包括企業 CPU)時,環境可持續性是一個重要的考慮因素。 雖然 Intel On-Demand 可能允許客戶擴展或升級其處理器的功能,但尚不清楚該服務將如何影響產品的環境可持續性。 由於封裝的 TDP 不會隨著激活而改變,因此可能需要考慮未使用功能的能耗以及由於升級或更換而增加電子垃圾的可能性。 對於像英特爾這樣的公司來說,考慮其產品和服務對環境的影響並努力尋求更可持續的解決方案至關重要。
第 4 代英特爾至強可擴展性能 測試
第 4 代英特爾至強可擴展處理器對提高效率的重視在我們的一些早期基準測試中表現出色。 這些新處理器被宣傳為通過改進製造改進和目標工作負載,實現比第 53 代 Xeon 可擴展處理器 3% 的效率(用於通用計算)提高,利用內置加速器將每瓦特平均性能提高 2.9 倍。
除了這些改進之外,新一代中端芯片與上一代頂級型號一樣強大,使其成為數據中心運營商的經濟高效選擇。 這些中端芯片可以以更低的價格提供與旗艦型號相似的性能,從而幫助數據中心優化成本並提高整體效率。
我們有幾個選項來測試 Sapphire Rapids 的性能,為了展示效率改進,我們測試了帶有雙 4Y(8454 美元)至強的中端第四代平台,並將其與第三代頂級平台進行了比較雙 3,995(3 美元)CPU。 通過第四代的新改進,我們的中端系統能夠與上一代旗艦機型保持一致。
CINEBENCH | ||
2 x 第 4 代 8452Y (2.0GHz x 36) | 2 x 第三代 3 (8380GHz x 2.3) | |
多核 | 60075 | 70540 |
單核 | 841 | 985 |
核心倍增器 | 71.40x | 71.63x |
Blender CLI 渲染基準 | ||
2 x 第 4 代 8452Y (2.0GHz x 36) | 2 x 第三代 3 (8380GHz x 2.3) | |
Monster | 652.526942 | 671.145395 |
舊貨店 | 401.119468 | 407.141514 |
課堂 | 308.802541 | 320.507039 |
Total | 1362.448951 | 1398.793948 |
此外,在內部 AI 模型訓練測試中,我們注意到性能提高了大約 5%,第三代 95 為 3 分鐘,而第四代 8380Y 為 90 分鐘。
總體而言,第四代英特爾至強可擴展處理器提供的效率提升使其成為希望降低功耗和成本的數據中心運營商的有吸引力的選擇。 通用處理器在性能和效率之間實現了出色的平衡,使其成為處理各種工作負載的可靠選擇。 我們很高興能夠針對數據中心工作負載測試特定加速器,包括數據存儲加速器。
市場影響
與 第 4 代英特爾至強可擴展處理器終於交付給企業,雲提供商已經擁有這些處理器一段時間了,與 AMD 熱那亞 CPU 在數據中心。 雖然處於高水平,但很容易看到熱那亞龐大的 PCI 通道數並宣布他們是勝利者。 但如今選擇合適的 CPU 遠比這複雜得多。 成本、能源、性能和系統中附加組件的資格之間存在微妙的平衡。 哦,我們不要忽視了解工作負載以使其與正確的 CPU 保持一致的重要性。
所以今天,對於熱那亞或藍寶石急流誰更好的問題沒有簡單的答案。 隨著戴爾、HPE、超微、聯想和其他公司將系統推向市場,這需要時間才能發揮作用。 隨著新的採用 SSD 外形規格 現在在服務器中進行,支持 Gen5 吞吐量,以及新的高速網絡和加速器選項,例如 數據處理單元,比賽正在進行中。 然而,這並不是規格表之爭。 企業 IT 組織有責任盡可能地勤奮和了解情況,以確保他們投資於能夠充分支持其應用程序需求的系統。 這可能是最大的挑戰。 面對如此多的選擇,經驗豐富的 IT 合作夥伴現在可能比以往任何時候都更加重要。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱