Supermicro 在台灣 Computex 2024 上展示最新創新成果,展現了其在液冷解決方案領域的領先地位。這些新解決方案旨在為大規模人工智慧和雲端運算基礎設施提供卓越的效能和效率。
Supermicro 在台灣 Computex 2024 上展示最新創新成果,展現了其在液冷解決方案領域的領先地位。這些新解決方案旨在為大規模人工智慧和雲端運算基礎設施提供卓越的效能和效率。
用於增強性能的液冷機架解決方案
Supermicro 的液冷機架解決方案旨在支援最高密度和 TDP CPU 和 GPU,每個機架提供高達 100kW 的功率和冷卻。這些解決方案在系統 (L10)、機架 (L11) 和叢集 (L12) 層級進行了全面驗證和測試,以確保可靠性和效能。透過基於庫存的加速交貨時間,可以在幾週內完成部署。企業級組件包括冗餘冷卻幫浦和電源、防漏連接器和洩漏偵測系統。
配備多個 CPU 和 GPU 的現代伺服器會產生大量熱量,每台伺服器的熱量高達 10kW,這對傳統空氣冷卻系統構成了挑戰。美超微的液冷解決方案針對人工智慧、高效能運算和分析應用進行了最佳化,這些應用需要比前幾代產品運行溫度更高的先進 CPU 和 GPU 技術。透過整合高效的液體冷卻,Supermicro 減少了伺服器和機架層級的電力需求,從而提高了效能並降低了成本。
高效液體冷卻解決方案的組件
Supermicro 的液冷機架解決方案由多個關鍵組件組成,旨在確保高效能和可靠性,包括:
- 冷卻液分配裝置 (CDU):裝置將冷卻劑循環到冷板,冷卻 CPU 和 GPU。 CDU 具有兩個可熱插拔的冗餘泵送和電源模組,可確保近 100% 的正常運作時間。它支援高達 100kW 的冷卻能力,並包括易於使用的觸控螢幕和用於監視和控制的 WebUI 存取。
- 冷卻液分配歧管 (CDM):CDM 是將冷卻劑分配到每個伺服器並將較熱的冷卻劑返回 CDU 的管道。它們可以垂直和水平放置,以適應不同的機架設計和伺服器類型。
- 軟管和連接器:柔性軟管將冷卻液輸送至 CPU 和 GPU,而單手零滴漏快速斷開器可安全且有效率地維修液冷系統。
- 冷板:它們放置在 CPU 和 GPU 的頂部,透過使冷卻劑流經微型通道來有效冷卻它們。超微冷板旨在減少熱點並實現超低熱阻。
機架級解決方案的先進工程
Supermicro 的液冷機架專為處理各種伺服器而設計,確保為高效能運算環境提供靈活且可擴展的解決方案。整合先進的液體冷卻技術對於保持最佳性能和可靠性至關重要。
受益於機架級液體冷卻的 Supermicro 伺服器包括:
- GPU系統:Supermicro 的 GPU 系統結合了最快的處理器、記憶體和 GPU,適用於 AI/ML、推理和 HPC 應用。這些系統提供 2U、4U 或 8U 配置,支援 4 或 8 個由最新 Intel Xeon 或 AMD EPYC™ 處理器驅動的 NVIDIA® H100 GPU。這些系統具有多達 32 個 DDR5 記憶體 DIMM,可為要求苛刻的工作負載提供緊湊而強大的解決方案。直接晶片 (D2C) 冷卻器用於保持最佳溫度。
- 大雙胞胎:BigTwin 代表了 Supermicro 針對要求嚴格的應用和 HCI 環境的旗艦性能解決方案。該 2U 機櫃支援最多四個節點,每個節點均配備雙 Intel Xeon 處理器、最多 16 個 DDR5 記憶體 DIMM 和多個高速 NVMe 驅動器。網路選項包括 10GbE、25GbE、100GbE 和 200 Gb HDR InfiniBand。
- 胖子雙胞胎:FatTwin 在 4U 機箱中提供高密度、多節點架構,支援單一處理器的 4 或 8 個節點。這些系統提供冷通道可維護性,並針對具有靈活運算和儲存選項的資料中心基礎設施進行了最佳化。
- 超級刀片:SuperBlade 具有共享冷卻、電源和網路基礎設施,並在 20U 機箱中支援多達 8 個刀鋒伺服器。它具有 Intel Xeon 或 AMD EPYC 處理器選項,專為高性能、高能源效率和降低 TCO 而設計。提供進階網路選項,包括 200G HDR InfiniBand。
- 超:X14 Hyper 系列為要求嚴苛的工作負載提供下一代效能。這些伺服器提供 1U 或 2U 配置,支援多達 32 個 DIMM 插槽,並針對最高效能 CPU 的最大運算效能進行了最佳化。
產品系列伺服器描述 |
||
GPU | SYS-421GE-TNHR2-LCC | 雙第四代/第五代英特爾至強處理器 |
4U、32 個 DIMM | ||
NVIDIA HGX H100 8-GPU 板 | ||
AS -4125GS-TNHR2-LCC | 雙第四代 AMD EPYC 4 系列處理器 | |
4U、24 個 DIMM | ||
NVIDIA HGX H-100 8-GPU 板 | ||
SYS-821GE-TNHR | 雙4th 新一代英特爾• 至強• 可擴充處理器 | |
8U、32 個 DIMM | ||
HGX H100 8-GPU SXM5 多 GPU 板 | ||
AS -8125GS-TNHR | 雙4th 第二代 AMD EPYC 9004 系列處理器 | |
8U、24 個 DIMM | ||
NVIDIA HGX H100 8-GPU SXM5 多 GPU 板 | ||
SYS-421GU-TNXR | 雙4th 新一代英特爾• 至強• 可擴充處理器 | |
4U、32 個 DIMM | ||
NVIDIA HGX H100 4-GPU 多 GPU 板 | ||
SYS-421GE-TNR (PCIe) | 雙4th 新一代英特爾• 至強• 可擴充處理器 | |
4U、32 個 DIMM | ||
GPU-NVH100-80,GPU-NVA100-80-NC | ||
AS -4125GS-TNRT (PCIe) | 雙4th 第二代 AMD EPYC 9004 系列處理器 | |
4U、32 個 DIMM | ||
最多 8 張雙寬/單寬卡(全高全長) | ||
NVIDIA H100 和 AMD MI200 系列 | ||
大雙胞胎 | SYS-221BT-HNTR | 雙4th 新一代英特爾• 至強• 可擴充處理器 |
2U、4 節點、16 個 DIMM | ||
SYS-221BT-DNTR | 雙4th 新一代英特爾• 至強• 可擴充處理器 | |
2U、2 節點、16 個 DIMM | ||
胖雙胞胎 | SYS-F511E2-RT | 單人4th/5th Gen Intel• Xeon• 處理器,4U,8 節點,16 個 DIMM |
SYS-F521E3-RTB | 單人4th/5th Gen Intel• Xeon• 處理器,4U,4 節點,16 個 DIMM | |
超級刀片 | SBE-820C/J/J2/L/H-820 | 8U機櫃 |
SBI-421E-1T3N | 雙4th/5th 新一代英特爾• 至強• 處理器 | |
16 個內存條 |
全方位的解決方案
Supermicro 不僅可以為您提供單一液冷伺服器、CDU 和歧管,還可以為您提供整個冷卻塔,將其放置在資料中心之外。這是一個非常有趣的產品,因為它們可以為組織提供完整的解決方案。進一步地,與 超級雲作曲家,客戶可以透過單一管理平台進行全面管理,從單一 CPU 或 GPU 溫度到機架中不同閥門和泵浦速度的位置,甚至冷卻塔。
我們收到了 Super Cloud Composer 的實作演示,其中展示了 AMD MI300X GPU 機架,該機架採用液冷,並作為整體解決方案的一部分包含在內。 Supermicro Super Cloud Composer 平台提供熟悉且易於使用的介面,用於監控和管理您的資料中心。此外,您還可以從 Super Cloud Composer 資料庫中取得詳細的日誌記錄指標,以評估效能運作狀況並查看趨勢,以協助進行預防性主動維護。
我們報告液體冷卻解決方案已經有一段時間了,興趣不斷增長。我們的 Instagram 和 YouTube 影片已獲得數百萬次觀看。事實證明,液體冷卻解決方案可以保持組件冷卻,特別是考慮到領先於人工智慧海嘯所需的繁重處理。
超微液冷機架 從聖荷西的生產線下線。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱