首頁 企業 爆炸性的 AI 應用正在推動節能發展

爆炸性的 AI 應用正在推動節能發展

by 哈羅德弗里茨

隨著行業繼續採用 AI 並將其集成到計算基礎設施中,對資源徵稅,能源效率也變得難以維持。 總的來說,加速計算和底層技術提供了開發下一代創新的效率,包括 NVIDIA GPU、NVIDIA AI 和下一代處理器,如新的 第 4 代英特爾至強可擴展 處理器平台引領潮流。

隨著行業繼續採用 AI 並將其集成到計算基礎設施中,對資源徵稅,能源效率也變得難以維持。 總的來說,加速計算和底層技術提供了開發下一代創新的效率,包括 NVIDIA GPU、NVIDIA AI 和下一代處理器,如新的 第 4 代英特爾至強可擴展 處理器平台引領潮流。

隨著第四代英特爾至強可擴展處理器的推出,NVIDIA 及其合作夥伴正在啟動新一代節能 AI 加速計算系統。 當結合 NVIDIA H100 張量核心 GPU,與前幾代系統相比,這些系統可提供更高的性能、更大的規模和更高的效率。

新系統提高了企業 AI 的性能和效率

由 NVIDIA 和英特爾提供支持的新系統將使企業運行工作負載的效率比僅使用 CPU 的數據中心服務器高 25 倍。 提供這種每瓦性能相當於使用更少的功率,這意味著數據中心需要更多功率來加速現代工作負載。

新一代 NVIDIA 加速服務器加快了訓練和推理速度,將能源效率提高了 3.5 倍,這轉化為實際節省,將 AI 數據中心的 TCO 降低了 3 倍。

第 4 代英特爾至強 CPU 支持 PCIe Gen 5

新的第 4 代英特爾至強 CPU 支持 PCIe Gen 5,使從 CPU 到 NVIDIA GPU 和網絡的數據傳輸速率提高了一倍。 增加的 PCIe 通道在每台服務器內提供更高密度的 GPU 和高速網絡。

更快的內存帶寬提高了 AI 等數據密集型工作負載的性能,而每個連接高達 400 Gbps (Gbps) 的網絡速度支持服務器和存儲之間更快的數據傳輸。

來自 NVIDIA 合作夥伴的 NVIDIA DGX H100 系統和服務器提供配備 H100 PCIe GPU 的 NVIDIA DGX H100 系統和服務器捆綁了一個許可證 NVIDIA 人工智能企業,一個端到端、安全、雲原生的 AI 開發和部署軟件套件,為高效的企業 AI 提供了一個完整的平台。

由 NVIDIA Base Command 提供支持的 NVIDIA DGX H100 系統

NVIDIA DGX H100 系統提供了一個由 NVIDIA 基本命令 專為加速數據中心設計的操作系統。 每個系統配備八個 NVIDIA H100 GPU、10 NVIDIA ConnectX-7 網絡適配器和雙第 4 代英特爾至強可擴展處理器,以提供構建大型生成式 AI 模型、大型語言模型、推薦系統等所需的性能。

結合 NVIDIA 網絡,該架構有望大規模增強高效計算,為 AI 訓練和 HPC 工作負載提供比上一代高 9 倍的性能,比未加速的 X20 雙路服務器高 40 到 86 倍。 有了這樣的性能,過去需要 40 天訓練的語言模型可以在不到兩天的時間內完成。

NVIDIA DGX H100 系統是 NVIDIA DGX SuperPOD,提供高達 exaflop 的 AI 性能,這是大規模企業 AI 部署效率的飛躍。

NVIDIA 合作夥伴提升數據中心效率 

對於 AI 數據中心工作負載,NVIDIA H100 GPU 使企業能夠更高效地構建和部署應用程序。

NVIDIA 合作夥伴,包括華碩、Atos、思科、戴爾科技、富士通、技嘉、惠普企業、聯想、QCT 和 Supermicro,預計將很快開始提供新的 H100 GPU 和第 4 代英特爾至強可擴展 CPU 服務器產品組合。

使用 NVIDIA ConnectX-7 網絡和英特爾第 4 代至強可擴展處理器連接服務器將提高效率並減少基礎設施和功耗。 NVIDIA ConnectX-7 適配器支持 PCIe Gen 5 和 400 Gbps 的以太網或 InfiniBand 連接速度,使服務器和存儲之間的網絡吞吐量翻倍。

這些適配器支持高級網絡、存儲和安全卸載。 ConnectX-7 減少了所需的電纜和交換機端口數量,將大型 GPU 加速 HPC 和 AI 集群聯網所需的電力節省了 17% 或更多,並有助於提高這些新服務器的能效。

NVIDIA AI 企業軟件提供全棧 AI 解決方案

這些下一代系統針對 NVIDIA AI Enterprise Suite 進行了優化。 NVIDIA AI Enterprise 在 NVIDIA H100 上運行,可加速數據科學管道。 它簡化了預測性 AI 模型的開發和部署,以自動化基本流程並從數據中獲得快速洞察。

憑藉廣泛的全堆棧軟件庫,包括參考應用程序的 AI 工作流、框架、預訓練模型和基礎設施優化,該軟件為擴大企業 AI 的成功奠定了理想的基礎。

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱