首頁 企業 NVIDIA Quantum InfiniBand 網絡上的 NVIDIA BlueField DPU 將加速計算提升到新水平

NVIDIA Quantum InfiniBand 網絡上的 NVIDIA BlueField DPU 將加速計算提升到新水平

by 哈羅德弗里茨

史蒂夫·普爾 (Steve Poole) 是全球眾多利用網絡力量的研究人員之一。 這位洛斯阿拉莫斯國家實驗室 (LANL) 的傑出資深科學家預見到,使用加速計算(包括在 NVIDIA Quantum InfiniBand 網絡上運行的數據處理單元 (DPU))可獲得巨大的性能提升。

史蒂夫·普爾 (Steve Poole) 是全球眾多利用網絡力量的研究人員之一。 這位洛斯阿拉莫斯國家實驗室 (LANL) 的傑出資深科學家預見到,使用加速計算(包括在 NVIDIA Quantum InfiniBand 網絡上運行的數據處理單元 (DPU))可獲得巨大的性能提升。

在歐洲和美國,其他 HPC 開發人員正在開發將通信和計算工作卸載到 DPU 的方法。 他們利用 NVIDIA BlueField-2 DPU 內的 Arm 內核和加速器的強大功能為超級計算機增壓。

用於 DPU 的開放 API

Poole 的工作是與 NVIDIA 多年廣泛合作的一部分,該合作的目標是將計算多物理應用程序的速度提高 30 倍。 它包括使用 BlueField 及其 NVIDIA DOCA 軟件框架在計算存儲、模式匹配等方面的開創性技術。

這些努力還將有助於進一步定義 OpenSNAPI,這是一個任何人都可以用來利用 DPU 的應用程序接口。 Poole 主持統一通信框架的 OpenSNAPI 項目,該聯盟為 HPC 應用程序提供異構計算,其成員包括 Arm、IBM、NVIDIA、美國國家實驗室和美國大學。

“DPU 是我們整體解決方案不可或缺的一部分,我看到在不久的將來使用 DOCA 和類似軟件包的巨大潛力,”Poole 說。

快 10-30 倍的閃存

LANL 已經感受到網絡計算的力量,這要歸功於它創建的 DPU 驅動的存儲系統。 Accelerated Box of Flash(ABoF,如下圖所示)將固態存儲與 DPU 和 InfiniBand 加速器相結合,以加速 Linux 文件系統的性能關鍵部分。 它比類似的存儲系統快 30 倍,並將成為 LANL 基礎架構中的關鍵組件。

Flash 加速盒的功能原型。 硬件組件都是標準的,便於採用。 加速器和存儲設備放置在前托架的 U.2 插槽中,同時還有一個用於加速器硬件的內部 PCIe(外圍組件互連高速)插槽。

ABoF 使“更多的科學發現成為可能。 將計算放在存儲附近可以最大限度地減少數據移動並提高模擬和數據分析管道的效率,”LANL 研究員 Dominic Manno 在最近的 LANL 博客中說。

Accelerated Box of Flash 的內部視圖顯示了 NVMe SSD(機箱正面)與 BlueField-2 DPU 的連接。 右上角是加速器的 PCIe 位置。 該演示使用了 Eideticom NoLoad 設備。

企業中的 DPU

我們已經看到相當一部分 DPU 進入主流企業數據中心。 VAST資料 例如,在其新的 Ceres 全閃存存儲節點中使用 DPU。 雖然這是一項有競爭力的技術, 可互換 DPUs 也去創建他們的存儲和分解的 GPU 產品。 顯然,我們處於早期階段,但網絡和系統管理員應該加快了解 DPU 可以做什麼來實現更高效的系統和應用程序交付。

英偉達藍場

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | 的TikTok | RSS訂閱