在被 NVIDIA 收購之前,Mellanox 正在研發的一款鮮為人知的產品是名為 BlueField 的數據處理單元 (DPU)。 六年前的推銷與今天的推銷類似,讓存儲(現在是加速器)直接訪問網絡,而無需傳統的 x86 架構。 畢竟,CPU 比 PCIe 交通通道管理更適合用於應用程序。 然而,BlueField 的採用非常緩慢; 如今,很少有商業企業利用 DPU。 NVIDIA 有新的推動力來幫助改變這種狀況。
在被 NVIDIA 收購之前,Mellanox 正在研發的一款鮮為人知的產品是名為 BlueField 的數據處理單元 (DPU)。 六年前的推銷與今天的推銷類似,讓存儲(現在是加速器)直接訪問網絡,而無需傳統的 x86 架構。 畢竟,CPU 比 PCIe 交通通道管理更適合用於應用程序。 然而,BlueField 的採用非常緩慢; 如今,很少有商業企業利用 DPU。 NVIDIA 有新的推動力來幫助改變這種狀況。
為什麼首先使用 DPU?
DPU 的魅力非常迷人,這就是 NVIDIA 為其成功投入巨資的原因。 與廣為人知和喜愛的更傳統的高速以太網 NIC 相比,DPU 只是具有更多的處理能力,使它們看起來更像是微型計算機,而不是數據移動車輛。 不過,公平地說,在存儲環境中,DPU 的主要目標是快速移動數據。 只是現在,這個動作可以在 JBOF 中完成,根本不需要 x86。
我們最近在一些案例中看到了這種情況,一個使用 NVIDIA 產品,另一個使用他們自己的 DPU。 VAST Data 正在利用 數據節點中的 NVIDIA DPU,現在是極其密集的 1U 盒子,可以共享 675TB 的原始閃存。 不過,還有其他路線; Fungible 有一個分解計劃,利用它自己的 DPU。 我們有他們的 實驗室中的存儲陣列,他們最近還宣布了一項 GPU 努力.
如果所有這些 DPU 對話聽起來都讓人不知所措,那也很難怪你。 在很長一段時間內,數據的管理和移動方式都沒有發生根本性的轉變。 我們有一個 在 DPU 上與 NVIDIA 播客 從存儲的角度來看,這是了解市場動態的入門讀物。
DPU 很難
即使在六年或更長時間的工作之後,我們也只看到兩個 DPU 實際運行良好的例子,並且可以說出的公司可能還不到少數甚至涉足實驗室驗證。 這是為什麼? 從系統供應商告訴我們的情況來看,利用 BlueField 確實很困難。 有大量的軟件工作要做,而且迄今為止,這些卡不是簡單的即插即用產品,因此需要的重量要大得多。 再加上傳統存儲公司不願意採用前沿技術以及每個 DPU 都需要不同的編碼方法這一事實,我們幾乎沒有採用 DPU。
NVIDIA 當然認識到這一點,並且迫切需要更快的車輛將數據移動到他們的 GPU 中。 公平地說,客戶也希望如此,尤其是在保持昂貴的 GPU 投資全時運行是一個價格目標的 HPC 工作負載中。 因此,NVIDIA 昨天已經努力幫助緩解這種採用痛苦。
NVIDIA 已成為 Linux 基金會開放可編程基礎設施 (OPI) 項目的創始成員。 從根本上說,NVIDIA 已廣泛提供其 DOCA 網絡軟件 API。 這意味著在 DPU 上運行的繁重集成工作現在應該會更快。
“OPI 項目旨在創建一個社區驅動的、基於標準的開放生態系統,以使用 DPU 加速網絡和其他數據中心基礎設施任務,” 博客文章 來自英偉達。 這當然是一件好事。 以前發現 DPU 牆太高而無法跨越的組織和系統供應商現在應該可以更輕鬆地採用 DPU。
NVIDIA 繼續分享他們打算提供的內容;
DPU 的下一步是什麼?
根據我們從 VAST 和 Fungible 中看到的情況,DPU 世界非常真實,隨時準備對數據中心和雲產生巨大影響。 採用一直具有挑戰性,因為軟件集成很困難。 此外,該硬件並不是 NIC 的直接替代品。 並不是說它被定位成那樣,但這不像通過交換 NIC 從 25GbE 到 200GbE。 集成 DPU 的工作絕非微不足道。
像這樣的舉措應該有助於行業發展,即使只是在 NVIDIA 芯片上。 在使基礎架構更快、更安全並最終更高效方面,DPU 提供了巨大的潛力。 幾乎每個大型組織都致力於綠色計劃,因此數據中心是開始採用與傳統堆棧沒有相同依賴關係的現代基礎設施的好地方。
我們希望這種向開源的轉變能夠擺脫 DPU 的僵局,因為這項技術的可能性非常顯著。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | 的TikTok | RSS訂閱