首頁 Enterprise DPU 生命週期管理需要 Creative 服務器解決方案

DPU 生命週期管理需要 Creative 服務器解決方案

by 哈羅德弗里茨

在數據驅動應用程序主導的時代,長期由 CPU 和 GPU 主導的傳統計算格局正在經歷範式轉變。 隨著企業和機構進入更複雜的計算環境,特別是隨著人工智能 (AI)、大數據分析和雲原生應用領域的蓬勃發展,對處理能力的需求已經發生了變化。 數據處理單元 (DPU) 帶來了另一個元素,但企業中的 DPU 生命週期管理比聽起來要復雜一些。

在數據驅動應用程序主導的時代,長期由 CPU 和 GPU 主導的傳統計算格局正在經歷範式轉變。 隨著企業和機構進入更複雜的計算環境,特別是隨著人工智能 (AI)、大數據分析和雲原生應用領域的蓬勃發展,對處理能力的需求已經發生了變化。 數據處理單元 (DPU) 帶來了另一個元素,但企業中的 DPU 生命週期管理比聽起來要復雜一些。

DPU 生命週期管理 NVIDIA BlueField DPU

NVIDIA BlueField DPU

DPU 通常稱為 SmartNIC 或基礎設施處理單元 (IPU),通過成為計算 (CPU)、圖形 (GPU) 和存儲網絡基礎設施之間的紐帶而發揮著關鍵作用。 DPU 在公共雲和超大規模數據中心部署多年,將常駐工作負載與網絡、安全、存儲和其他通常與數據中心功能相關的基礎設施操作隔離開來。 這種增強的功能將 CPU 和 GPU 從這些任務中解放出來,使它們能夠專注於計算和渲染的主要功能。

DPU 的引入帶來了一系列新的挑戰——如何管理、優化並確保這些單元與現有基礎設施的無縫運行。 DPU 管理變得至關重要,因為它引入了新的複雜性。 適當的管理可確保充分利用 DPU 的潛力,提供諸如減少延遲、提高吞吐量和提高整體系統效率等優勢。

將 DPU 集成到更廣泛的計算生態系統中並確保有效的 DPU 管理、企業和機構可以解鎖新的性能、敏捷性和可擴展性領域。 隨著世界不斷朝著更加以數據為中心的運營邁進,擁抱和管理 DPU 將成為在數字領域保持競爭優勢的基礎。

VMware,DPU 技術興趣背後的驅動力

DPU 已成為計算領域的一項變革性技術,在當今市場上獲得了極大的關注和吸引力。 隨著組織努力應對數據爆炸式增長、工作負載日益複雜以及對更高性能和效率的需求,DPU 已成為一種強大的解決方案。

VMware 一直致力於將其軟件堆棧引入 DPU。 然而,與 DPU 硬件相關的專有、特定於供應商的軟件使集成任務變得更具挑戰性。 當 VMware 擴展時,大門敞開了 DPU 對 vSphere 的支持,使客戶能夠使用其首選的虛擬化堆棧實現通常與雲到數據中心相關的效率。 DPU 也是 vSAN 8 的基本組成部分,可以卸載安全和網絡任務。

DPU 生命週期管理 Riser 1 中的 NVIDIA BlueField DPU

Riser 1 中的 NVIDIA BlueField DPU

VMware 顯然打算隨著時間的推移繼續更多地利用 DPU; 考慮未來某些 vSphere 節點完全由 DPU 驅動、完全不使用 x86 也並非完全不可能。 不過,VMware 已經開始宣傳 DPU 帶來的性能提升。

VMware,在 vSphere 8 上運行 REDIS 鍵值存儲發現啟用 DPU 的主機與未啟用 DPU 的主機的性能相似,但 CPU 核心數減少了 20%。 在另一項測試中,啟用 DPU 的主機吞吐量提高了 36%,事務延遲降低了 27%。

由於 VMware,DPU 的興趣不斷增加,像戴爾這樣的供應商必須找出將 DPU 納入設計的方法,同時又不能忘記 DPU 生命週期管理。 事實是,DPU 本質上是它們自己的計算機,其管理設計為通過以太網或其他管理端口在本地完成。 但這與企業管理硬件生命週期的方式不一致,因此當戴爾採用 DPU 時,他們必鬚髮揮一點創意。

Dell PowerEdge、DPU 和 iDRAC

當您查看 NVIDIA BlueField DPU 的端口端時,它看起來就像一個標準的 NVIDIA ConnectX NIC,帶有一個額外的以太網端口用於管理。 不過,如上所述,企業希望能夠通過通用生命週期管理控制台來管理所有服務器組件。 對於戴爾來說,這意味著 iDRAC。 因此,戴爾必鬚髮揮一點創意,才能建立 iDRAC 識別 DPU 所需的硬件連接。

DPU 生命週期管理 NVIDIA BlueField DPU 端口

NVIDIA BlueField DPU 端口

DPU 本身只需插入轉接卡(具體來說,轉接卡 1A 插槽 2),就像任何 PCIe 卡一樣。 這為 DPU 提供電源並將其連接到系統總線上。 但卡的管理不能像 GPU 一樣通過 PCIe 完成,至少目前不能。 所需要的是一個額外的硬件元件來連接這些點。 在下面的 R750 主板照片中,精明的人會注意到 LOM (NIC) 通常所在的插槽中有一張不同的卡。

帶管理接口卡 (MIC) 的 Dell PowerEdge 主板

帶管理接口卡 (MIC) 的 Dell PowerEdge 主板

當我們仔細觀察管理接口卡 (MIC) 時,我們可以看到它位於板載 LOM 通常所在的位置。 MIC 在 DPU 和服務器 BMC 之間啟用網絡控制器邊帶接口 (NC-SI)。

Dell PowerEdge 管理接口卡 (MIC)

Dell PowerEdge 管理接口卡 (MIC)

使用 iDRAC 進行 DPU 生命週期管理

有一些工具可以幫助您充分利用 DPU 技術。 戴爾的集成戴爾遠程訪問控制器 (iDRAC) 是專為 Dell PowerEdge 服務器設計的綜合管理工具。 它提供了用於遠程服務器監視、管理和控制的高級功能。

iDRAC 提供服務器運行狀況參數的實時監控,使管理員能夠監控 CPU、內存、存儲、電源和溫度等關鍵組件。 iDRAC 簡化了固件更新,包括 BIOS、RAID 控制器和網絡適配器。 這種集中式界面使管理員能夠跨多個服務器管理和部署固件更新,從而確保一致性並減少手動工作。

由於用於 MIC 交換的 LOM 和額外的佈線硬度,戴爾可以通過 iDRAC 管理 DPU,使 DPU 生命週期管理與 PowerEdge 服務器中的所有其他關鍵組件保持一致。 雖然這對於 iDRAC 管理員來說似乎非常簡單,但為實現 DPU 的這種輕鬆管理而進行的幕後工作卻令人印象深刻。

使用 iDRAC 進行 DPU 生命週期管理

使用 iDRAC 進行 DPU 生命週期管理

最後的思考

現在說每個 VMware vSphere 或 vSAN 節點都應該配置 DPU 以利用 vSphere 分佈式服務引擎還為時過早,但很難忽視其好處。 隨著現代工作負載的數量和復雜性不斷增加,以及對新軟件定義服務的需求,服務器 CPU 的負荷不斷增加,用於工作負載處理的計算週期越來越少。 DPU 已廣泛部署在超大規模企業中,以處理更多基礎設施功能並釋放 CPU 週期以用於創收工作負載。

DPU 生命週期管理 MIC 連接器

NVIDIA BlueField DPU 管理端口已連接

雖然 DPU 對 vSphere 的好處是顯而易見的,但在服務器中引入新的加速器會帶來必須解決的新挑戰; 在本例中,這就是 DPU 生命週期管理。 得益於戴爾的一些創造性工程,DPU 可以連接到本機 BMC,並通過 iDRAC 等傳統生命週期工具進行管理。 這對於在數據中心採用新技術產生了很大的影響,並且應該可以簡化戴爾客戶對 DPU 的採用。

vSphere 8 新功能概覽

參與 StorageReview

電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱