首頁 Enterprise NVIDIA Bluefield-2 DPU 提供創紀錄的性能

NVIDIA Bluefield-2 DPU 提供創紀錄的性能

by 哈羅德弗里茨

隨著 NVIDIA BlueField-2 的發布,NVIDIA 繼續推動數據處理單元 (DPU) 的發展。 NVIDIA BlueField-2 DPU 被譽為數據中心片上基礎架構,並針對企業雲和 HPC 工作負載進行了優化。 BlueField-2 將 NVIDIA ConnectX-6 Dx 網絡適配器與一系列 Arm 內核和特定於基礎架構的卸載相結合,並提供具有完整軟件可編程性的專用硬件加速引擎。 今年早些時候,Brian 在他的一個常規播客中與 NVIDIA 進行了討論。 你可以得到一些 NVIDIA DPU 細節在這裡。

隨著 NVIDIA BlueField-2 的發布,NVIDIA 繼續推動數據處理單元 (DPU) 的發展。 NVIDIA BlueField-2 DPU 被譽為數據中心片上基礎架構,並針對企業雲和 HPC 工作負載進行了優化。 BlueField-2 將 NVIDIA ConnectX-6 Dx 網絡適配器與一系列 Arm 內核和特定於基礎架構的卸載相結合,並提供具有完整軟件可編程性的專用硬件加速引擎。 今年早些時候,Brian 在他的一個常規播客中與 NVIDIA 進行了討論。 你可以得到一些 NVIDIA DPU 細節在這裡。

NVIDIA Bluefield-2

這些功能令人印象深刻,但首先,讓我們看一下 DPU 的演變。 如果您不了解歷史,可以跳至 NVIDIA BlueField-2 的詳細信息。 它始於 90 年代,當時英特爾 x86 處理器與操作系統相結合,為企業提供了無與倫比的能力。 接下來是客戶端/服務器,然後是分佈式處理的出現。 軟件開發和不斷增長的數據庫迅速加速,導致數據中心的硬件部署呈爆炸式增長。

2000 年代初,VMware 引入了 ESX 管理程序並將 x86 CPU 虛擬化,允許多個操作系統實例在單個服務器上運行。 VM 不一定是新的; 在創建 ESX 管理程序之前,IBM 在其大型機上運行虛擬機多年。 然而,這種發展導致了數據中心基礎設施聚合的增長。

硬件現在是可編程的,開發人員可以編寫代碼來定義和配置虛擬機,而無需人工干預。 這最終推動了向雲計算的遷移。

VMware 意識到其 ESX 平台的成功,並迅速進入存儲和網絡虛擬化領域。 EMC 也不甘示弱,與 Cisco 合作構建了自己的虛擬化網絡和存儲解決方案。 一連串的收購發生了。 VMware 開發了集成到其 vSphere 平台中的 vSANS。

這種融合基礎設施的發展被稱為軟件定義數據中心(SDDC)。 微軟、VMware、思科和 EMC 等大玩家都在爭奪 SDDC 市場。 一切都變得可編程:I/O、安全性、操作系統、應用程序等。SDDC 只是一個 CPU 組件,佔用了用於其他服務的可用資源。

所有這些融合和可編程性導致了人工智能 (AI) 的發展,其中開發了 GPU 來滿足這些圖形密集型應用程序的處理要求。 這導致硬件的發展從 CPU 卸載了一些操作。 網絡功能(通常是 CPU 密集型)被卸載,NVIDIA 抓住了這個新機會,收購了 Mellanox 以開發智能網絡適配器。

GPU 變得更加智能,而智能 NIC 在從整個 SDDC 聚合中移除網絡和圖形處理方面發揮了關鍵作用。 最終,DPU 的發展是從 CPU 卸載智能的結果。

新的 NVIDIA BlueField-2 DPU 創建了一個片上系統,結合了多核 CPU、高性能網絡接口和可編程加速引擎。

NVIDIA BlueField-2 DPU——肉

CPU v GPU v DPU:是什麼讓 DPU 與眾不同? 

DPU 是結合了三個關鍵元素的新型可編程處理器。 DPU 是片上系統或 SoC,它結合了:

  1. 一種行業標準、高性能、軟件可編程的多核 CPU,通常基於廣泛使用的 Arm 架構,與其他 SoC 組件緊密耦合。
  2. 一種高性能網絡接口,能夠以線速或網絡其餘部分的速度向 GPU 和 CPU 解析、處理和高效傳輸數據。
  3. 一組豐富的靈活和可編程的加速引擎,可以卸載和提高人工智能和機器學習、安全、電信和存儲等應用程序的性能。

NVIDIA® BlueField®-2 DPU 是首款針對現代云和 HPC 優化的數據中心片上基礎設施。 提供廣泛的加速軟件定義網絡、存儲、安全和管理服務,能夠卸載、加速和隔離數據中心基礎設施。 BlueField-200 DPU 配備 2Gb/s 以太網或 InfiniBand 連接,可加速控制平面和數據平面的網絡路徑,並配備“零信任”安全性以防止數據洩露和網絡攻擊。

NVIDIA ConnectX®-6 Dx 將網絡適配器與一系列 Arm® 內核和特定於基礎架構的卸載相結合,提供具有完整軟件可編程性的專用硬件加速引擎。 BlueField-2 位於每台服務器的邊緣,支持敏捷、安全和高性能的雲和人工智能 (AI) 工作負載,並在提高數據中心效率的同時降低 TCO。

NVIDIA DOCA™ 軟件框架使開發人員能夠為 BlueField-2 DPU 快速創建應用程序和服務。 NVIDIA DOCA 利用 DPU 硬件加速器,提高數據中心的性能、效率和安全性。

NVIDIA BlueField-2 DPU 特性

網絡和主機接口

儲存應用
網絡接口  BlueField SNAP – NVMe™ 和 VirtIO-blk
 以太網 – 10/25/50/100Gb/s 雙端口,或 200Gb/s 單端口  NVMe-oF™ 加速
 InfiniBand – EDR / HDR100 的雙端口,或 HDR 的單端口  壓縮和減壓加速度
PCI Express接口  數據散列和重複數據刪除
 8 或 16 條 PCIe Gen 4.0 通道  用於直連存儲的 M.2 / U.2 連接器
 具有 8 個下行端口的 PCIe 開關分叉 網路相關
ARM/DDR 子系統   RoCE、零接觸 RoCE
臂芯   無狀態卸載:
 多達 8 個 Armv8 A72 內核(64 位)流水線  TCP/UDP/IP
 每 1 個內核 2MB 二級緩存   LSO/LRO/校驗和/RSS/TSS/HDS
 6MB L3 高速緩存,具有多種逐出策略  VLAN插入/剝離
DDR4 DIMM 支持   SR-IOV
 單個 DDR4 DRAM 控制器   虛擬網絡
 8GB / 16GB / 32GB 板載 DDR4   每端口多功能
 ECC錯誤保護支持   VMware NetQueue 支持
硬件加速   虛擬化層次結構
安全性   1K 入口和出口 QoS 級別
 使用硬件信任根的安全啟動 啟動選項
 安全固件更新  安全啟動(RSA 認證)
 符合 Cerberus 標準  通過以太網遠程啟動
 正則表達式(RegEx)加速  通過 iSCSI 遠程啟動
 IPsec/TLS 動態數據加密  PXE 和 UEFI
 AES-GCM 128/256 位密鑰 管理
 AES-XTS 256/512 位靜態數據加密  1GbE 帶外管理端口
 SHA 256 位硬件加速  NC-SI、SMBus 上的 MCTP 和 PCIe 上的 MCTP
 硬件公鑰加速器  用於監視和控制的 PLDM DSP0248
 RSA、迪菲-赫爾曼、DSA、ECC、  用於固件更新的 PLDM DSP026
EC-DSA,EC-DH  用於設備控制和配置的 I2C 接口
 真隨機數生成器 (TRNG)  SPI接口到閃存
 eMMC 內存控制器
 UART
 USB

用於存儲、網絡和機器學習的 DPU

讓我們來看看新的 BlueField-2 如何處理快速存儲技術。 BlueField 為存儲平台提供完整的解決方案,例如 NVMe over Fabrics (NVMe-oF)、全閃存陣列 (AFA) 和用於 JBOF 的存儲控制器、服務器緩存 (memcached)、分解式機架存儲和橫向擴展直接-附加存儲。 該 DPU 的智能使其成為靈活的選擇。

NVIDIA 發布了令人印象深刻的測試結果 BlueField-2 在這裡. 測試環境包含在博客中。

完整的存儲解決方案

BlueField-2 將 Arm 內核的處理能力用於存儲應用程序,例如使用 NVMe-oF、Ceph、Lustre、iSCSI/TCP 卸載、閃存轉換層、數據壓縮/解壓縮和重複數據刪除的全閃存陣列。

在高性能存儲陣列中,BlueField-2作為系統的主CPU,處理存儲控制器任務和流量終止。 它還可以配置為協處理器,從主機卸載特定的存儲任務,將部分存儲介質與主機隔離,或者使用 BlueField Arm 內核實現軟件定義存儲邏輯的抽象。

NVMe over Fabrics 功能

利用 NVMe-oF 的高級功能,基於 BlueField RDMA 的技術可提供與本地存儲相當的遠程存儲訪問性能,同時將 CPU 開銷降至最低,從而實現高效的分解存儲和超融合解決方案。

存儲加速

BlueField 嵌入式 PCIe 交換機使客戶能夠構建獨立的存儲設備並將單個 BlueField 連接到 無需外部開關的多個存儲設備。

簽名移交

BlueField 嵌入式網絡控制器使硬件 檢查 T10 數據完整性字段/保護信息 (T10-DIF/PI),減少軟件開銷並加速向應用程序傳輸數據。 簽名移交由適配器處理入口和出口數據包,從而減少發起方和目標機器上的軟件負載。

用於網絡和安全的 BlueField

無論是採用 smartNIC 形式還是作為獨立網絡平台,新的 Bluefield-2 都提供了網絡應用程序的高效部署。 結合使用高級卸載和 Arm 計算 功能,BlueField 終止網絡和安全協議 排隊。 

BlueField 智能網卡 

作為網絡適配器,您可以靈活地全部或部分 實施數據和控制平面,更有效地利用計算資源。 適配器的可編程性提供了集成新數據和控制平面功能的能力。

BlueField 安全功能

在安全方面, 對稱和非對稱加密卸載的集成 加密操作使其成為實施安全應用程序的絕佳選擇。 安全性已融入數據中心的 DNA 基礎設施,減少威脅暴露,最小化風險,並啟用 實時預防、檢測和響應潛在威脅。

無痛虛擬化 

NVIDIA 的 PCIe SR-IOV 技術,數據中心管理員 將受益於更好的服務器利用率,同時降低成本、功耗和 電纜複雜性,允許更多虛擬機和更多租戶 在相同的硬件上。 這無疑解決了任何 TCO 問題。

覆蓋網絡 

數據中心運營商使用網絡覆蓋技術(VXLAN、 NVGRE、GENEVE)來克服可擴展性障礙。 通過提供 封裝/解封裝的高級卸載引擎 覆蓋協議標頭,此 DPU 允許傳統的卸載 在隧道協議上運行並卸載 NAT 路由 能力。

用於機器學習環境的 BlueField

當然,NVIDIA 已經通過這款新的 DPU 解決了 AI/ML 市場,為機器學習設備提供具有成本效益的集成解決方案。 可以通過 PCIe Gen 3.0/4.0 接口連接多個 GPU。 憑藉其 RDMA 和 GPUDirect® RDMA 技術,BlueField-2 為實時分析和數據洞察提供高效的數據傳輸。

RDMA加速

網絡控制器數據路徑硬件利用 RDMA 和 RoCE 技術,以接近零的 CPU 週期提供低延遲和高吞吐量。

用於多 GPU 平台的 BlueField

BlueField-2 支持通過其連接多個 GPU 集成 PCIe 交換機。 BlueField PCIe 4.0 支持面向未來,適用於下一代 GPU 設備。

點對點直接® 

PeerDirect 是 Mellanox 的產品,是一種加速通信架構 支持 BlueField 和之間的點對點通信 第三方硬件,例如 GPU(例如 NVIDIA GPUDirect RDMA), 協處理器適配器(例如 Intel Xeon Phi)或存儲適配器。 PeerDirect 提供了一個標準化的架構,其中 設備可以通過結構直接與遠程設備通信,避免不必要的系統內存副本和 CPU 通過直接向/從設備複製數據來減少開銷。

GPUDirect RDMA 技術

圖形硬件性能的快速提高,再加上 隨著 GPU 可編程性的最新改進,使圖形 加速器是一個引人注目的平台,可滿足計算要求 廣泛的應用領域中的任務。 由於 GPU 提供 高核心數和浮點運算能力,需要高速網絡連接平台 為 GPU 到 GPU 提供高吞吐量和最低延遲 通訊。 GPUDirect RDMA 是一種實現的技術 在啟用直接路徑的 Bluefield-2 和 NVIDIA GPU 中 用於GPU和高速之間的數據交換 互連。

GPUDirect RDMA 為兩者提供了數量級的改進 GPU之間的通信帶寬和通信延遲 不同集群節點的設備。

結論

NVIDIA 測試揭示了 BlueField DPU 的以下性能特徵:

  • 使用較小的 512B I/O 大小進行測試會導致更高的 IOPS 但低於線速吞吐量,而 4KB I/O 大小會導致更高的吞吐量但會降低 IOPS 數量。
  • 100% 讀取和 100% 寫入工作負載提供相似的 IOPS 和吞吐量,而 50/50 混合讀取/寫入工作負載通過同時使用網絡連接的兩個方向產生更高的性能。
  • 使用 SPDK 導致比內核空間軟件更高的性能,但是以更高的服務器 CPU 利用率為代價,這是預期的行為,因為 SPDK 在用戶空間中運行並不斷輪詢。
  • 由於 Linux 社區定期添加的存儲改進,較新的 Linux 5.15 內核的性能優於 4.18 內核。

總體而言,內部測試的結果令人印象深刻。 這 BlueField-2 達到 41.5 萬次 IOPS 這是當今市場上任何其他 DPU 的四倍多。

標準聯網結果也令人印象深刻。 DPU 時鐘超過 NVMe-oF 的 4 萬個 20KB IOPS 和 512 萬到超過 XNUMX 萬個 XNUMXKB IOPS. 如果您希望提高數據中心的整體性能,此 DPU 應該符合要求。

參與 StorageReview

電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | 的TikTok | RSS訂閱