超融合基礎架構 (HCI) 涉及使用服務器的本地存儲和軟件定義存儲 (SDS),以創建一個虛擬 SAN,其存儲可從 HCI 集群中的所有節點訪問。 使用 HCI,存儲和計算是從同一個控制台管理的。 要在 HCI 集群中添加計算和存儲,您只需購買額外的 HCI 節點,而不是像傳統數據中心拓撲那樣,必須購買存儲,將其與服務器集成,然後使用不同的管理控制台管理您的存儲和計算。 儘管 HCI 具有優勢,但它並不是解決數據中心問題的萬能藥。 事實上,我們看到對 HCI 的過度依賴對數據中心的經濟性產生了不利影響。 企業現在正在尋找替代方案,例如 HPE 的分佈式 HCI (dHCI) 解決方案,它結合了 HPE 的 ProLiant 服務器、Nimble Storage 和 M 系列網絡交換機作為 HCI 的替代方案,因為它提供了 HCI 的優勢,同時消除了它的缺點。
超融合基礎架構 (HCI) 涉及使用服務器的本地存儲和軟件定義存儲 (SDS),以創建一個虛擬 SAN,其存儲可從 HCI 集群中的所有節點訪問。 使用 HCI,存儲和計算是從同一個控制台管理的。 要在 HCI 集群中添加計算和存儲,您只需購買額外的 HCI 節點,而不是像傳統數據中心拓撲那樣,必須購買存儲,將其與服務器集成,然後使用不同的管理控制台管理您的存儲和計算。 儘管 HCI 具有優勢,但它並不是解決數據中心問題的萬能藥。 事實上,我們看到對 HCI 的過度依賴對數據中心的經濟性產生了不利影響。 企業現在正在尋找替代方案,例如 HPE 的分佈式 HCI (dHCI) 解決方案 它結合了 HPE 的 ProLiant 服務器、Nimble Storage 和 M 系列網絡交換機作為 HCI 的替代方案,因為它提供了 HCI 的優勢,同時消除了它的缺點。
HCI 涉及使用服務器的本地存儲和軟件定義存儲 (SDS),以創建可與 HCI 集群中的其他 HCI 節點共享的虛擬 SAN (vSAN)。 使用 HCI,您只需購買一個節點來添加計算和存儲,而不是其他選擇:必須購買單獨的存儲陣列並從不同的管理控制台管理它們,以及服務器和處理集成它們的需要。
通過單個產品添加額外的計算和存儲容量簡化了增加數據中心容量的後勤工作,仍然可以從同一控制平面進行管理。 然而,儘管有這些好處,HCI 並不是解決數據中心問題的靈丹妙藥。 事實上,我們看到對 HCI 的過度依賴對數據中心的經濟性產生了不利影響。
HCI 的挑戰
HCI 的第一個廣泛使用是用於虛擬桌面基礎架構 (VDI),並且看起來 VDI 和 HCI 是完美的結合。 當需要額外的桌面時,這種配對讓我們很好地了解每個桌面需要多少存儲和計算,並且可以設計新的 HCI 節點來相應地滿足這些要求。 這個過程使得構建、部署和擴展 VDI 部署變得相對簡單。
在 HCI 在 VDI 方面取得了良好的業績記錄後,HCI 節點開始銷售並部署用於一般工作負載。 不幸的是,一般工作負載不像 VDI 工作負載那樣可預測,並且由於各種計算密集型和存儲密集型工作負載,計算和存儲可能無法相互線性擴展。 您根本無法將存儲和計算與 HCI 分離,因為這會留下擱淺的、浪費的資源。 在某些情況下,公司會因為 HCI IT 管理的簡便性而合理地擴大其低效的 HCI 足跡。
即使是 HCI 的寵兒 VDI 工作負載也在發生變化。 IT 行業最近出現了大規模的員工遷移,這些員工以前在辦公室工作,現在在家工作 (WFH)。 我們不再看到員工在 VDI 環境中只負責一個或兩個應用程序。 我們現在看到需要具有 4 或 8 個 vCPU、32GB RAM 和 GPU 的虛擬桌面的高級用戶遠程工作。 不用說,通用 HCI 節點無法有效處理這些類型的工作負載。
分佈式人機交互 (dHCI)
在過去的幾年裡,許多 IT 專業人士得出結論,他們需要一種方法來精細地擴展存儲和計算,但仍然只有一個管理控制台。 他們需要解耦 IT 資源,從而分解 HCI,簡稱 dHCI。 從邏輯上看,dHCI 看起來與 HCI 相同; 但在物理層面上,它有存儲和計算節點。 存儲和計算能力可以單獨採購,並通過高帶寬網絡相互關聯。
如果需要專門的 IT 資源,例如用於圖形處理、工程、人工智能 (AI) 或機器學習 (ML) 的 NVIDIA GPU,則可以與存儲分開添加計算資源。 如果需要,可以添加更多存儲,而不會擱置不需要的計算資源。
要更好地了解 dHCI 的工作原理,請查看 HPE 的 dHCI 架構。 HPE 是 dHCI 的早期創新者和開拓者之一,其解決方案使用 HPE ProLiant 服務器進行計算,將 HPE Nimble 用於存儲,將 VMware vSphere 用於管理平面。
HPE M 系列以太網交換機將硬件組件連接在一起,這些交換機是 dHCI 部署的秘密組成部分。 過去,計算和存儲之間的網絡流量的數量和質量是一個巨大的瓶頸。
了解更多: 動手實踐 HPE Nimble dHCI
對於 HPE dHCI 部署中的計算,HPE 使用其知名且備受推崇的 DL ProLiant 服務器。 這些服務器具有多種配置以滿足組織的需求。 在色域的一端,他們提供了一個 HPE ProLiant DL325 Gen10 服務器,這是一個 1U、單路、AMD EPYC 供電的系統,具有 16GB 內存。 另一方面,他們提供了一個 4U HPE ProLiant DL580 Gen10 服務器,最多支持四個英特爾至強處理器、16 TB 內存和 16 個 PCIe 3.0 插槽。
dHCI 部署中功能較弱的服務器可以部署為託管單個應用程序,而擁有大量資源的服務器可以處理內存數據庫等要求最苛刻的應用程序。 具有多個 GPU 的服務器可以執行要求苛刻的分析計算。 一個 HPE dHCI 集群最多可以處理 32 個計算節點。 這裡的關鍵點是,可以為您的特定工作負載定制更多的服務器,而不是像使用 HCI 那樣從一組有限的選項中選擇服務器。
HPE Nimble Storage 是全閃存陣列市場的早期進入者,也是自我管理存儲領域的創新者。 當引入 HPE dHCI 環境時,Nimble Storage 將被 VMware vCenter 自動發現。 Nimble Storage 當前支持的 VMware vSphere 數據存儲服務包括 VMware Virtual Volumes (VVols),它允許策略驅動的存儲。 它還包含一個“假設”模擬器,可以幫助您了解在 dHCI 集群上整合新應用程序的效果。
Nimble Storage 具有低至 200 微秒的延遲和自動 QoS,以確保關鍵應用程序獲得所需的資源。 對於數據保護,系統可以容忍三個驅動器同時發生故障,並且陣列沒有單點故障。 HPE Nimble Storage 的可用性高達 6 個 32,即每年的停機時間少於 XNUMX 秒。
可以說,dHCI 部署中最關鍵的組件是網絡交換機,它需要處理存儲和計算之間的大量流量。 交換機不僅需要滿足帶寬要求,而且還必須始終保持低延遲。 為實現這一目標,HPE 提供了由 NVIDIA® Mellanox Spectrum™ 以太網交換機芯片提供支持的 M 系列交換機。
基於 Nvidia Spectrum ASIC 的 HPE M 系列以太網交換機系列有多種交換機可供選擇,從 16 到 128 個端口,支持從 1Gb/s 到 100Gb/s 的速率。 這些開關有半角和全角兩種尺寸。
使這些交換機獨一無二的一項功能是它們的 300 納秒延遲,是其他供應商交換機的三分之一到二分之一。 儘管這些交換機為一般網絡流量提供了出色的性能,但在 dHCI 集群中的 Nimble Storage 和 ProLiant 服務器之間傳遞塊存儲流量(例如 iSCSI 流量)時,它們確實表現出色。 這些交換機的出色性能部分歸功於 Spectrum 和 Spectrum-16 中的 42MB 和 2MB 靈活共享緩衝區,可實現最佳緩沖和微突發吸收。 同樣,它們支持快速顯式擁塞通知 (ECN) 和 RDMA/RoCE 以優化存儲數據流,這使它們比競爭交換機具有明顯優勢。
HPE M 系列 SN2010M 交換機採用獨特的半寬外形規格,允許兩個單元並排放置,僅佔用 1U 機架空間,從而為存儲和計算留出更多空間。 擁有兩個交換機可在 1U 空間內提供完全的交換機冗餘。 SN2010M 在其 1U 半寬機箱中包含很多內容,具有 1Gbps 至 100Gbs 的速度,18 個 SFP28 端口 + 4 個 QSFP28 端口,總帶寬為 1.7 Tbps。
由於服務器、交換機和存儲如此相互依賴,因此在試圖找到 dHCI 部署中可能出現的問題的根本原因時,這可能會導致供應商之間相互指責。 為了解決這個問題,Nimble Support 完全負責支持電話,而不管組件是什麼。 IT 專業人員知道這種服務級別的重要性,因為它為他們提供了一個由專門專家組成的中央支持組織,更重要的是,可以更快地解決問題。
非 HCI 系統的一個問題是它需要許多不同的管理控制台來監視和管理它們,從而導致孤島,組織中的不同部門擁有和管理不同的組件。 相反,借助 HPE dHCI,所有組件都可以通過 VMware vCenter Server 進行管理,從而消除了過去困擾系統的孤島。
為了進一步提升 HPE 為 dHCI 帶來的價值,InfoSight 是一項基於 Web 的免費服務,用於監控 HPE dHCI 集群中的組件,它將主動提出建議以在問題中斷應用程序性能之前預防問題。
結論
dHCI 允許公司獲得 HCI 的好處(易於管理和部署),而沒有缺點(有限且不靈活的拓撲結構,需要存儲與計算一起部署)。 HCI 的這種不靈活性導致昂貴的資源擱淺和未被使用。 dHCI 不僅僅是將服務器和存儲與管理軟件放在一起,要有效,硬件和軟件必須以整體方式設計在一起,這就是 HPE 對其 dHCI 產品所做的。 HPE 使用其高度可配置的 ProLiant 服務器進行計算,使用具有出色數據效率和超低延遲的 Nimble Storage 進行存儲,也許最重要的是,HPE M 系列網絡交換機在這兩者之間傳遞信息。
過去,無法通過應用程序所需的超低延遲來處理存儲和計算之間的帶寬量,從而阻礙了 IT 資源分解的能力。 借助由 NVIDIA Spectrum ASIC 提供支持的 HPE M 系列網絡交換機,情況不再如此,因為它們可以以一種使 dHCI 成為當今現代數據中心急需的現實的方式處理帶寬。 這些交換機與 HPE 服務器以及 HPE Nimble Storage 提供的全閃存存儲的強大功能相結合,形成了一個極其靈活的解決方案,可以對其進行配置以滿足數據中心的硬件要求,而不會像 HCI 部署那樣讓昂貴的資源擱置和閒置。 HCI 的主要差異化因素之一是統一管理,但 HPE 通過創建使 運行 dHCI 環境的日常操作 從一個單一的管理控制台成為現實。
本報告由 NVIDIA 贊助。 本報告中表達的所有觀點和意見均基於我們對所考慮產品的公正看法。