首頁 Enterprise 邊緣的 HCI 受益於英特爾傲騰和 QLC NVMe SSD

邊緣的 HCI 受益於英特爾傲騰和 QLC NVMe SSD

by StorageReview 企業實驗室

我們在 IT 社區中經常痴迷於展示馬——最快和/或最強大的設備或系統——因為我們喜歡他們展示的那些大大小小的數字。 然而,現實是大多數用戶根本不需要炫耀的馬匹。 他們需要 主力馬,能夠以可承受的價格在日常工作中處理實際工作負載的系統。 我們花了相當多的時間研究 DataON 的超融合基礎設施 (HCI) 產品,甚至給出了 DataON HCI-224 with Intel® Optane™ SSDs 我們的編輯之選 去年的獎。 在本文中,我們將研究另一個 HCI-224 雙節點集群。 然而,這個具有獨特的存儲組合:英特爾傲騰固態硬盤前端英特爾®固態硬盤 D5-P4326 15.36TB 與 QLC 3D NAND,創建了一個優化容量、性能和成本的系統。

我們在 IT 社區中經常痴迷於展示馬——最快和/或最強大的設備或系統——因為我們喜歡他們展示的那些大大小小的數字。 然而,現實是大多數用戶根本不需要炫耀的馬匹。 他們需要 主力馬,能夠以可承受的價格在日常工作中處理實際工作負載的系統。 我們花了相當多的時間研究 DataON 的超融合基礎設施 (HCI) 產品,甚至給出了 DataON HCI-224 with Intel® Optane™ SSDs 我們的編輯之選 去年的獎。 在本文中,我們將研究另一個 HCI-224 雙節點集群。 然而,這個具有獨特的存儲組合:英特爾傲騰固態硬盤前端英特爾®固態硬盤 D5-P4326 15.36TB 與 QLC 3D NAND,創建了一個優化容量、性能和成本的系統。

然而,在深入探討這個集群之前,我們將首先討論為什麼 DataON 選擇 QLC 作為其存儲容量層,並回顧一下 微軟 Azure Stack 超融合基礎架構、DataON 和雙節點 HCI 集群。 

英特爾® 固態盤 D5-P4326 系列

在此 HCI 集群中使用基於 QLC 的英特爾固態盤 D5-P4326 作為容量存儲是一個合乎邏輯的選擇,因為它提供了穩定、可靠且經濟高效的性能。 我們肯定見過更快的固態硬盤,但固態硬盤 D5-P4326 在性能和成本之間找到了適當的平衡,每個驅動器的容量高達 15.36TB。 這種組合是由於其底層架構。 使用英特爾® QLC 3D NAND 技術,英特爾能夠降低該設備的成本,同時增加其容量。 

人機交互 QLC 固態硬盤英特爾是最早生產基於 QLC 的驅動器的存儲供應商之一。 QLC 或四級單元技術在單個單元上存儲四位數據,而 TLC、MLC 和 SLC 等較舊的技術每個單元僅存儲三位、兩位或一位數據。 由於 QLC 具有更高密度的存儲,他們能夠擁有更低的每 GB 存儲成本。 此外,英特爾的 3D NAND 技術允許這些單元在芯片上水平堆疊,進一步提高存儲密度。  邊緣 HCI Optane QLC SSD雖然有一個妥協。 為了有效利用英特爾固態盤 D5-P4326 固態盤,寫入工作負載需要在進入基於 QLC 的驅動器之前進行緩衝。 QLC SSD 非常適合容量優化的讀取密集型工作負載。 因此,像 HCI 集群這樣的平台需要在 QLC SSD 前面使用適當的緩存設備來提供均勻的性能。 對於 DataON HCI-224, 每個節點使用四個 Intel Optane SSD DC P4800X NVMe 750GB 2.5 英寸驅動器來吸收寫入,然後再將數據向下移動到 QLC 層。 這種方法可以防止過多的寫入導致 QLC 層的性能下降。 最終結果是客戶獲得無縫體驗以及基於英特爾傲騰的性能與基於 QLC 的容量的完美結合。 

微軟 Azure Stack 超融合基礎架構

簡而言之,Microsoft Azure Stack HCI 是 Microsoft Azure 雲服務的本地實施。 基本上,Microsoft 將其現有的 HCI 技術引入了 Azure Stack 系列,因此他們的客戶可以在本地運行虛擬化應用程序,並直接訪問 Azure 管理服務,例如備份和災難恢復。 

Azure Stack HCI 不應與 Azure 或 Azure Stack Hub 混淆。 Azure 是一種公共雲服務,而 Azure Stack Hub 和 Azure Stack HCI 是本地解決方案。 此外,Azure Stack Hub 運行帶有 Azure 服務的 Azure OS,是一個 IaaS 和 PaaS 解決方案。 另一方面,Azure Stack HCI 運行帶有 Azure 服務的 Windows Server 操作系統,並允許您以與習慣相同的方式運行虛擬化工作負載,並具有能夠連接到 Azure 雲以獲取其他服務的額外好處。 這是一個巨大的差異,允許 IT 管理員在 Azure Stack HCI 上使用與 Azure 相同的工具和管理堆棧。

微軟 Azure 部署選項Azure Stack HCI 使用 Hyper-V 作為其管理程序,使用 Storage Spaces Direct 進行存儲,使用 Microsoft 軟件定義網絡 (SDN) 進行網絡連接,並使用 Windows Admin Center (WAC) 進行管理。 Azure Stack HCI 在標準 x86 服務器和其他商品組件上運行。

微軟 Azure Stack HCI 解決方案WAC 是一個本地部署的、基於瀏覽器的管理平台,可以管理 Windows 10 和 Windows Server 的本地實例和基於 Azure 雲的實例。 WAC 安裝在 Windows 系統上並使用 PowerShell 腳本。 它還使用基於 WinRM(Windows 遠程管理)的 Microsoft Windows 管理框架 (WMF) 來監視和管理 Windows 系統,包括 HCI 集群和 Azure 虛擬機。 

WAC 的主儀表板概述了被監控系統的 CPU、內存、網絡和磁盤活動。 在屏幕左側,WAC 還包括許多系統管理和瀏覽工具,包括證書、設備、事件、文件、本地用戶和組、防火牆、進程、註冊表、角色和功能、服務以及存儲。

DataON WAC 傲​​騰 QLC SSDDataON 是最早利用 WAC 的開放框架並將其管理實用軟件工具 (MUST) 擴展移植到 WAC 的公司之一。 DataON 必須為基於 Windows 服務器的 HCI、網絡和存儲提供基礎設施可見性、監控和管理。

數據必須

DataON超融合基礎架構

儘管 Azure Stack HCI 使用商品硬件組件,但這些項目必須設計為協同工作才能提供最佳結果。 在某些方面,設計高性能係統比主力系統更容易。 使用高性能係統,您可以選擇同類最佳的組件而忽略成本。 但是對於主力,您需要評估組件的成本/性能,然後調整它們以優化它們的性能。 它需要同樣多的——如果不是更多的話——工程努力來交付一個以價值為導向的系統,而這個系統 工程是我們繼續對 DataON 印象深刻的地方.

DataON HCI 傲騰 QLC SSDDataON 與 Microsoft 和 Intel 建立了牢固的合作夥伴關係,他們在為 Azure Stack HCI 設計系統時利用了這些關係。 DataON 的 HCI Intel Select 解決方案可以在自己的機架中進行預配置和運輸,準備立即部署。 這種交付方法不僅在數據中心有用,而且證明對部署在現有 IT 基礎設施和人員有限或不存在的邊緣的系統也是有益的。

2 節點 HCI 集群

我們最近做了一個 有關 Microsoft Azure Stack HCI 2 節點集群的文章 (2NC)。 以下是該文章的摘要。 我們發現,對於許多用例,2NC 可以為組織提供所需的彈性,並且 2NC 比傳統的三節點或四節點集群更簡單、成本更低。 DataON 是最早認識到 2NC 的價值並接受 2NC 集成的供應商之一。 但 2017NC 對 DataON 來說並不陌生,因為在 XNUMX 年 XNUMX 月,DataON 宣布了前兩個商用產品 開普勒 47 HCI 適用於 Windows Server 2016 Storage Spaces Direct 系統(現為 Azure Stack HCI)。 

DataON 的 2NC 實現支持同時出現驅動器故障和服務器故障。 它通過使用 RAID 5 + 1 執行奇偶校驗彈性並將其鏡像到其他服務器來實現這一點。 Microsoft 將此功能稱為“嵌套彈性”,並將此功能添加到 Windows Server 2019 中的 Storage Spaces Direct。同樣,2NC 並不是每個人的正確技術選擇,但它們可以為許多組織提供可靠且具有成本效益的解決方案。

構建和設計

我們在這裡使用的 Azure Stack HCI 集群構建在 DataON HCI-224 全閃存 NVMe 平台上。 這些服務器的大小為 2U,前面有 24 個 NVMe 托架,為基於 PCIe 的組件提供了大量的後部擴展。 標籤與啞光黑色驅動器盒形成鮮明對比,便於在需要更換時發現特定驅動器。 一切都被貼上了標籤,這並不少見,但標籤的範圍非同尋常。 我們的部署有每個節點標記(1 和 2),以及其他幾個項目,使得在數據中心部署和管理 DataON 系統變得容易。

此測試中的節點包括雙 2nd Gen Intel® Xeon® Scalable Gold 6248 2.5 GHz、20 核、28MB 緩存處理器,以及八個 Samsung 32GB DDR4 2933MHz ECC-Registered RDIMM(每個節點總共 256GB),以及雙 Intel S4510 480GB SATA M.2 引導驅動器。

對於存儲,每個節點配備四個 Intel Optane SSD DC P4800X NVMe 750GB 2.5 英寸驅動器(用於緩存)和四個 Intel SSD D5-P4326 15.36TB 2.5 英寸 QLC 驅動器(容量存儲層)。 

這些節點使用 4M Mellanox LinkX ETH 28GbE、40Gb/s、QSFP 無源銅纜通過 Mellanox ConnectX-56 EN 雙端口 QSFP3 40/40 GbE 卡相互連接。

顯然,DataON 在該系統的配置和組件選擇方面花費了大量時間和思考,以平衡性能和成本。 我們非常有興趣了解英特爾固態盤 D5-P4326 固態盤作為存儲層的表現。 通過結合英特爾傲騰固態硬盤和英特爾 QLC 3D NAND 固態硬盤,D5-P4326 固態硬盤應該提供高性能層和具有成本效益的閃存存儲,這曾經是緩慢但大硬盤驅動器的領域。

在 StorageReview 實驗室中,我們部署了兩個存儲節點和交換機,如下圖所示。

2 節點 HCI Optane QLC SSD

測試 

為了了解像這樣的小型集群在邊緣用例中的表現如何,我們設置了幾個 Microsoft SQL Server 測試。 目標是檢查完整的集群性能,以確保 DataON 可以正確使用英特爾傲騰技術和英特爾 QLC SSD。 其次,我們想檢查單個節點的功能,以了解此解決方案如何處理節點丟失,無論是針對計劃更新還是在發生更嚴重的故障時。 

我們的測試計劃利用 Quest 的 Benchmark Factory,使用 TPC-C 配置文件作為我們部署的 SQL Server VM 的負載生成器。 我們配置了八個虛擬機(每個節點四個),這為集群提供了 CPU 和磁盤活動的良好平衡。 工作負載生成器託管在該環境之外的系統上,並通過 10GbE 網絡連接到該集群。

SQL Server 測試配置(每個虛擬機)

  • 在Windows Server 2019
  • 存儲空間:分配 800GB,使用 620GB
  • 8 個 vCPU
  • 60GB RAM(55GB 失敗模式配置)
  • SQL Server 2019的
    • 數據庫大小:1,500 規模
    • 虛擬客戶端負載:15,000
    • 內存緩衝區:48GB
  • 測試時長:3 小時
    • 15分鐘預處理
    • 45分鐘採樣期

在我們的測試中,我們專注於延遲性能,事務性能水平與 Benchmark Factory 保持一致。

DataON K2N HCI-224 英特爾 D5-P4326 性能1在總負載為 4 個虛擬機(每個節點 2 個)的情況下,我們測得平均延遲為 2.5 毫秒,總事務負載為 12,649TPS。

DataON K2N HCI-224 英特爾 D5-P4326 性能2將負載增加到 6 個虛擬機,平均延遲略微增加到 4 毫秒,總事務負載為 18,967TPS。

HCI SQL Server 性能重在 8 個虛擬機(每個節點 4 個)的峰值負載下,平均延遲達到 6.5 毫秒,總事務負載為 25,277。 

在這些測試中,我們清楚地看到了在這種組合中使用傲騰 SSD 的好處。 他們首當其衝,將 QLC SSD 釋放出來,作為高速容量層進行響應式讀取。 即使我們將工作負載加倍到八個 SQL Server VM 來訪問這個 HCI 集群,延遲也只增加了一點點,表明這種配置非常適合可能不時爆發的工作負載。 

雖然在完全可操作的環境中的性能很重要,但另一個考慮因素是如果集群中的節點脫機或需要遷移工作負載以進行系統維護,則工作負載將如何運行。 為了測試這種情況,我們保留了 8 個虛擬機的全部負載並將它們遷移到單個節點。 在此設置中,我們測得的平均延遲僅為 4.5 毫秒,這比兩個在線節點都要好。 部分原因是消除了單節點操作中的存儲開銷。

結論 

對於這個項目,我們在系統上運行了一系列 SQL 測試,以說明邊緣和 SMB 用例中常見的性能工作負載。 我們的目標是了解此 DataON 集群中的 Microsoft Azure Stack HCI 如何有效地利用硬件來實現預期的結果。 具體來說,這意味著提供一種罕見的性能和價值組合的解決方案。

通過我們的測試,我們可以確認 DataON 的組件選擇確實成功地創建了一個性能極其出色的經濟高效的 Azure Stack HCI SDS 解決方案。 這部分是由於他們選擇使用英特爾固態盤 D5-P4326 進行容量存儲,從而有效地利用英特爾傲騰固態盤進行分層。 

這是一個關鍵的概念,因為 QLC SSD 為集群提供了大量、密集的容量,同時仍然提供閃存存儲帶來的 TCO 優勢。 為了強調這一點,QLC 驅動器每個 15.36 英寸驅動器托架可實現 2.5TB 的容量。 RAID 8 中需要 2 個 0TB HDD 才能匹配容量,或者切換到 3.5 英寸機箱以利用更大但速度更慢的 HDD。 無論哪種方式,從英特爾 QLC 驅動器到硬盤驅動器的性能下降都非常可觀; 在應用程序響應能力方面,這是一個指數級的差異。

儘管我們希望所有讀取和寫入都來自 Optane SSD(因為它們是此配置中性能最高的介質),但有時會出現失誤。 在這種情況下,QLC SSD 的性能將擊敗硬盤驅動器,保護 HCI 集群免受結合閃存和硬盤驅動器的拓撲結構中常見的性能異常的影響。 事實上,我們在這裡看到瞭如此平衡的性能,以至於未來,一般公司可能需要重新考慮 HDD/閃存設計,並更傾向於 QLC/Optane 設計,以在 HCI 中獲得最大收益。 

2 節點集群的另一個主要問題是處於降級狀態時的性能。 我們通過使一個節點失敗並將所有 SQL 工作負載分配給單個節點來對此進行測試。 在這種情況下,SQL 比 2 節點的響應更快,性能也更好,這主要是由於節點到節點通信的開銷減少了。 當然,不建議長時間在這樣的降級狀態下運行,但知道可以在不犧牲性能的情況下完成它是令人欣慰的。 

總體而言,配備 D224-P5 QLC SSD 的 HCI-4326 HCI 集群易於部署、易於使用且功能強大,足以應對各種工作負載。 它的價格點也使它可供廣大用戶使用。 最重要的是,該系統已通過 Microsoft Windows Server 2019 認證,並被驗證為英特爾精選解決方案。 

DataON 英特爾 QLC 信息圖

達達

參與 StorageReview

電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS訂閱

本報告由 DataON 贊助。 本報告中表達的所有觀點和意見均基於我們對所考慮產品的公正看法。