Scaled Sysbench 是在 HCI 中配置的全閃存 EMC ScaleIO VxRack 節點的最終性能測試。 在二層中,我們 將系統壓至 99.2% 容量 並看到四台戴爾服務器作為負載源的驚人吞吐量。 這一次,在 2U 機箱中將計算和存儲放在一起,我們運行相同的測試以查看會發生什麼。 我們希望看到更多的 CPU 權重成為限制因素,因為系統有更多的工作要做,但到目前為止,在 HCI 測試中,從開銷的角度來看,ScaleIO 已被證明是極其高效和輕量級的; 這在其他 HCI 解決方案中通常是相反的。
Scaled Sysbench 是在 HCI 中配置的全閃存 EMC ScaleIO VxRack 節點的最終性能測試。 在二層中,我們 將系統壓至 99.2% 容量 並看到四台戴爾服務器作為負載源的驚人吞吐量。 這一次,在 2U 機箱中將計算和存儲放在一起,我們運行相同的測試以查看會發生什麼。 我們希望看到更多的 CPU 權重成為限制因素,因為系統有更多的工作要做,但到目前為止,在 HCI 測試中,從開銷的角度來看,ScaleIO 已被證明是極其高效和輕量級的; 這在其他 HCI 解決方案中通常是相反的。
VCE VxRack 節點(性能計算全閃存 PF100)規格
- 機箱 – 節點數:2U-4 節點
- 每個節點的處理器:雙 Intel E5-2680 V3、12c、2.5GHz
- 芯片組:Intel 610
- 每個節點 DDR4 內存:512GB (16x 32GB)
- 每個節點的嵌入式 NIC:雙 1 Gbps 以太網端口 + 1 個 10/100 管理端口
- 每個節點的 RAID 控制器:1 個 LSI 3008
- 每個節點的 SSD:4.8TB(6 個 2.5 英寸 800GB eMLC)
- 每個節點的 SATADOM:32GBSLC
- 每個節點 10GbE 端口:4 個 10Gbps 端口 SFP+
- 電源:雙 1600W 白金 PSU AC
- 路由器:Cisco Nexus C3164Q-40GE
系統性能
我們對 VxRack 節點 HCI 測試應用了與雙層測試相同的配置,但 VM 的運行位置除外。 在我們的兩層中,我們將存儲託管在 VxRack 節點上,但計算是通過四到八台 Dell PowerEdge R730 13G 服務器提供的。 在此迭代測試中,VxRack 節點本身運行工作負載。 在某個時刻,無論 ScaleIO 有多快,我們都會看到兩層和 HCI 之間的權衡,由於 HCI 配置中計算 VM 的增加重量和 CPU 差異,我們會耗盡 CPU 週期。 在 HCI 案例中,我們有八個 Intel E5-2680 v3 CPU。 在兩層配置中,我們在頂端擴展到八台服務器,運行 5 個 Intel E2690-3 v240 CPU。 這轉化為最大工作負載下 499.2GHz 與 XNUMXGHz 的差異以供參考。
Sysbench 測試配置(每個虛擬機)
- 中央操作系統 6.3 64 位
- 存儲空間:1TB,已使用 800GB
- Percona XtraDB 5.5.30-rel30.1
- 數據庫表:100
- 數據庫大小:10,000,000
- 數據庫線程:32
- 內存緩衝區:24GB
- 測試時長:3 小時
- 2 小時預處理 32 個線程
- 1 小時 32 個線程
我們將比較 HCI 中的 EMC VxRack 節點和雙層中的 EMC VxRack 節點,分別將結果稱為 HCI 和 2L。 在 4VM 時,HCI 為我們提供了 5,664.9 TPS,而 2L 為 3,979.4 TPS。 隨著我們繼續擴大規模,HCI 一直領先於 2L,直到我們達到 24 個 VM; 在這裡,HCI 為我們提供了 12,817.3 TPS,而 2L 為我們提供了 13,858.3 TPS。 雖然 HCI 配置仍略微提高了其整體總體性能,但在 20 個虛擬機後性能逐漸下降,到 32 個虛擬機時,我們看到性能開始下降。 這是 CPU 達到臨界點的標誌。
通過運行 32 個 VM 的 ScaleIO GUI 查看存儲影響,我們看到系統級別的流量約為 2.6GB/s,IOP 略高於 143k。
按比例縮放的平均延遲描繪了一幅有點相似的畫面,HCI 最初顯示出比 2L 更低的延遲。 在 4VM 時,HCI 的延遲僅為 22.6ms,而 2L 的延遲為 32.16ms。 隨著我們擴大規模,我們慢慢地看到潮流開始轉變,2L 從 24VMs 開始具有更低的延遲。 儘管如此,在 32 個虛擬機上,HCI 的平均延遲僅為 78.4 毫秒。
將我們的注意力轉移到具有第 99 個百分位延遲的峰值延遲配置文件,這裡 HCI 以較低的延遲開始(45.33VMs 時為 4ms),並再次在 2VMs 時輸給 24L。 然而,一旦我們達到 32 個虛擬機,HCI 的延遲為 179.26 毫秒,超過了 2L 的 197.01 毫秒。
結論
同樣,EMC VxRack 節點在此測試中表現非常出色。 雖然我們預計 HCI 配置中會有一些管理開銷,但我們確實沒有看到任何不利影響。 事實上,HCI 配置在某種程度上擊敗了兩層配置,其中 CPU 成為限制因素。 這也反映在我們最近關於在 HCI 上運行的 SQL Server 測試的文章中,它在低延遲指標方面優於兩層。 不管怎樣,性能都非常出色,再次輕鬆證明 ScaleIO 在性能和靈活性方面是市場上領先的軟件定義解決方案。
深入了解細節,ScaleIO 可以輕鬆平衡在與 MySQL 工作負載相同的系統上運行的 SDS worker 的開銷。 與我們的兩層測試(2.5GHz 與 2.6GHz)相比,平台的時鐘速度較低,我們看到在 HCI 環境中運行的延遲有所改善,交易性能更高,工作負載更接近存儲本身。 雖然乍一看這似乎很直觀,但我們從未在任何其他 HCI 環境中看到過這種情況,因為它們總是比連接到專用計算服務器的外部存儲陣列慢。 當我們的 Sysbench worker 消耗了集群上所有可用的 CPU 資源時,突破點就發生了,與兩層相比,它在運行 20 個 VM 時失去了優勢。
有趣的是,仍然有未開發的存儲 IO,它仍然可以在 ScaleIO HCI 集群之外呈現。 這意味著除了 HCI 負載之外,您還可以同時以兩層模式共享存儲。 這是 ScaleIO 提供的價值主張的基礎,它允許組織使系統適應他們的需求。 儘管 ScaleIO 既靈活又高效,但除了容量耗盡或主機本身的可用 CPU 週期耗盡之外,ScaleIO 實際上從未顯示出任何弱點。
EMC VxRack 節點評論:概述
由 ScaleIO 提供支持的 EMC VxRack 節點:Scaled Sysbench OLTP 性能評估(2 層)
由 ScaleIO 提供支持的 EMC VxRack 節點:SQL Server 性能評估(2 層)
由 ScaleIO 提供支持的 EMC VxRack 節點:綜合性能評估(2 層)
EMC VxRack Node Powered By ScaleIO 審查:綜合性能審查 (HCI)
由 ScaleIO 提供支持的 EMC VxRack 節點:SQL Server 性能評估 (HCI)
由 ScaleIO 提供支持的 EMC VxRack 節點:VMmark 性能評估 (HCI)