在查看了具有傳統架構的 VMware VSAN 集群的性能水平之後 聯機事務處理平台 工作負載,我們想了解該平台如何響應要求更高的用例增加的工作負載。 初始部署是四個 Sysbench VM,每個節點 1 個,但該工作負載並未使磁盤 I/O 達到我們認為資源得到充分利用的足夠高的範圍。 這類似於運行 POC 的客戶,在他們當前工作負載的子集下對其進行測試,但不衡量平台在工作負載隨時間增長或遷移更多應用程序數據時的響應情況。 為了更好地了解這個 VSAN 集群在不斷增加的 MySQL 工作負載下如何響應,我們將四個 Sysbench VM(每個節點 1 個)基準測試擴展到總共 8 個和 12 個 VM。
在查看了具有傳統架構的 VMware VSAN 集群的性能水平之後 聯機事務處理平台 工作負載,我們想了解該平台如何響應要求更高的用例增加的工作負載。 初始部署是四個 Sysbench VM,每個節點 1 個,但該工作負載並未將磁盤 I/O 帶到我們認為資源得到充分利用的足夠高的範圍。 這類似於運行 POC 的客戶,在他們當前工作負載的子集下對其進行測試,但不衡量平台在工作負載隨時間增長或遷移更多應用程序數據時的響應情況。 為了更好地了解這個 VSAN 集群在不斷增加的 MySQL 工作負載下如何響應,我們將四個 Sysbench VM(每個節點 1 個)基準擴展到總共 8 個和 12 個 VM。
Dell PowerEdge R730xd VMware VSAN 規格
- Dell PowerEdge R730xd 服務器 (x4)
- CPU:5 個 Intel Xeon E2697-3 v2.6 14GHz (28C/XNUMXT)
- 內存:64 x 16GB DDR4 RDIMM
- SSD:16 x 800GB 固態硬盤 SAS 混合使用 MLC 12Gbps
- 硬盤:80 x 1.2TB 10K RPM SAS 6Gbps
- 網絡:4 x Intel X520 DP 10Gb DA/SFP+,+ I350 DP 1Gb 以太網
- 存儲容量:86.46TB
系統性能
每個 Sysbench VM 配置了三個虛擬磁盤,一個用於啟動 (~92GB),一個用於預構建數據庫 (~447GB),第三個用於測試中的數據庫 (400GB)。 從系統資源的角度來看,我們為每個虛擬機配置了 16 個 vCPU、64GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。
在負載 8 個虛擬機的情況下,我們看到每個 Sysbench 虛擬機消耗 5,200-6,300MHz,總主機資源表明使用了大約 18,000MHz。 這留下了大量的 CPU 資源,每個主機只使用了 22%,儘管在 8 個 Sysbench VM 的工作負載下,我們幾乎使用了所有可用的 SSD 緩存。 對於存儲影響,我們加載了 16 個 Sysbench 虛擬機以擴大整體佔用空間,消耗了 14TB 總 VSAN 存儲容量中的約 86.46TB。 然而,在 8 個 VM 工作負載時,這 7TB 中只有 14TB 處於活動狀態。 這與 3.5 個虛擬機工作負載中的 4TB 相比。
Sysbench 測試配置(每個虛擬機)
- 中央操作系統 6.3 64 位
- 存儲空間:1TB,已使用 800GB
- Percona XtraDB 5.5.30-rel30.1
- 數據庫表:100
- 數據庫大小:10,000,000
- 數據庫線程:32
- 內存緩衝區:24GB
- 測試時長:12 小時
- 6 小時預處理 32 個線程
- 1 小時 32 個線程
- 1 小時 16 個線程
- 1 小時 8 個線程
- 1 小時 4 個線程
- 1 小時 2 個線程
當我們擴展 Sysbench OLTP 工作負載時,我們測得性能從 2,830 個虛擬機的總計 4 TPS 增加到 4,259 個虛擬機的 8 TPS。 結果是性能提高了 50%,工作負載佔用空間翻了一番。
隨著聚合事務性能的提高,我們測得每個虛擬機的平均延遲從 45 毫秒增加到 60 毫秒。 這比較小的工作負載高了約 33%。
隨著 I/O 需求的增加,平均第 99 個百分點的延遲也從 94 毫秒增加到 131 毫秒。
在基準測試運行時,我們從 vCenter 捕獲了 CPU、磁盤和網絡統計數據。 在 8 VM 測試期間,我們看到 VM-CPU 在 VM 之間的傳播範圍為 5,275MHz 到 6,393MHz。
每個節點有 2 個 VM 處於活動狀態,我們看到混合磁盤活動在工作負載開始後測量到總計 609MB/s。 較大的峰值是在測試開始時預建數據庫在每個 VM 內復制自身時測得的。
在 8 台 VM Sysbench 測試期間,來自一台主機的網絡流量在測試穩定後測得混合為 391MB/s。
由於此測試的目的是展示 VSAN 如何響應不斷增加的工作負載,我們確實在 12 個虛擬機運行後將平台推至 8 個虛擬機。 這是一些工作負載被推到 SSD 緩存之外的轉折點。 我們沒有繪製此性能圖,因為大多數工作負載未完成或未獲得適當的分數。 對於完成的虛擬機,我們會看到整個集群的聚合事務性能低至 1000-1500TPS。 我們測量的性能下降當然可以通過更大的閃存設備來緩解,例如 1.6TB SSD 而不是 800GB,或者遷移到全閃存 VSAN 模型,其中溢出到您的讀取層沒有那麼大的I/O 下降。 這強調了適當調整 VSAN 環境的閃存組件大小的必要性,管理員或其經銷商合作夥伴應該對工作數據集有很好的了解。 這是 VSAN 平台的關鍵優勢之一; 允許客戶定製配置以最好地滿足當前和未來工作負載的需求,或者根據需要廉價地更換/添加 SSD。
了解平台的斷點在哪裡非常重要。 最初部署的工作負載通常會隨著時間的推移而增加,無論是虛擬機數量還是存儲容量。 每個存儲平台都有一個瓶頸(即使是全閃存陣列),這讓我們了解了這個四節點 VSAN 集群是如何堆疊起來的。 目前,我們只有一個存儲平台成功運行了 12 個和 16 個 Sysbench VM,這是一個建議零售價為 575,000 美元的全閃存陣列。 然而,此 VSAN 集群的未來測試將包括全閃存配置,以嘗試達到類似的性能目標。
VMware Virtual SAN 評論:概述和配置
VMware Virtual SAN 評論:VMmark 性能
VMware Virtual SAN 評論:Sysbench OLTP 性能
VMware Virtual SAN 評論:SQL Server 性能
VMware Virtual SAN 評論:擴展的 Sysbench OLTP 性能
VMware Virtual SAN 評論:HCIbench 綜合性能