昨年、 VSAN 6.0 に関する一連の詳細なレビュー ハイブリッド構成で。今年の2月に、 VMware が VSAN 6.2 をリリース、重複排除と圧縮によるデータ削減、およびその他の多くの機能を市場にもたらしました。データ削減は、主に価格低下と高品質オプションのおかげで、フラッシュ採用の大幅な増加に便乗する VSAN にとって大きな前進です。オールフラッシュ構成で VSAN が有効になっている場合、データ削減を利用するユーザーは、ワークロードに応じて容量を効果的に 3 倍(またはそれ以上)に増やすことができ、ROBO から企業に至るまですべての人にフラッシュの価値をもたらします。
昨年、 VSAN 6.0 に関する一連の詳細なレビュー ハイブリッド構成で。今年の2月に、 VMware が VSAN 6.2 をリリース、重複排除と圧縮によるデータ削減、およびその他の多くの機能を市場にもたらしました。データ削減は、主に価格低下と高品質オプションのおかげで、フラッシュ採用の大幅な増加に便乗する VSAN にとって大きな前進です。オールフラッシュ構成で VSAN が有効になっている場合、データ削減を利用するユーザーは、ワークロードに応じて容量を効果的に 3 倍(またはそれ以上)に増やすことができ、ROBO から企業に至るまですべての人にフラッシュの価値をもたらします。
VSAN のレビューを続けるにあたり、前回のハイブリッド レビューで使用したのと同じ Dell PowerEdge R730xd クラスタを利用しました。 BIOS、ファームウェア、ESXi などのプラットフォームを更新して、VSAN 6.2 と互換性を持たせるようにしました。ただし、最大の変更の 3 つは、東芝のご厚意により、既存の HDD と SSD を新しいオールフラッシュ構成に置き換えたことです。市場で最も高速な SASXNUMX SSD を活用することで、ハードウェアによって妨げられることなく、VSAN 自体にすべての注意を向けることができます。
Dell PowerEdge R730xd VMware オールフラッシュ VSAN の仕様
- Dell PowerEdge R730xd サーバー (x4)
- CPU: 5 基の Intel Xeon E2697-3 v2.6 14GHz (28C/XNUMXT)
- メモリ: 64 x 16GB DDR4 RDIMM
- SSD:
- キャッシュ: 16 x 400GB Toshiba PX04 書き込み集中型 SAS3
- 容量: 80 x 960GB Toshiba PX04 読み取り集中型 SAS3
- ネットワーキング: 4 x Intel X520 DP 10Gb DA/SFP+、+ I350 DP 1Gb Ethernet
- 記憶容量:69.86TB
このレビューに使用された東芝ドライブは、 東芝 PX04S モデル。前回のレビューでは、PX04S モデルがこれまでにテストした中で最速の SAS エンタープライズ SSD であることがわかりました。 PX04S は、レビュー時点では最高容量のデュアルポート SAS SSD でもありました。 PX04S シリーズには、高耐久から低耐久までの複数の耐久レベルがあり、中耐久モデルや低耐久モデルも用意されています。このレビューでは、Dell PowerEdge R730xd に 400 台の 04GB 書き込み集中ドライブ (PX040SHB960) と 04 台の 096GB 耐久性ドライブ (PX25SVB3) を装着しました。書き込み集中型ドライブは最大 02DWPD、価値耐久性ドライブは最大 800DWPD を誇ります。比較すると、同じサーバーを使用したハイブリッド構成では、キャッシュ層はホストあたり XNUMX 台の Toshiba PXXNUMX XNUMXGB SSD で構成され、キャッシュ層の容量が XNUMX 倍になりました。
PX04SHB040 400GB 書き込み集中型ドライブの仕様:
- 性能
- 持続64KiBシーケンシャル読み取り: 1,900MiB/秒
- 持続64KiBシーケンシャル書き込み: 850MiB/秒
- 持続的な 4KiB ランダム読み取り: 270K IOPS
- 持続的な 4KiB ランダム書き込み: 125K IOPS
- DWPD: 25
PX04SVB096 960GB 耐久性バリュードライブの仕様:
- 性能
- 持続64KiBシーケンシャル読み取り: 1,900MiB/秒
- 持続64KiBシーケンシャル書き込み: 850MiB/秒
- 持続的な 4KiB ランダム読み取り: 270K IOPS
- 持続的な 4KiB ランダム書き込み: 60K IOPS
- DWPD: 3
アプリケーションのワークロード分析
このレビューでは、Dell PowerEdge R730xd VMware VSAN にすべての Toshiba PX04 SAS3 SSD を再実装しました。最初のベンチマークは次のもので構成されます。 SysBench による MySQL OLTP のパフォーマンス と Microsoft SQL Server OLTP のパフォーマンス シミュレートされた TPC-C ワークロードを使用します。
各 SQL Server VM は 100 つの vDisk で構成されており、500 つはブート用に 16 GB、もう 64 つはデータベースとログ ファイル用に XNUMX GB です。システム リソースの観点から、各 VM に XNUMX 個の vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。これらのテストは、中程度ではあるが圧倒的ではないコンピューティング負荷とストレージ負荷を持つクラスター上で、遅延の影響を受けやすいアプリケーションがどのように実行されるかを監視するように設計されています。
SQL Server テスト構成 (VM ごと)
- Windows Serverの2012 R2
- ストレージ フットプリント: 600GB 割り当て、500GB 使用
- SQL Serverの2014
- データベースのサイズ: 1,500 スケール
- 仮想クライアント負荷: 15,000
- RAMバッファ: 48GB
- テスト時間: 3 時間
- 2.5時間のプレコンディショニング
- 30 分のサンプル期間
ハイパーコンバージド プラットフォームでの SQL Server TPC-C テストでは、ハイブリッド モード、オールフラッシュ (AF) モード、およびオールフラッシュ データ削減 (AF DR) におけるクラスター全体のワークロード バランスを調べます。 AF バージョンは、個々の VM が 3,112.4 TPS から 3,130.4 TPS で実行され、ハイブリッドよりわずかに優れたパフォーマンスを示し、合計スコアは 12,472.8 TPS で、全体の最高スコアとなりました。 DR 構成はテスト構成の下限にあり、個々の VM は 2,982.1 TPS から 3,009.6 TPS で実行され、合計スコアは 11,969.1 TPS でした。
SQL Server TPC-C テストの場合、最も注目する変数は平均待機時間です。トランザクション パフォーマンスの小さなギャップでは、全体像がわかりません。平均レイテンシ テストでは、AF バージョンの最高スコアである 64 ミリ秒が、ハイブリッドの最低スコアと同じであることがわかりました。 AF の平均スコアも 53 ミリ秒でした。再び DR 構成がパックの最後に配置され、最低値は 236 ミリ秒、最高値は 278 ミリ秒、平均値は 261 ミリ秒でした。
システムベンチのパフォーマンス
各 Sysbench VM は 92 つの vDisk で構成されています。447 つはブート用 (約 400 GB)、もう 16 つは事前構築済みデータベース用 (約 64 GB)、XNUMX 番目はテスト対象データベース用 (XNUMX GB) です。システム リソースの観点から、各 VM に XNUMX 個の vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。
Sysbench テスト構成 (VM ごと)
- CentOS 6.3 64 ビット
- ストレージ占有面積: 1TB、800GB 使用
- Percona XtraDB 5.5.30-rel30.1
- データベーステーブル: 100
- データベースのサイズ: 10,000,000
- データベーススレッド: 32
- RAMバッファ: 24GB
- テスト時間: 12 時間
- 6 スレッドのプリコンディショニングに 32 時間
- 1時間 32スレッド
- 1時間 16スレッド
- 1時間 8スレッド
- 1時間 4スレッド
- 1時間 2スレッド
Sysbench OLTP を使用して、それぞれの 8VM 構成を調べます。 AF はわずかにトップとなり、4,273 TPS から 4,259 TPS でハイブリッドを押しのけました。 DR 構成のスコアは 3,625 TPS でした。
平均レイテンシを見ると、AF がハイブリッドよりも大幅に高くなく、それぞれ 60.1 ミリ秒から 60.3 ミリ秒であることは少し驚きです。 DR は 71 ミリ秒のレイテンシではるかに高いスコアを記録しました。
平均 99 パーセンタイル レイテンシでも、AF とハイブリッドのレイテンシがわずかに減少し、それぞれ 126 ミリ秒から 131 ミリ秒でした。 DR の遅延は 212 ミリ秒とはるかに高かった。
VMmark パフォーマンス分析
すべてのアプリケーション パフォーマンス分析と同様に、当社は、実際の運用環境で製品がどのようにパフォーマンスを発揮するかを、企業のパフォーマンスに関する主張と比較して示すことを試みます。当社は、大規模システムのコンポーネントとしてストレージを評価することの重要性、最も重要なのは、主要なエンタープライズ アプリケーションと対話する際のストレージの応答性を評価することの重要性を理解しています。このテストでは、 VMware による VMmark 仮想化ベンチマーク マルチサーバー環境の場合。
VMmark はその設計上、リソースを大量に消費するベンチマークであり、ストレージ、ネットワーク、コンピューティング アクティビティに重点を置く VM ベースのアプリケーション ワークロードが幅広く混在しています。仮想化パフォーマンスのテストに関しては、これより優れたベンチマークはほとんどありません。VMmark はストレージ I/O、CPU、さらには VMware 環境のネットワーク パフォーマンスに至るまで、非常に多くの側面を調査しているからです。
ここでは、データ削減 VSAN 構成を備えたハイブリッドおよびオールフラッシュの両方における VMmark の全体的なパフォーマンスとアプリケーションのパフォーマンスの内訳を見ていきます。
圧縮と重複排除が有効になっている 18 個のタイルに対応する VSAN は、これまでにテストしたデータ削減機能を備えた最高パフォーマンスのストレージ システムです。過去のベンチマークでは、オールフラッシュ アレイの前に専用の重複排除アプライアンスを配置した場合、8 タイルで最高を記録しました。
この 18 タイル オールフラッシュ VSAN の実行中にホストの 80 つの CPU リソースを確認すると、システムの CPU 使用率は 85 ~ XNUMX% 付近で推移していました。そのため、ストレージの面ではこれ以上の向上はできませんでしたが、クラスターにはまだリソースが残っていました。
HCIbench テスト構成
- 16個のVM
- VMあたり10 VMDK
- 10GB VMDK (1.6TB フットプリント)
- 50GB VMDK (8TB フットプリント)
- 100GB VMDK (16TB フットプリント)
- フルライトストレージの初期化
- 1.5 時間のテスト間隔 (30 分のプレコンディショニング、60 分のテストサンプル期間)
VMware VSAN のハイブリッド構成と AF DR 構成をテストするために、ワークロード プロファイルに 1.6 つの異なる構成をデプロイしました。これらには、ホットデータの増加に応じてプラットフォームがどのように反応するかを示すために、800 TB(ハイブリッドの場合は完全にキャッシュ内)、16 GB(AF DR の場合は完全にキャッシュ内)、XNUMX TB(キャッシュの外にこぼれる)のフットプリントが含まれます。これらのサイズは、キャッシュまたは階層化用にプロビジョニングされるフラッシュの量に応じて、プラットフォームごとに調整できます。
StorageReview の HCIbench ワークロード プロファイル
- 4K ランダム 100% 読み取り
- 4K ランダム 100% 書き込み
- 8K ランダム 70% 読み取り / 30% 書き込み
- 32K シーケンシャル 100% 読み取り
- 32K シーケンシャル 100% 書き込み
最初の HCIbench テストでは、完全にランダムな 4K ワークロード プロファイルを使用して、VMware VSAN プラットフォームからのピーク ランダム スループットを調べます。データをキャッシュに移動して完全にウォームアップすると、ハイブリッドは 888MB/s の読み取りと 249MB/s の書き込みを実現し、キャッシュ内の占有面積は 1.6TB になりました。 AF DR はキャッシュに 800 GB のフットプリントを備えており、読み取り 1,414 MB/秒、書き込み 160 MB/秒を実現しました。最大 16 TB のデータセット(キャッシュ外に流出)では、ハイブリッドでは読み取り 26 MB/秒、書き込み 56 MB/秒が得られましたが、AF DR は読み取り 423 MB/秒、書き込み 151 MB/秒という驚くべきパフォーマンスでした。
次に、同じ 4K プロファイルのピーク I/O を調べます。ここでも同様の結果が見られました。キャッシュ内の 1.6 TB データセットのハイブリッドでは、読み取り 227,342 IOPS と書き込み 63,868 IOPS の結果が得られましたが、キャッシュ内の AF DR の 800 GB データセットの結果は、読み取り 361,923 IOPS と書き込み 41,031 IOPS でした。 16 TB データセットでは、ハイブリッドでは読み取り 6,747 IOPS と書き込み 14,404 IOPS が得られ、AF DR では読み取り 108,365 IOPS と書き込み 38,778 IOPS が得られました。
次のメトリクスは、完全にランダムな 4K ワークロード プロファイルの平均レイテンシーを調べます。ハイブリッドのインキャッシュ 1.6TB フットプリントの読み取り遅延は 1 ミリ秒、書き込み遅延は 4 ミリ秒でした。 AF DR のキャッシュ内の 800 GB のフットプリントは、読み取りレイテンシが 0.88 ミリ秒、書き込みレイテンシが 8.29 ミリ秒でした。 16 TB のデータセットがキャッシュから溢れ出ると、ハイブリッドは常にレイテンシが高い 10 の回転ディスクに溢れ出るのに対し、AF DR はフラッシュ ドライブ上に留まるため、結果に大きな差異が生じることは明らかです。ここでは、ハイブリッドのレイテンシは読み取り 47 ミリ秒、書き込み 23 ミリ秒でしたが、AF DR のレイテンシは読み取り 1.65 ミリ秒、書き込み 4.66 ミリ秒でした。
次のテストでは、8% の読み取りアクティビティと 70% の書き込みアクティビティが混在する、より大きな 30K データ プロファイルを調べます。ここでは、キャッシュ内のハイブリッド (1.6 TB のフットプリント) が 947.9 MB/秒に達しました。キャッシュ内の AF DR (800 GB) のパフォーマンスは 631.5 MB/秒でした。より大きな 16 TB データセットがキャッシュから溢れ出すと、ハイブリッドのパフォーマンスは 67 MB/秒に低下し、AF DR では 530 MB/秒に低下しました。
次に、同じ 8k 70/30 ワークロードの I/O パフォーマンスを見ていきます。ハイブリッド 1.6 TB のフットプリントは 121,329 IOPS を記録し、AF DR は 80,834 IOPS を記録しました。 16 TB データセットがキャッシュから溢れ出すと、どちらの構成でもパフォーマンスが低下し、ハイブリッドでは 8,584 IOPS を記録し、AF DR では 67,882 IOPS を記録しました。
8k 70/30 の平均レイテンシを見ると、上記と同様の配置が見られました。キャッシュ内では、ハイブリッドのレイテンシは 2 ミリ秒、AF DR のレイテンシは 3.94 ミリ秒でした。大規模なデータセットがキャッシュから溢れ出すと、ハイブリッドは 37 ミリ秒まで跳ね上がりましたが、AF DR は実際には 2.63 ミリ秒まで低下しました。
最後のワークロードは、32K のシーケンシャル読み取りおよび書き込みプロファイルで構成されるピーク帯域幅の焦点に切り替わります。ハイブリッドのキャッシュ内パフォーマンスは読み取り 2,699MB/s と 1,193MB/s を示し、AF DR のキャッシュ内パフォーマンスは読み取り 1,971MB/s と書き込み 1,353MB/s を示しました。より大きな 16 TB データセットでは、ハイブリッドでは読み取り 2,490 MB/秒、書き込み 1,082 MB/秒、AF DR では読み取り 975 MB/秒、書き込み 495 MB/秒が確認されました。
I/O パフォーマンスも同様の結果を示し、ハイブリッドの方が AF DR よりも優れたパフォーマンスを示しました。インキャッシュでは、ハイブリッドのパフォーマンスは読み取り 86,379 IOPS、書き込み 38,184 IOPS でしたが、AF DR のパフォーマンスは読み取り 63,068 IOPS、書き込み 43,302 IOPS でした。より大きなデータセットがキャッシュから取り出されると、ハイブリッドでは読み取り 79,703 IOPS と書き込み 34,611 IOPS が得られ、AF DR では読み取り 31,205 IOPS と書き込み 15,830 IOPS が得られました。
平均的なレイテンシーでは、ハイブリッドではキャッシュ内で 3 ミリ秒の読み取りと 8 ミリ秒の書き込みが発生し、キャッシュからの流出は 4 ミリ秒の読み取りと 9 ミリ秒の書き込みでした。一方、AF DR では、キャッシュ内での読み取りが 5.29 ミリ秒、書き込みが 7.46 ミリ秒、キャッシュからの書き込みが 5.78 ミリ秒と 11.47 ミリ秒でした。
まとめ
VMware VSAN 6.2 は、組織に新しいエキサイティングな方法でフラッシュを活用する機会を与え、効率とパフォーマンスの両方を向上させます。新しいリリースのハイライトには、消去コーディング、RAID5 サポート、重複排除と圧縮が含まれます。これらはすべて、容量の観点からフラッシュを最大限に活用することに明らかにつながります。データ削減のメリットはワークロードと構成によって異なりますが、3 ~ 6 倍の容量の増加を期待するのが妥当です。これは基本的に、比較的手頃な価格の 1 TB ドライブが効果的に 3 ~ 6 TB を提供できることを意味します。この利点だけでも 6.2 は価値のあるアップグレードとなり、Flash が優れた優位性を発揮できるようになります。
パフォーマンスに目を向けると、オールフラッシュ構成を適切に説明するには少しニュアンスが必要になります。 VSAN 6.2 は、以前にテストしたハイブリッド構成と比較した場合、指数関数的な利益をもたらしません。これにはいくつかの基本的な理由があります。まず、VSAN はディスク グループごとにシングル スレッドであるため、すべてのフラッシュ ドライブを可能な限り効果的に活用する能力が制限されます。 VMware はシステム レベルで VSAN のオーバーヘッドを最小限に抑えることに重点を置いているため、これは設計上の決定です。これは、VMware が将来のリリースでバランスを調整することを選択する領域になる可能性があります。次に、データ削減機能を有効にすると、オールフラッシュ構成ではハイブリッドよりもパフォーマンスが低下することがわかります。表面的には、これは問題のように見えるかもしれませんが、データ削減の経験がある人にとっては、これまで見てきたすべてのケースでパフォーマンスに大きなペナルティが発生します。競合する HCI ソリューションでは、80% を超えるオーバーヘッドが発生することが何度も見られました。このコンテキストは重要です。データ削減を有効にした VSAN オール フラッシュは実際にこの点で非常に優れたパフォーマンスを発揮し、古いハイブリッド構成で可能であった 18 タイルの VMmark スコアと一致しました。さらに、VMware は、オールフラッシュ構成を購入するほとんどの顧客がデータ削減機能を有効にして実行しているため、VSAN の効率が非常に重要であることを示しています。
現在、データ削減は全か無かの設定であり、データストア全体に適用されます。 VMware は、重複排除の効果を最大化するためにこれを行います。データ削減サーバーのリソース ヒットは、この場合の重要なセールス ポイントである容量の拡張によって解消されます。 24 ノード、サーバーあたり XNUMX ドライブの構成 (VSAN では非常に一般的) では、HDD 容量と同等またはそれを超えるために、より小さい/より少ない SSD を使用できることを意味します。もちろん、これは、低消費電力、冷却必要性の軽減、動作許容範囲の拡大など、SSD が提供する他のすべての利点に加えて行われます。
テストでは、MySQL や Microsoft SQL Server OLTP のパフォーマンス、VMware や HCIbench による VMmark 仮想化ベンチマークなど、さまざまなアプリケーション テストを実行しました。 SQL Server では、オールフラッシュ バージョンが 12,472.8 TPS の合計スコアで最高のパフォーマンスを示しました。データ削減を伴うオールフラッシュ (AF) (AF DR) も、合計スコア 11,969.1 TPS で良好なパフォーマンスを示しました。 SQL Server の遅延では、AF VSAN の全体的な遅延が最も低く、合計スコアは 53 ミリ秒で、ハイブリッド バージョンよりも約 30% 低くなりました。当然のことながら、AF DR VSAN の遅延ははるかに高く、合計 261 ミリ秒でした。 SysBench テストでは、AF のパフォーマンスがハイブリッド バージョン (4,273 ~ 4,259 TPS、スケーリングされた平均遅延 60.1 ミリ秒 ~ 60.3 ミリ秒、最悪の場合の遅延 126 ミリ秒 ~ 131 ミリ秒) よりわずかに優れていたことに注目するのは興味深いことです。データ削減を有効にすると、AF DR VSAN のパフォーマンスは低下しましたが、スケールされた 3,625 秒あたりのトランザクション数は 71、スケールされた平均遅延は 212 ミリ秒、最悪の場合の遅延は XNUMX ミリ秒でした。
VMmark とデータ削減が有効になっている場合、AF DR VSAN は 18 タイルに達することができました(以前の最高のデータ削減システムは 8 タイルしかヒットしませんでした)。これにより、VMmark テストでは、AF DR VSAN がデータ削減を備えた最高パフォーマンスのストレージ アレイとなりました。私たちが検討した最後のテストは HCIbench でした。これはシステムの最大機能を示すものではありませんが、AF DR VSAN とハイブリッド VSAN を比較するための優れたメトリックを提供します。 4k HCIbench テストでは、AF DR VSAN は、キャッシュ内テストとキャッシュ外への流出テストの両方で、特に読み取りにおいてハイブリッド バージョンよりも優れたパフォーマンスを示しました。 AF DR は、4MB/s、1,1414 IOPS、平均遅延 361,923ms という高い 0.9k 読み取り数を達成することができました。 8k 70/30 テストを見ると、キャッシュ内ではハイブリッドのパフォーマンスが向上し、キャッシュから流出した後の AF DR のパフォーマンスは劇的に向上しました。 32k の連続テストでは、ハイブリッド VSAN はキャッシュ内外の両方で AF DR VSAN よりも優れたパフォーマンスを示しました。
このレビューでは、初期のハイブリッド VSAN 構成とオール フラッシュ展開の間で多くの比較を行いました。ハイブリッドは最初のテストでよく持ちこたえ、現在でもその強さを示しています。ハイブリッド構成でキャッシュ層が同じで、オール フラッシュ構成とワーキング セットがキャッシュ内に残る場合、6.2 つのパフォーマンスは比較的近いものになります。ただし、オール フラッシュ構成では、フラッシュが提供する包括的な利点に加えて、XNUMX のすべての新機能による利点も得られます。さらに、SSD に対する価格引き下げ圧力とデータ削減の組み合わせにより、オール フラッシュ VSAN の TB あたりのコスト効率がハイブリッドよりも高くなる可能性もあります。
メリット
- これまでにテストしたデータ削減機能を備えた最強のパフォーマンス プラットフォーム
- VSAN 6.2 は、フラッシュの利点を活用する一連の新機能をもたらします
- セットアップは非常に簡単です。仮想化管理者が快適に管理できる
デメリット
- VSAN は、キャッシュ層と容量層のドライブを分離します。フラッシュ用の単層アーキテクチャは価値がある可能性がある
- VSAN 内のシングルスレッド ディスク グループにより、パフォーマンス向上の可能性が制限される
ボトムライン
VMware VSAN 6.2 は、多数のデータ効率化機能をプラットフォームに追加し、オール フラッシュ VSAN 導入で機能、パフォーマンス、容量の魅力的な組み合わせを実現しながら、フラッシュがもたらす周辺機器の利点をすべて活用できるようにします。
StorageReview ニュースレターにサインアップする