Datrium は、次世代のコンバージド インフラストラクチャと呼ばれる「オープン コンバージェンス」を提供します。エンタープライズ IT 分野にはベンダーの数と同じくらい、コンバージェンスについての難題が存在する可能性があります。Datrium は、インフラストラクチャがどのようなものになるかというビジョンを宣伝することを躊躇しません。 Datrium の見解では、コンピューティング、プライマリ ストレージ、セカンダリ ストレージ、クラウドが、ストレージのクラスごとにサイロ化することなく、スケーラブルで管理が容易な復元力の高い構成で統合されると考えています。さらに、ほとんどのデータ呼び出しはオンボード フラッシュ キャッシュを備えたコンピューティング ノードにアクセスするため、Datrium はほぼすべてのケースでデータノードにアクセスすることなく、驚異的なパフォーマンスを実現できます。これは、ピーク時の 200K 読み取りおよび書き込み帯域幅と 16M IOPS 32K ランダム読み取りで 18 GB/秒と 4 GB/秒に相当します。
Datrium は、次世代のコンバージド インフラストラクチャと呼ばれる「オープン コンバージェンス」を提供します。エンタープライズ IT 分野にはベンダーの数と同じくらい、コンバージェンスについての難題が存在する可能性があります。Datrium は、インフラストラクチャがどのようなものになるかというビジョンを宣伝することを躊躇しません。 Datrium の見解では、コンピューティング、プライマリ ストレージ、セカンダリ ストレージ、クラウドが、ストレージのクラスごとにサイロ化することなく、スケーラブルで管理が容易な復元力の高い構成で統合されると考えています。さらに、ほとんどのデータ呼び出しはオンボード フラッシュ キャッシュを備えたコンピューティング ノードにアクセスするため、Datrium はほぼすべてのケースでデータノードにアクセスすることなく、驚異的なパフォーマンスを実現できます。これは、ピーク時の 200K 読み取りおよび書き込み帯域幅と 16M IOPS 32K ランダム読み取りで 18 GB/秒と 4 GB/秒に相当します。
基本的に、Datrium は、DVX システムを構成するコンピューティング ノードとストレージ ノードで構成されます。コンピューティング ノードは Datrium によって提供されることも、顧客が独自の既存のサーバー インフラストラクチャを活用することもできます。コンピューティング ノードは IO 処理を処理し、キャッシュをフラッシュ上にローカルに保持します。フラッシュには、低コストの大容量 SATA ドライブから高性能 NVMe まで、ほぼあらゆるものを使用できます。フラッシュに関する決定は完全にワークロードに依存しており、顧客のニーズに合わせて調整できます。永続データはデータ ノード上に存在するため、コンピューティング ノードはステートレスであり、データの損失や破損の危険を冒さずにオフラインにすることができ、n-1 の可用性を維持します。 Datrium は、vSphere 5.5 ~ 6.5、Red Hat 7.3、CentOS 7 1611、ベアメタル Docker 1.2 などのさまざまな環境をサポートしています。
データノードはデータの永続的なコピーを維持し、ディスク構成またはフラッシュ構成で使用できます。 Datrium DVX 内では、データは常に圧縮され、グローバルに重複排除され、二重フォールト トレランスで消去符号化されます。 Datrium は、DVX 内で暗号化、スナップショット、レプリケーションも提供します。データ ノードはすべての処理をコンピューティング ノードに依存し、ストレージ システムがデュアル ホットスワップ対応コントローラーを介して IO を提供できるようにします。データノードには、高速書き込みのためのミラーリングされたバッテリーバックアップの NVRAM と、ロード バランシングとパス フェイルオーバーを備えた高速イーサネット ネットワーキングが含まれています。 Datrium の最新ノードには、フラッシュ エンドツーエンドの DVX が含まれています。これは、オールフラッシュ DVX データノードに加えて、コンピューティング ノードにもフラッシュがあることを意味します。 F12X2 データ ノードには 16 TB の使用可能なストレージ (12×1.92 TB SSD) があり、32 ~ 96 倍のデータ削減と 2 GbE ネットワーキングのサポートにより最大 6 ~ 25 TB の実効容量を実現します。最新の計算ノード CN2100 には、新しい Skylake CPU、NVMe サポート、最大 25GbE ネットワークが追加されています。
このレビューは、32 台の Dell PowerEdge C6320 コンピューティング ノードと 10 台の Datrium DVX オールフラッシュ データ ノードで構成された Datrium テスト環境にリモートでアクセスできたという点で、やや独特です。
- 32 x Dell PowerEdge C6320 サーバー
- VMware ESXi 6.0 Update3がインストールされている
- デュアル Xeon CPU E5-2697 v4 CPU
- 128GBメモリ
- データ キャッシュとして 4 x 1.92TB Samsung PM863a SSD
- 2 x 10Gb/s NIC (管理/データ)
- ネットワーク構成
- コア スイッチ上の 10 個の F12X2 データ ノード
- 32 つの TOR スイッチ上の 8 のコンピューティング ノード
- 各 TOR スイッチにはコア スイッチへの 160 Gbps アップリンクがあります
マネジメント
DVX は、ブラウザ経由で HTML5 ベースのユーザー インターフェースを使用するか、VMware vCenter プラグインとして管理されます。 DVX UI の前提全体はシンプルさに依存しており、従来の方法でストレージを管理する必要がありません。ストレージのプロビジョニングからレプリケーション管理まで、すべてが同じ UI から行われます。
ユーザーは、クラスタ VM IOPS、スループット、ネットワーク転送速度、Datrium の平均読み取り/書き込みレイテンシー、ホスト フラッシュ ヒット レートに関するパフォーマンス情報を一目で確認できます。 Datrium DVX プラットフォームの階層構造を考慮すると、ホストと基盤となるデータ ノード間のパフォーマンス レベルをチェックすることは、全体的なパフォーマンスを測定するのに役立ちます。パフォーマンス メトリックに加えて、スナップショット スペースと合わせて合計データ フットプリントを示す合計使用可能容量と、現在のデータ削減メトリックも提供されます。
上のスクリーンショットで注目すべき興味深い項目の 4 つは、ネットワーク トラフィックです (4 つは 7.3K ランダム書き込みアクティビティを示し、もう XNUMX つは読み取りアクティビティを示しています)。 Datrium DVX は読み取りアクティビティにホスト側のフラッシュを利用し、書き込みアクティビティをデータ ノードにコミットするため、それがネットワーク速度で表されることがわかります。 XNUMXK ランダム テストでは、ネットワーク アクティビティは XNUMX GB/s と測定されましたが、内部ホスト フラッシュからデータを取得した読み取りテストでは、ネットワーク トラフィックは存在しませんでした。
パフォーマンスベンチマーク
このような大規模なクラスターのパフォーマンスを測定するために、導入が簡単で、数百の vdbench VM にわたるパフォーマンス データを集約できる機能から、VMware の HCIBench を選択しました。大規模なクラスターの場合、このツールを使用すると、エンタープライズ ストレージの測定に一般的に使用されるワークロードを迅速に増加できるだけでなく、ユーザー定義の繰り返しパターンを持つデータを処理できるようになりました。データ削減サービスを提供するプラットフォームの場合、ユーザーは現実世界に近い状況でパフォーマンスを示す機会が得られます。この場合、各ワークロードに 2:1 の圧縮設定を使用しました。すべてのベンチマークで、圧縮、重複排除、インライン消去コーディングが実行されていたことに注意してください。言い換えれば、すべてのベンチマークは完全な現実世界の動作条件で実施されました。
HCIbench 4K では、完全にランダムな 4K ワークロード プロファイルでのピーク ランダム スループットを調べます。 Datrium DVX は、読み取り 9.5725GB/s、書き込み 2.524GB/s を達成することができました。
次に、同じ 4K プロファイルでのピーク I/O を見ていきます。ここでも Datrium DVX は、読み取り IOPS が 2.45 万以上、書き込み IOPS が 646,162 を超えるという素晴らしい結果を示しました。
次のメトリクスは、完全にランダムな 4K ワークロード プロファイルの平均レイテンシーを調べます。ミリ秒未満の遅延ではありませんが、DVX は読み取り 1.05 ミリ秒、書き込み 3.96 ミリ秒という非常に優れた速度を達成することができました。
次のテストでは、8% の読み取りアクティビティと 70% の書き込みアクティビティが混在する、より大きな 30K ランダム データ プロファイルを調べます。ここでの DVX のスループットは 9,229.5GB/s でした。ピーク I/O を見ると、DVX は 1.18 万 IOPS を超えることができました。 8K 70/30 の遅延はわずか 2.17 ミリ秒であることが判明しました。
最後のワークロードは、32K のシーケンシャル読み取りおよび書き込みプロファイルで構成されるピーク帯域幅の焦点に切り替わります。ここで、DVX は 42.16GB/s の読み取りと 13.26GB/s の書き込みという驚異的な速度に達することができました。
同じワークロードのピーク I/O を見ると、DVX は読み取り IOPS が 1.349 万 424,282 万、書き込み IOPS が XNUMX を超えるという素晴らしい数字を出し続けています。
DVX は 32K テストで高い数値を示しましたが、読み取り 1.9 ミリ秒、書き込み 6.02 ミリ秒というかなり低いレイテンシですべてを締めくくりました。
統合プラットフォームであるため、ストレージ オーバーヘッドの一部はワークロード自体の操作に利用されるのと同じシステムから発生するため、CPU 使用率は考慮すべき重要な要素です。各ワークロード中にプラットフォームを監視しながら、vdbench を利用する HCIbench ワーカーを含むクラスター全体のパフォーマンス (方程式の両辺) をクラスター全体に分散し、ストレージ VM 自体のオーバーヘッドと組み合わせて調べました。
大量のシーケンシャル書き込みアクティビティ(作業の多くがフラッシュ ノードに直接オフロードされる)中に、使用されたシステム リソースは合計の 40% 未満でした。 4K ランダム読み取りワークロードなどの大量の読み取りアクティビティ中に、このメトリクスは 60% をわずかに超えるまで増加しました。そのため、システムがワークロードを処理し、VM がワークロードを消費している場合でも、CPU リソースの 60% が他のアプリケーションやワークロード用に残り、最悪の場合は 40% に低下しました。そのため、完全なインライン データ サービスが稼働する最悪のシナリオで、Insane モードが実行されている(最大ホスト使用率 40% 対通常 20%)場合でも、Datrium プラットフォームにはまだ十分なシステム リソースが残っています。
まとめ:
Datrium DVX ファミリは、最新世代のストレージおよびコンピューティング リソースをサポートするように更新されました。このケースでは、コンピューティング ノードのフラッシュ キャッシュと永続ストレージ用のオールフラッシュ データ ノードを含む、エンドツーエンドのフラッシュ構成に注目しました。 Datrium の「オープン コンバージェンス」プラットフォームには、より成熟した製品で一般的に見られるデータ サービスも含まれています。 Datrium DVX を使用すると、データは常に圧縮され、グローバルに重複排除され、二重フォールト トレランスで消去符号化されます。お客様は Datrium のコンピューティング ノードの使用を選択できますが、このレビューの場合と同様、必須ではありません(テストでは 32 個の Dell PowerEdge ノードを利用しました)。これらのコンピューティング ノードは、最大 20% の最小限のオーバーヘッドで IO 処理とキャッシュを処理します。ただし、より多くのストレージ パフォーマンスが必要なインスタンスの場合、DVX を Insane モードに設定すると、DVX はコンピューティング リソースの最大 40% を利用できます。
パフォーマンス面では、大規模な環境で Datrium DVX が実際に実行できることを最もよく反映するため、HCIbench ベンチマークを選択しました。オールフラッシュ DVX は、すぐに非常に印象的な数字を出しました。 4K ベンチマークでは、DVX は 9.57 GB/秒を超える読み取りスループットと 2.45 万 IOPS の読み取り、2.52 GB/秒を超える書き込みと 646 IOPS のスループットを達成しました。 DVX は、読み取り 1.05 ミリ秒、書き込み 3.96 ミリ秒という低いレイテンシでこれらの数値を達成しました。 8K 70% 読み取り 30% 書き込みに切り替えると、DVX は 9.2GB/秒を超えるスループット、1.18 万 IOPS を超える IOPS をすべて 2.17 ミリ秒のレイテンシーで実現しました。 32K シーケンシャル テストでは、DVX は 42.16 ミリ秒のレイテンシで、1.349 GB/秒の読み取りと 1.9 万 XNUMX 万を超える IOPS という驚異的な数値を達成しました。
明らかに、Datrium のコンバージェンスに対するスピンは独特です。ローカライズされたフラッシュを使用してコンピューティング ノードの「残りの」CPU を活用することは非常に理にかなっていますが、TCO のメリットをすべて得るためにフラッシュを永続ストレージとして維持することもできます。これを実現するための重要な要因は、DVX システムが提供するストレージ効率です。これは、データ ノードのフラッシュを最大限に活用するために重要です。さらに高いパフォーマンスが必要な場合は、コンピューティング ノードに NVMe ストレージを追加するのが簡単ですが、低コストのオプションで非常にうまくいったことは明らかです。ただし、回復力がなければ、どのようなパフォーマンスも意味がありません。 DVX を使用すると、コンピューティング ノードはステートレスになり、N-1 サーバー障害耐性モデルをサポートします。つまり、テスト構成内の 31 台のサーバーのうち 32 台が失われても、すべてのデータは利用可能なままになる可能性があります。すべてのサーバーが失われた場合でも、データの正式なコピーはコンピューティング ノードではなくデータ ノードに保存および保護されるため、DVX はデータを失いません。
結局のところ、現在のエンタープライズ IT において、コンバージド インフラストラクチャほど刺激的なものはほとんどありません。そのビジョンを実現する方法は数多くありますが、Datrium は、優れたパフォーマンス プロファイルと組み合わせた詳細なデータ管理サービスを含む DVX の提案をまとめました。しかし、コンバージェンス分野では、パフォーマンスと機能の両方を実行している企業はほとんどないため、Datrium の DVX は群を抜いた十分な装備を備えた製品となっています。
StorageReview ニュースレターにサインアップする