今年のオープン コンピューティング プロジェクトで、東芝は NVMe over Fabrics (NVMe-oF) に関する新しいソフトウェアである KumoScale のリリースを発表しました。 KumoScale は、分離、抽象化、管理統合を通じて、データセンター ネットワーク上で直接接続された NVMe ドライブのパフォーマンス上の利点を最大化するように設計されています。このソフトウェアは、ディスクレス コンピューティング ノード (ブート ドライブのみ) が高速ファブリック ネットワーク接続を介してこのフラッシュ ストレージにアクセスできるようにすることで、すでに高性能の NVMe SSD を実現します。このタイプの接続では、ネットワーク ストレージのパフォーマンスがピークに近くなります。
今年のオープン コンピューティング プロジェクトで、東芝は NVMe over Fabrics (NVMe-oF) に関する新しいソフトウェアである KumoScale のリリースを発表しました。 KumoScale は、分離、抽象化、管理統合を通じて、データセンター ネットワーク上で直接接続された NVMe ドライブのパフォーマンス上の利点を最大化するように設計されています。このソフトウェアは、ディスクレス コンピューティング ノード (ブート ドライブのみ) が高速ファブリック ネットワーク接続を介してこのフラッシュ ストレージにアクセスできるようにすることで、すでに高性能の NVMe SSD を実現します。このタイプの接続では、ネットワーク ストレージのパフォーマンスがピークに近くなります。
このソフトウェアは標準の x86 システム プラットフォームで使用できますが、レビューでは Newisys NSS-1160G-2N デュアル ノード サーバーを利用しています。 Newisys NSS-1160G-2N プラットフォームは、NVMe ドライブのホット スワップ、ネットワークからドライブへのバランスのとれたスループット、コールドアイル FRU ベースのサービス、冗長電源と冷却、その他の主要なスケールを備えたハイパースケール サービス モデル向けに最適化されています。データセンターの要件を満たさないこと。当社のサーバーは、100 つのノードに 8x Toshiba NVMe SSD を搭載した 740 枚の 100G Mellanox カードを介してストレージを提供し、5 番目のノードは管理目的に使用されます。負荷生成は、デュアル 16G Mellanox ConnectX-1 NIC を介して Newisys に直接接続された単一の Dell PowerEdge RXNUMXxd から行われます。 Newisys は、コンパクトな XNUMXU フォーム ファクタに最大 XNUMX 台の NVMe およびデュアル Xeon サーバー ボードを搭載でき、直接接続ドライブにより最小のレイテンシと最高のパフォーマンスを実現するように最適化されています。ただし、サーバーはラックに設置されているものよりも少し長くなっています。 。
KumoScale には、従来の直接接続 SSD に比べて他にもいくつかの利点があります。 NVMe-oF ユーザーは、より少ないノードでさらに高い計算能力とストレージを利用できます。ノードの数が少ないということは、ノードをより適切に管理でき、コストを削減できることを意味します。コスト削減の一部は、滞留したストレージとコンピューティング能力の排除によるものです。 KumoScale は、Restful API を使用して複数のオーケストレーション フレームワークと統合します。最も興味深いのは、Kubernetes と連携して動作することです。これにより、コンテナ ストレージに Kubernetes を利用する企業は、適切な量のプロビジョニングされたストレージを使用して、はるかに高いパフォーマンスで利用できるようになります。 Kubernetes の他に、KumoScale は OpenStack、Lenovo XClarity、Intel RSD とも連携します。
マネジメント
少し際立っている点として、KumoScale にはかなり無駄がなく直感的な GUI が付属しています。通常、このタイプのソリューションは CLI を通じて制御されます (実際、いくつかの側面は今後も制御されます)。ダッシュボード タブでは、ユーザーはストレージ パフォーマンス、システム容量、ハードウェアのステータスを簡単に確認でき、個々の SSD のステータスをさらに詳しく調べることができます。
次のタブはネットワーク タブで、コントローラの可用性とリンク ステータス、タイプ、速度、MAC アドレス、MTU が表示されます。
ストレージ タブは 4 つのサブタブに分かれています。最初のサブタブは物理 SSD です。ここでユーザーは、ドライブの名前、使用可能かどうか、シリアル番号、容量、グループの使用状況、残りの寿命の割合を確認できます。
仮想化ストレージ グループの次のサブタブ。このサブタブは上記と同様で、名前、可用性、容量、利用可能なスペース、仮想化元の物理 SSD、およびそのターゲットが表示されます。
次のサブタブ「ターゲット」では、上記のターゲットを拡張し、グループ ボリュームを含む、ホストに公開されている仮想化ストレージを表示します。
ストレージの下の最後のサブタブは、「イニシエーター」タブです。このタブには、イニシエータ名、エイリアス (この場合は Dell)、およびアクセス数が表示されます。ユーザーは、ターゲットとイニシエーターのペアにアクセス制御 (ACL) を付与できます。
次のメインタブは「ストレージパフォーマンス」です。ここでユーザーは、特定の時間枠におけるスループット、IOPS、レイテンシーの読み取り値を確認できます。
最後に、ネットワーク パフォーマンスについて説明します。これにより、一定期間のパフォーマンス指標、帯域幅、パケットの内訳もユーザーに提供されます。
性能
VDBench ワークロード分析
ストレージ アレイのベンチマークに関しては、アプリケーション テストが最適であり、合成テストは 740 番目になります。実際のワークロードを完全に表現しているわけではありませんが、合成テストは、競合ソリューション間での完全な比較を容易にする再現性係数を備えたストレージ デバイスのベースラインを確立するのに役立ちます。これらのワークロードは、「XNUMX コーナー」テスト、一般的なデータベース転送サイズ テスト、さまざまな VDI 環境からのトレース キャプチャに至るまで、さまざまなテスト プロファイルを提供します。これらのテストはすべて、スクリプト エンジンを備えた共通の vdBench ワークロード ジェネレーターを利用して、大規模なコンピューティング テスト クラスターの結果を自動化して取得します。これにより、フラッシュ アレイや個々のストレージ デバイスを含む幅広いストレージ デバイスにわたって同じワークロードを繰り返すことができます。アレイ側では、Dell PowerEdge RXNUMXxd サーバーのクラスターを使用します。
プロフィール:
- 4K ランダム読み取り: 100% 読み取り、128 スレッド、0 ~ 120% iorate
- 4K ランダム書き込み: 100% 書き込み、64 スレッド、0 ~ 120% iorate
- 64K シーケンシャル読み取り: 100% 読み取り、16 スレッド、0 ~ 120% の iorate
- 64K シーケンシャル書き込み: 100% 書き込み、8 スレッド、0 ~ 120% iorate
- 合成データベース: SQL および Oracle
- VDI フル クローンおよびリンク クローン トレース
4K のピーク読み取りパフォーマンスでは、KumoScale を搭載した Newisys (対象となる唯一のデバイスであるため、このレビューの残りの部分では「ストレージ ノード」と呼びます) は、テスト全体を通じてミリ秒未満のパフォーマンスを示し、最高で 2,981,084 IOPS に達しました。レイテンシー260μs。
4K ピーク書き込みパフォーマンスでは、ストレージ ノードのピークは 1,926,637 IOPS、遅延は 226μs でした。
64K ピーク読み取りに切り替えると、ストレージ ノードのピーク パフォーマンスは 213,765 IOPS または 13.36GB/s となり、レイテンシは 441μs になりました。
64K シーケンシャル ピーク書き込みの場合、ストレージ ノードは 141,454μs のレイテンシーで 8.83 IOPS または 432GB/s に達しました。
SQL ワークロードでは、ストレージ ノードのピークは 1,361,815 IOPS、レイテンシは 179 μs でした。
SQL 90-10 ベンチマークでは、わずか 1,171,467μs のレイテンシで 210 IOPS のピーク パフォーマンスが確認されました。
SQL 80-20 ベンチマークでは、ストレージ ノードが 987,015μs のレイテンシで 248 IOPS のピーク パフォーマンスに達していることが示されました。
Oracle Workload では、ストレージ ノードのピーク パフォーマンスは 883,894 IOPS、レイテンシは 280 μs でした。
Oracle 90-10 は、967,507μs のレイテンシで 176 IOPS のピーク パフォーマンスを示しました。
Oracle 80-20 では、ストレージ ノードは 829,765μs の遅延で 204 IOPS に達することができました。
次に、VDI クローン テスト (完全およびリンク) に切り替えました。 VDI フル クローン ブートの場合、ストレージ ノードのピークは 889,591 IOPS、遅延は 261 μs でした。
VDI フル クローンの最初のログインでは、ストレージ ノードが 402,840μs のレイテンシーで 562 IOPS のピークに達しました。
VDI フル クローンの月曜日のログインでは、ピーク パフォーマンスが 331,351 IOPS、遅延が 369μs でした。
VDI リンク クローンに移行すると、ブート テストでは 488,484 IOPS のピーク パフォーマンスと 234 μs のレイテンシが示されました。
初期ログインのパフォーマンスを測定するリンク クローン VDI プロファイルでは、ストレージ ノードのピークは 194,781 IOPS、遅延は 318 μs でした。
最後のプロファイルでは、VDI リンク クローンの月曜日のログインのパフォーマンスを調べました。ここで、ストレージ ノードのピークは 247,806 IOPS、遅延は 498μs でした。
まとめ
ブロック ストレージのパフォーマンスを最大化するように設計された KumoScale ソフトウェアは、NVMe SSD をプールして、NVMe-oF を介して数千のジョブ インスタンスで共有できる適切な量の容量と IOPS を提供します。これにより、クラウド ユーザーは柔軟性、拡張性、効率性が向上します。 KumoScale は、ストレージ ノードを作成するためにいくつかの異なるハードウェア オプションで使用できますが (東芝では、Intel Xeon CPU E5-2690 v4 @2.30GHz または同等品と 64GB の DRAM を推奨します)、ここでは Newisys NSS-1160G-2N デュアル ノード サーバーを使用しました。 NVMe-oF はストレージにピークに近いパフォーマンスをもたらすだけでなく、KumoScale は Kubernetes、OpenStack、Lenovo XClarity、Intel RSD などの複数のオーケストレーション フレームワークとも連携します。
Toshiba KumoScale を搭載した Newisys システムは、パフォーマンスの面で間違いなく雷をもたらすことができます。ストレージ ノードは 1 ミリ秒を超えるところはなく、最大遅延は VDI FC の初期ログインで 562 μ秒でした。ハイライトとしては、3K 読み取りでほぼ 4 万 IOPS、2K 書き込みでほぼ 4 万 IOPS、SQL ワークロードで 1.3 万 IOPS、SQL 1.1-90 で 10 万 IOPS、SQL 1-80 でほぼ 20 万 IOPS が挙げられます。 64K シーケンシャル パフォーマンスの場合、ストレージ ノードの読み取り速度は 13.36 GB/秒、書き込み速度は 8.83 GB/秒に達しました。
パフォーマンスが天文学的なものであることに疑問の余地はありませんが、KumoScale を状況に合わせて配置すると、その性能がさらに輝きます。このプラットフォームを使用すると、他の非 NVMe-oF プラットフォームよりも遅延とパフォーマンスが大幅に向上します。レイテンシはローカル ストレージのパフォーマンスに近くなります。これはまさに NVMe-oF プロトコルが目指しているものであり、これらのシステムが位置付けられているアプリケーションが必要とするものです。ただし、本当に重要なのは、このシステムによる大規模なパフォーマンスです。実稼働システムには複数のストレージ ノードがあり、それぞれに独自のストレージ プールがある場合、8 つのストレージ ノード内の XNUMX つの SSD のパフォーマンスを調べました。意図したシナリオでのパフォーマンスは、従来のストレージ アレイの指標を簡単に吹き飛ばし、NVMe-oF アレイに関しては KumoScale を革新的なものにします。東芝は、KumoScale を使用してパフォーマンス効率の向上に非常に優れた成果を上げており、評価と開発用の GUI も備えています。 Newisys シャーシと組み合わせるこのソリューションは、Toshiba KumoScale ソフトウェアが提供するスループットと遅延の利点を活用できる大規模データセンターで確実に成功します。
StorageReview ニュースレターにサインアップする