IT コミュニティに属する私たちは、ショー ホース (最速および/または最も強力なデバイスやシステム) に夢中になることがよくあります。なぜなら、ショー ホースが披露する大きな数字や小さな数字が大好きだからです。しかし現実には、ほとんどのユーザーは見せしめのような派手な力を単純に必要としていません。彼らが必要とする 主力、実際のワークロードを日常的に手頃な価格で提供できるシステム。私たちは、DataON のハイパーコンバージド インフラストラクチャ (HCI) 製品の調査にかなりの時間を費やし、 編集者が選んだインテル® Optane™ SSD 搭載 DataON HCI-224 昨年の受賞。この記事では、別の HCI-224 5 ノード クラスターについて説明します。ただし、このストレージは、QLC 4326D NAND を備えた Intel Optane SSD フロントエンド Intel® SSD D15.36-P3 XNUMXTB というユニークなストレージの組み合わせを特徴としており、容量、パフォーマンス、コストを最適化するシステムを作成します。
IT コミュニティに属する私たちは、ショー ホース (最速および/または最も強力なデバイスやシステム) に夢中になることがよくあります。なぜなら、ショー ホースが披露する大きな数字や小さな数字が大好きだからです。しかし現実には、ほとんどのユーザーは見せしめのような派手な力を単純に必要としていません。彼らが必要とする 主力、実際のワークロードを日常的に手頃な価格で提供できるシステム。私たちは、DataON のハイパーコンバージド インフラストラクチャ (HCI) 製品の調査にかなりの時間を費やし、 編集者が選んだインテル® Optane™ SSD 搭載 DataON HCI-224 昨年の受賞。この記事では、別の HCI-224 5 ノード クラスターについて説明します。ただし、このストレージは、QLC 4326D NAND を備えた Intel Optane SSD フロントエンド Intel® SSD D15.36-P3 XNUMXTB というユニークなストレージの組み合わせを特徴としており、容量、パフォーマンス、コストを最適化するシステムを作成します。
ただし、このクラスターに入る前に、まず DataON がストレージ容量階層として QLC を採用した理由について説明し、 Microsoft Azure スタック HCI、DataON および 2 ノード HCI クラスター。
インテル® SSD D5-P4326 シリーズ
この HCI クラスターの容量ストレージとして QLC ベースの Intel SSD D5-P4326 を使用することは、堅実で信頼性が高く、コスト効率の高いパフォーマンスを実現するため、論理的な選択です。確かに、より高速な SSD はありましたが、SSD D5-P4326 は、ドライブあたり 15.36 TB という大容量を備え、パフォーマンスとコストの適切なバランスを実現しています。この組み合わせは、その基礎となるアーキテクチャによるものです。インテル® QLC 3D NAND テクノロジーを使用することで、インテルはこのデバイスのコストを削減しながら、容量を増やすことができます。
Intel は、QLC ベースのドライブを製造した最初のストレージ ベンダーの 3 つです。 QLC またはクアッドレベル セル テクノロジーは XNUMX ビットのデータを単一セルに保存しますが、TLC、MLC、SLC などの古いテクノロジーはセルあたり XNUMX、XNUMX、または XNUMX ビットしか保存しません。 QLC の高密度ストレージにより、ストレージ XNUMX GB あたりのコストを下げることができます。さらに、インテルの XNUMXD NAND テクノロジーにより、これらのセルをチップ上で水平に積み重ねることができ、ストレージの密度がさらに向上します。 ただし、妥協点はあります。 Intel SSD D5-P4326 SSD を効果的に活用するには、QLC ベースのドライブに入る前に書き込みワークロードをバッファリングする必要があります。 QLC SSD は、容量が最適化された読み取り負荷の高いワークロードに最適です。そのため、HCI クラスターのようなプラットフォームは、均一なパフォーマンスを実現するために、QLC SSD の前に適切なキャッシュ デバイスを使用する必要があります。 DataON HCI-224の場合、 データを QLC レイヤーに移動する前に書き込みを吸収するために、ノードごとに 4800 台の Intel Optane SSD DC P750X NVMe 2.5GB XNUMX インチ ドライブが使用されます。このアプローチにより、過剰な書き込みによる QLC 層のパフォーマンス低下が防止されます。その結果、お客様はシームレスなエクスペリエンスと、Intel Optane ベースのパフォーマンスと QLC ベースの容量の理想的な組み合わせを得ることができます。
Microsoft Azure スタック HCI
簡単に言うと、Microsoft Azure Stack HCI は Microsoft Azure クラウド サービスのオンプレミス実装です。基本的に、Microsoft は既存の HCI テクノロジーを Azure Stack ファミリに導入し、顧客がバックアップやディザスター リカバリーなどの Azure 管理サービスに直接アクセスして仮想化アプリケーションをオンプレミスで実行できるようにしました。
Azure Stack HCI を Azure または Azure Stack Hub と混同しないでください。 Azure がパブリック クラウド サービスであるのに対し、Azure Stack Hub と Azure Stack HCI はオンプレミス ソリューションです。さらに、Azure Stack Hub は Azure サービスで Azure OS を実行し、IaaS および PaaS ソリューションです。一方、Azure Stack HCI は、Azure サービスで Windows Server OS を実行し、これまでと同じ方法で仮想化ワークロードを実行できるほか、追加サービスのために Azure クラウドに接続できるという利点もあります。これは大きな違いであり、IT 管理者は、Azure で使用しているものと同じツールと管理スタックを Azure Stack HCI 上で使用できるようになります。
Azure Stack HCI は、ハイパーバイザーに Hyper-V、ストレージに記憶域スペース ダイレクト、ネットワークに Microsoft Software Defined Networking (SDN)、管理に Windows Admin Center (WAC) を使用します。 Azure Stack HCI は、標準の x86 サーバーおよびその他のコモディティ コンポーネント上で実行されます。
WAC は、ローカルに展開されたブラウザベースの管理プラットフォームで、Windows 10 と Windows Server のオンプレミスと Azure クラウドベースの両方のインスタンスを管理できます。 WAC は Windows システムにインストールされ、PowerShell スクリプトを使用します。また、WinRM (Windows リモート管理) 上で Microsoft Windows Management Framework (WMF) を使用して、HCI クラスターや Azure 仮想マシンを含む Windows システムを監視および管理します。
WAC のメイン ダッシュボードには、監視対象のシステムの CPU、メモリ、ネットワーク、ディスク アクティビティの概要が表示されます。画面の左側には、WAC には、証明書、デバイス、イベント、ファイル、ローカル ユーザーとグループ、ファイアウォール、プロセス、レジストリ、役割と機能、サービス、ストレージなどの多数のシステム管理および参照ツールも含まれています。
DataON は、WAC のオープン フレームワークを利用した最初の企業の 1 つであり、その Management Utility Software Tool (MUST) 拡張機能を WAC に移植しました。 DataON は、Windows サーバーベースの HCI、ネットワーキング、ストレージのインフラストラクチャの可視化、監視、管理を提供する必要があります。
DataON HCI
Azure Stack HCI は汎用ハードウェア コンポーネントを使用しますが、最適な結果を提供するには、これらのアイテムが連携して動作するように設計する必要があります。ある意味、主力システムよりも高性能システムを設計する方が簡単です。高性能システムでは、コストを無視して最高のコンポーネントを選択できます。ただし、主力製品を使用する場合は、コンポーネントのコスト/パフォーマンスを評価し、パフォーマンスを最適化するためにコンポーネントを調整する必要があります。価値指向のシステムを提供するには、それ以上ではないにしても、同じくらいのエンジニアリングの労力が必要です。そしてこのシステムは 私たちが DataON に感銘を受け続けるのはエンジニアリングです。.
DataON は Microsoft および Intel の両方と強力なパートナーシップを結んでおり、Azure Stack HCI 向けのシステムをエンジニアリングする際にこれらの関係を活用しています。 DataON の HCI Intel Select ソリューションは、事前に構成して専用のラックに入れて出荷できるため、すぐに導入できます。この配信方法はデータセンターで役立つだけでなく、既存の IT インフラストラクチャや人材が限られているか存在しないエッジに導入されたシステムにも有益であることが証明されています。
2 ノード HCI クラスター
私たちは最近、 Microsoft Azure Stack HCI 2 ノード クラスターに関する記事 (2NC)。以下はその記事の要約です。 2NC は、多くのユースケースで組織に必要な回復力を提供できること、また 2NC は従来の 2 ノードまたは 2 ノードのクラスターよりも複雑でなく、コストも低いことがわかりました。 DataON は、2017NC の統合の価値を認識し、これを採用した最初のベンダーの XNUMX つです。ただし、XNUMXNC は DataON にとって新しいものではありません。XNUMX 年 XNUMX 月に DataON は最初の XNUMX つの商用利用可能な製品を発表しました。 ケプラー 47 HCI Windows Server 2016 記憶域スペース ダイレクト システム (現在は Azure Stack HCI) の場合。
DataON の 2NC 実装は、ドライブ障害とサーバー障害の両方を同時にサポートします。これは、RAID 5 + 1 を使用してパリティ回復力を実現し、それを他のサーバーにミラーリングすることで実現されます。 Microsoft はこの機能を「ネストされた復元力」と呼び、Windows Server 2019 の記憶域スペース ダイレクトにこの機能を追加しました。繰り返しになりますが、2NC はすべての人にとって適切なテクノロジの選択肢ではありませんが、信頼性が高くコスト効率の高いソリューションを多くの組織に提供できます。
ビルドとデザイン
ここで使用している Azure Stack HCI クラスターは、DataON HCI-224 オールフラッシュ NVMe プラットフォーム上に構築されています。これらのサーバーはサイズが 2U で、前面に 24 NVMe ベイを備え、背面に PCIe ベースのコンポーネント用の十分な拡張性を提供します。ラベルはマットブラックのドライブ キャディとは対照的に目立つ位置にあるため、交換が必要な場合に特定のドライブを簡単に見つけることができます。すべてにラベルが付けられており、それはそれほど珍しいことではありませんが、ラベルの範囲は異常でした。私たちの展開では、各ノードに (1 と 2) のラベルが付けられ、その他のいくつかの項目も付けられていたため、データセンターでの DataON システムの展開と管理が容易になりました。
このテストのノードにはデュアル 2 が含まれていました。nd Gen Intel® Xeon® Scalable Gold 6248 2.5 GHz、20 コア、28MB キャッシュ プロセッサ、32 つの Samsung 4GB DDR2933 256MHz ECC レジスタ RDIMM (ノードあたり合計 4510GB)、およびデュアル Intel S480 2GB SATA M.XNUMX ブート ドライブ。
ストレージとして、各ノードには 4800 台の Intel Optane SSD DC P750X NVMe 2.5GB 5 インチ ドライブ (キャッシュに使用) と 4326 台の Intel SSD D15.36-P2.5 XNUMXTB XNUMX インチ QLC ドライブ (容量ストレージ層) が搭載されています。
ノードは、4M Mellanox LinkX ETH 28GbE、40Gb/s、QSFP パッシブ銅ケーブルを使用した Mellanox ConnectX-56 EN デュアル ポート QSFP3 40/40 GbE カードを介して相互に接続されました。
明らかに、DataON は、パフォーマンスとコストのバランスをとるために、このシステムの構成とコンポーネントの選択に関してかなりの時間を費やし、検討しました。私たちは、Intel SSD D5-P4326 SSD がストレージ層としてどのように機能するかに非常に興味がありました。 Intel Optane SSD と Intel QLC 3D NAND SSD を組み合わせることで、D5-P4326 SSD は、低速だが大容量のハード ドライブの領域であった高性能層とコスト効率の高いフラッシュ ストレージを提供します。
StorageReview ラボでは、以下の図に示すように 2 つのストレージ ノードとスイッチを導入しました。
テスト
このような小規模なクラスターがエッジ ユース ケースでどのように実行できるかを把握するために、いくつかの Microsoft SQL Server テストを設定しました。目標は、クラスターの完全なパフォーマンスを調査して、DataON がインテル Optane テクノロジーとインテル QLC SSD を適切に使用できることを確認することでした。次に、計画された更新またはより深刻な障害が発生した場合に、このソリューションがノードの損失をどのように処理するかを把握するために、単一ノードの機能を調べたいと考えました。
私たちのテスト計画では、展開した SQL Server VM のロード ジェネレーターとして TPC-C プロファイルを使用する Quest の Benchmark Factory を利用しました。 10 つの VM (ノードごとに XNUMX つ) を構成し、クラスターの CPU とディスクのアクティビティのバランスが取れました。ワークロード ジェネレーターは、この環境の外部のシステムでホストされ、XNUMXGbE ネットワーク経由でこのクラスターに接続されました。
SQL Server テスト構成 (VM ごと)
- Windows Serverの2019
- ストレージ フットプリント: 800GB 割り当て、620GB 使用
- 8つのvCPU
- 60GB RAM (障害モード構成では 55GB)
- SQL Serverの2019
- データベースのサイズ: 1,500 スケール
- 仮想クライアント負荷: 15,000
- RAMバッファ: 48GB
- テスト時間: 3 時間
- 15分間のプレコンディショニング
- 45 分のサンプル期間
テストでは、トランザクション パフォーマンス レベルが Benchmark Factory と一定のままで、レイテンシ パフォーマンスに焦点を当てました。
合計 4 つの VM (ノードごとに 2 つ) の負荷で、合計トランザクション負荷 2.5TPS で平均レイテンシー 12,649 ミリ秒を測定しました。
負荷を 6VM に増やすと、平均レイテンシーはわずかに増加して 4 ミリ秒となり、合計トランザクション負荷は 18,967TPS になりました。
8 VM (ノードあたり 4 つ) のピーク負荷では、レイテンシーは平均 6.5 ミリ秒で最高に達し、トランザクション負荷の合計は 25,277 でした。
これらのテストを通じて、この組み合わせに Optane SSD を使用する利点が明らかにわかりました。彼らは書き込みの矢面に立って、高速容量層として応答性の高い読み取りのために QLC SSD を解放しました。この HCI クラスターにアクセスする 8 つの SQL Server VM にワークロードを 2 倍に増やしても、レイテンシはわずかに増加しただけであり、この構成が時々バーストする可能性のあるワークロードに適していることがわかります。
完全に運用可能な環境でのパフォーマンスは重要ですが、もう 8 つの考慮事項は、クラスター内のノードがオフラインになった場合、またはシステム メンテナンスのためにワークロードを移行する必要がある場合に、ワークロードがどのように動作するかということです。このシナリオをテストするために、4.5VM の全負荷を維持し、それらを単一ノードに移行しました。この設定では、平均遅延がわずか XNUMX ミリ秒と測定され、オンラインの両方のノードよりも優れていました。その一部は、単一ノード操作におけるストレージ オーバーヘッドの除去によるものです。
まとめ
このプロジェクトでは、システム上で一連の SQL テストを実行し、エッジおよび SMB のユースケースで一般的に見られるパフォーマンス ワークロードを示しました。私たちの目標は、この DataON クラスターの Microsoft Azure Stack HCI がハードウェアをどの程度効果的に活用して望ましい結果をもたらすことができるかを理解することでした。具体的には、これは、パフォーマンスと価値の珍しい組み合わせを提供するソリューションを提供することを意味します。
テストを通じて、DataON のコンポーネントの選択が、非常に優れたパフォーマンスを備えたコスト効率の高い Azure Stack HCI SDS ソリューションの作成に実際に成功したことが確認できました。これは、容量ストレージとして Intel SSD D5-P4326 を使用することを選択したことによる部分があり、これにより、階層化に Intel Optane SSD が効率的に活用されます。
QLC SSD はクラスターに大規模で高密度の容量を提供しながら、フラッシュ ストレージによる TCO の利点も提供するため、これは重要な概念です。要点を言うと、QLC ドライブは 15.36 インチ ドライブ ベイあたり 2.5 TB の容量を実現します。容量を一致させるには RAID 8 で 2 台の 0TB HDD が必要になるか、より大きいがさらに遅い HDD を活用するには 3.5 インチ シャーシに切り替える必要があります。いずれにせよ、Intel QLC ドライブからハードドライブへのパフォーマンスの低下はかなり以上です。アプリケーションの応答性に関しては、指数関数的な違いになります。
すべての読み取りと書き込みが Optane SSD から行われることを望みますが (Optane SSD はこの構成で最もパフォーマンスの高いメディアであるため)、場合によっては失敗することもあります。その場合、QLC SSD のパフォーマンスはハード ドライブを上回り、フラッシュとハード ドライブを組み合わせたトポロジによく見られるパフォーマンスの異常から HCI クラスターを保護します。実際、ここで非常にバランスのとれたパフォーマンスが見られたため、今後、一般の企業は HCI で最大限のメリットを得るために、HDD/フラッシュ設計を再考し、QLC/Optane 設計にもっと傾斜する必要があるかもしれません。
2 ノード クラスターに関するもう 2 つの大きな懸念は、低下した状態でのパフォーマンスです。私たちはこれをノードに障害を発生させてテストし、すべての SQL ワークロードを XNUMX つのノードに与えました。この場合、SQL の応答性が向上し、XNUMX ノードの場合よりもパフォーマンスが若干向上しました。これは主にノード間の通信によるオーバーヘッドが減少したためです。もちろん、このような劣化状態で長時間実行することはお勧めできませんが、パフォーマンスを犠牲にすることなく実行できると知っておくと安心です。
全体として、D224-P5 QLC SSD を搭載した HCI-4326 HCI クラスターは、導入が簡単で使いやすく、幅広いワークロードに十分に強力でした。また、その価格帯により、幅広いユーザーが利用できるようになります。さらに、このシステムは Microsoft Windows Server 2019 に対して認定されており、Intel Select ソリューションとして検証されています。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | Facebook | RSSフィード
このレポートは DataON の提供により提供されています。このレポートで表明されているすべての見解や意見は、検討中の製品に対する当社の公平な見解に基づいています。