小規模オフィスおよびリモート/ブランチ オフィス (ROBO) 環境におけるコンピューティング リソースの展開と継続的な管理には、さまざまな競合する要因が関与しており、常に問題が発生しています。多くの企業と中小企業 (SMB) は、組織の生命線である日常のビジネスクリティカルなトランザクションを処理するために ROBO HCI システムに依存しています。これらのシステムは、低コストでありながらパフォーマンスが高く、冗長性を備えながらもコンポーネントが可能な限り少なく、メンテナンスが適切でありながら、各サイトに専任する高価な IT リソースや人員が不要である必要があります。
Microsoft Azure Stack HCI向けのDell EMCソリューションとの併用
小規模オフィスおよびリモート/ブランチ オフィス (ROBO) 環境におけるコンピューティング リソースの展開と継続的な管理には、さまざまな競合する要因が関与しており、常に問題が発生しています。多くの企業と中小企業 (SMB) は、組織の生命線である日常のビジネスクリティカルなトランザクションを処理するために ROBO HCI システムに依存しています。これらのシステムは、低コストでありながらパフォーマンスが高く、冗長性を備えながらもコンポーネントが可能な限り少なく、メンテナンスが適切でありながら、各サイトに専任する高価な IT リソースや人員が不要である必要があります。
幸いなことに、IT サプライヤーは ROBO システム特有の課題を認識しており、それらに対処するソリューションを考案しています。この記事では、Microsoft ソフトウェアを実行する Dell Technologies ハードウェアがこれらの課題にどのように対処するかを見ていきます。私たちのアプローチは、システムのパフォーマンスに焦点を当てる通常の記事とは少し異なります。システム上でパフォーマンス テストを実行しますが、初期サイジングから始まるライフサイクル全体も見ていきます。
ロボHCIの紹介
この記事で取り上げるシステムは、 Microsoft Azure Stack HCI向けのDell EMCソリューション Windows Server 2 (2019NC) を実行する 2 つの AX ノードを持つクラスター。今年の初めに、Dell Technologies は、Azure Stack HCI を実行するために特別に設計された (検証および認定付き) AX ノードをリリースしました。 Dell Technologies は現在、ソリューション カタログで XNUMX つの異なるノード タイプを提供しています。 AX-640、AX-740xd、AX-6515。これらの各モデルは、さまざまなコンポーネントを使用した構成を通じて、ROBO HCI 導入に最適なプラットフォームを設計できる機能を顧客に提供します。
AX-640 および AX-740xd ノードは、第 6515 世代 Intel Xeon スケーラブル プロセッサを使用するデュアル ソケット ノードですが、AX-64 は、2 コアの第 640 世代 AMD EPYC プロセッサを実行するシングル ソケット ノードです。 Dell EMC の AX モデルを使用すると、お客様はユース ケースに最適なノードを選択できます。 AX-740 はコンピューティング密度の高いワークロードに適しており、AX-6515xd はストレージ容量の重いワークロードに適しており、AX-XNUMX はエンタープライズ データ センターで価値が最適化されたシステムとプロセッサの多様化を必要とするユーザーに適しています。
この記事で詳しく説明するシステムは、640 ~ 1 GB の RAM をサポートするデュアル ソケット 96U ノードである AX-768 です。 3 ~ 92TB の NVMe、SSD、HDD ストレージを構成して、ハイブリッドまたはオールフラッシュ ストレージを作成できます。これは現在、Intel の超高性能 Optane 永続メモリおよび SSD デバイスをサポートする AX ポートフォリオの唯一のノードです。適切に構成されている場合、AX-640 ノードは、市販されている最速の HCI ノードのタイトルを獲得する有力な候補となります。 Dell Technologies には、AX ノードの Azure Stack HCI 構成オプションの概要を示す優れたグラフがあります。
この記事で使用する AX-640 ノードには、デュアル Intel Xeon 6230 CPU、384GB DDR4 メモリ、および 4 個の XNUMXTB NVMe SSD が搭載されています。
ROBO HCI ソリューションを導入する場合、信頼性が高くパフォーマンスの高いハードウェアを用意するだけでは、まだ半分にすぎません。残りの半分はソフトウェアです。この場合、Azure Stack HCI 検証済みシステムを実行します。 Azure Stack HCI を使用すると、顧客は Windows Server OS を実行できるようになり、追加のサービス (バックアップや災害復旧など) のために Azure クラウドにシームレスに接続できるという利点も得られます。 Microsoft Windows 管理センター。 Azure サービスは、同じ管理プレーンから WAC 拡張機能を介して統合されます。
Azure Stack HCI は、ハイパーバイザーに Hyper-V を使用し、ローカル ストレージに記憶域スペース ダイレクトを使用します。 ROBO HCI 導入に 2NC を使用すると、実装コストを大幅に削減できます。コストを非常に重視した実装の場合は、ストレージ ファブリックのシングル リンク構成またはデュアル リンク構成のスイッチなしで 2NC 構成で動作するように構成できます。スイッチ実装の場合は、10GbE ネットワークが機能します。 Dell Technologies では、25GbE ネットワークよりもコストがそれほどかからない 10GbE ストレージ ネットワークを推奨しています。
システムの復元力が低い場合、企業が設備投資を削減することは当然のことです。システムごとに、記憶域スペース ダイレクトは、双方向および 3 方向のミラーリングと、シングルおよびデュアル パリティ消去コーディングをサポートします。 Microsoft は、ストレージ効率、およびこれらのさまざまな保護スキームの一般的な利点とトレードオフをうまく文書化しています。ご使用の環境に最適なスキームを決定するために、この内容をよく読んでいただくことをお勧めします。通常、ミラーリングは最もパフォーマンスが高く、テストでもこれを使用しました。
Azure Stack HCI は、復元のための 1 つのオプションとして、入れ子になった双方向ミラーリングまたは入れ子になったミラー高速パリティを使用できます。前者はパフォーマンスが向上し、後者はデータ効率が向上します。ネストされた双方向ミラーリングは、ホストと他のノード上にデータの RAID 1 コピーを作成します。ネストされたミラー高速化パリティは、各サーバー上にデータのコピーを作成しますが、データの回復力のために RAID 25 ではなく消去コーディングを使用します (信頼性を確保するために双方向ミラーリングを使用する最近の書き込みを除く)。ネストされた双方向ミラーリングでは、データの 33 つのコピーがディスクに書き込まれるため、データ効率は 40% です。比較すると、ネストされたミラー高速化パリティのデータ効率は XNUMX% ~ XNUMX% です。
どちらの方式も、ドライブの障害とサーバーの障害を同時にサポートできます。
どちらのネストされた復元スキームでも、特別な RAID ハードウェアは必要ありません。
Microsoft 2NC トポロジでは、「スプリット ブレイン」シナリオを防ぐために、中立的なサードパーティとして機能する監視者が、生き残ったノードに投票を追加する必要があります。ファイル共有 (テストで使用) または Azure クラウドを監視として使用できます。クラスター内の両方のノードに信頼できるインターネット接続がある場合、Microsoft は後者を推奨します。 Azure クラウド監視は BLOB ストレージ オブジェクトですが、ファイル共有は SMB ファイル共有です。監視には監視ログ ファイルのみが含まれます。
ROBO HCIの調達と導入
約束どおり、私たちは ROBO 状況で AX ノード クラスターを調達、デプロイ、管理するために何が必要かを総合的に検討したいと考えました。
新しいシステムを導入するときの最初のステップは、システムのサイズを決定することです。 Dell Technologies では、環境のストレージ、データ保護、サーバー、およびファイル システムに関するデータを収集するために使用される無料のオンライン ツールである Live Optics を使用して、導入に必要な機器を簡単に計算できます。導入後わずか 24 時間で環境に関する洞察を得ることができますが、Live Optics を長く実行すればするほど、実行しているワークロードの特性についての理解が深まります。 Live Optics は、Microsoft Windows、VMware vCenter、または Linux/Unix サーバーからデータを収集できます。
Live Optics ダッシュボードには、環境全体の CPU、メモリ、ストレージの使用状況から収集されたコンパイルされたデータが表示され、そのすべてが環境で必要なシステムのタイプを正確に把握できます。サイズに関する推奨事項を作成してもらいたい場合は、このデータを他のユーザー (同僚、VAR など) と共有することもできます。
Live Optics から収集されたデータは、Dell Technologies アカウント チームから入手できる Azure Stack HCI サイザー ツールで使用されます。サイザー ツールにはエンジニアリングのベスト プラクティスがすべて組み込まれており、現在のニーズだけでなく、将来の成長も考慮した構成オプションを生成できます。
ROBO 環境に関する問題の 1 つは、ROBO 環境をセットアップして構成する地元の IT 人材を見つけることです。これを実現する 1 つの方法は、Dell EMC ProDeploy サービスを使用することです。このオプションは、組織がリモート サイトへの展開を迅速化するのに役立ちます。つまり、組織はオンラインであり、すぐに価値を追加できます。あるいは、ローカル リソースがあり、それを自分で導入したい場合は、デルがプロセスを説明するドキュメントとスクリプトを用意しています。
あらゆる組織にとって最大の悩みの一つは、システムのサポートです。複雑なシステムのサポートに伴う多大な手間は、複数のハードウェアおよびソフトウェア ベンダーが関与することです。たとえば、あるベンダーがサーバーとストレージを提供し、別のベンダーがネットワーク スイッチを提供し、3 番目のベンダーがオペレーティング システムを提供しているとします。 Dell EMC プロサポートは、HCI ソリューションの専任サポート スタッフを配置することで、このプロセスの合理化を支援しました。これらのサポート エンジニアは訓練を受けており、Dell Azure Stack HCI システムのハードウェアとソフトウェアの両方について知識があり、必要に応じて問題をエスカレーションする適切な担当者を知っています。
Dell Technologies HCI のインストール時に誤ってシステムの構成を誤ったとき、Dell Technologies HCI の専任サポート スタッフを利用する機会がありました。私たちが協力したサポート エンジニアは非常に知識が豊富で、私たちが陥った混乱を解決するのを手伝ってくれました。
AX ノードの日常管理
理想的な世界では、ROBO HCI の導入には管理がまったく必要ありません。しかし、それは現実ではなく、Dell Technologies と Microsoft には次善の選択肢があります。システムが遠隔地に設置されており、ローカル IT サポートがほとんどまたはまったくない場合は、システムのメンテナンスに必要なツールを用意することが重要です。 Dell Technologies は、Windows Admin Center (WAC) と、独自の IP に合わせたいくつかの拡張機能である Dell EMC OpenManage Integration for Windows Admin Center を使用してこれを実現します。
WAC は、Windows 10 および Windows Server を管理するためのブラウザーベースの管理プラットフォーム ツールです。これはクライアント システムにインストールされ、Windows リモート管理 (WinRM) 経由でリモート PowerShell と Windows Management Instrumentation (WMI) を使用して、Windows システムと Azure Stack HCI クラスターを監視および管理します。
WAC の概要ペインには、システムのリソース使用率の概要と、システムの証明書とデバイスを管理するためのツールが表示されます。 WAC を使用すると、イベントとプロセスを表示し、役割と機能をインストールし、ローカル ユーザーとグループ、ファイアウォール、サービス、ストレージを管理することもできます。
Dell Technologies は、WAC の拡張性を利用して、Dell EMC OpenManage Integration with Microsoft Windows Admin Center (OMIMSWAC) を作成しました。これは、ハードウェアの詳細な監視とインベントリ、および BIOS、ファームウェア、およびドライバーの更新の調整のプロセスを容易にし、簡素化するように設計されました。 OMIMSWAC は、Windows Server 2019 のクラスター対応更新機能を使用して、AX ノードと Azure Stack HCI クラスターを更新します。 OMIMSWAC を起動するには、 Dell EMC OpenManage の統合 WAC のリボン バーにあります。
WAC を起動して、OMIMSWAC をシステムに追加しました。 設定 その後 拡張 入る Dell EMC 検索テキスト ボックスで、 Dell EMC オープン管理統合をクリックしてから インストールを開始する.
OMIMSWAC を使用してクラスターを確認することで、システムの健全性を確認し、コンポーネントのインベントリと使用されているファームウェアを確認できるほどハードウェアを深く掘り下げることができました。
OMIMSWAC を使用して iDRAC コンソールを起動し、AX ノードの帯域外管理を行うこともできます。
クラスターを検出したら、OMIMSWAC を使用してクラスター レベルのノードのコンプライアンス レポートを表示できます。 OMIMSWAC が実行されているシステムにインターネット接続がある場合、Dell EMC System Update (DSU) および Dell EMC Inventory Collector (IC) ユーティリティが downloads.dell.com から自動的にダウンロードされ、コンプライアンスを実行し、DSU の場合はターゲット ノードを更新します。および IC は設定で構成されていません。
OMIMSWAC は、更新などの日常的なタスクの実行に真価を発揮します。 OMIMSWAC は必要な Dell Update Package (DUP) を自動的にダウンロードするだけでなく、クラスターのローリング アップデートを実行してダウンタイムを排除します。
AX ノードのテスト
Dell EMC 2 ノード HCI クラスターを検討する際、そのパフォーマンスと、さまざまな障害シナリオを通じてアプリケーションの可用性の両方を確認したいと思いました。そのために、8 ノード クラスター上でバランスのとれた Windows Server 2019 を実行する最大 2019 つの SQL Server 2 VM で構成される SQL Server パフォーマンス テストを構成しました。次に、各 SQL Server インスタンスには 1,500 スケールの TPC-C データベースが与えられ、データベースとログ ファイルの容量はインスタンスあたり 350 GB に相当します。これにより、データベース ストレージのフットプリントは 1.4 VM で 4 TB から 2.8 VM で最大 8 TB までの範囲になりました。このプロジェクトのワークロード ジェネレーターとして Quest の Benchmark Factory を使用し、15,000 人の仮想ユーザーが各 VM と対話しました。
各 VM には、8 つの仮想 CPU と 60GB の RAM、およびストレージのフットプリントが割り当てられました。クラスターはホストごとに 384 GB の RAM で構成されているため、障害が発生したノードのシナリオでは、単一ホスト上の 40 つの VM すべてに適合するように VM RAM の割り当てを 8 GB に下げました。
データベース テストの 4 つのシナリオは次のとおりです。
- 動作中のクラスター: 合計 8VM、ノードごとに 4VM
- ノード上で 1 台の SSD に障害が発生しました: 合計 8VM、ノードごとに 4VM
- 8 つのノードに障害が発生しました: 合計 8 VM、ノードごとに XNUMX VM
各ノードに 8 つずつ、4 つの VM のパフォーマンスを測定した最初のテストでは、レイテンシは平均 5 ミリ秒と測定されました。
強力なパフォーマンスと低いデータベース待機時間は素晴らしいことですが、最適とは言えない条件下でプラットフォームがどのように動作するかを知ることも同様に重要です。最初のシナリオでは、SSD の故障にプラットフォームがどのように対応するかを取り上げました。ワークロードを開始し、安定した直後に、6.5 つのノードから 5 つの SSD を取り外しました。この状況では、パフォーマンスが通常の XNUMX ミリ秒から XNUMX ミリ秒にわずかに低下しました。
5.875 番目のシナリオでは、ノードがメンテナンスのためにオフラインになった場合にクラスターがどのように動作するか、またはノードに障害が発生した場合にどのように動作するかについて説明しました。どちらの状況でも、すべてが XNUMX つのノードのみにフォールバックしますが、バックエンド ネットワークを通過するトラフィックがないという微妙な利点があります。この状況では、平均レイテンシは XNUMX ミリ秒と測定されました。
最終的な考え
ROBO アプリケーション用の 2NC への関心がますます高まっています。企業は、アクセスに問題が生じる可能性があるため、手頃な価格で堅牢なシステム、IT スタッフとのやり取りが最小限で済むシステムを求めています。 Azure Stack HCI 向けの Dell EMC ソリューションは、これらの要件をすべて満たしています。
私たちは、2NC ROBO HCI システムの適切なサイズ設定、取得、セットアップに何が必要かを検討しました。 Dell Technologies の簡単さには感銘を受けました。初期のシステム設定を確認した後、システムを保守するために何が必要かを検討しましたが、WAC がこのプロセスをいかに簡単に実行できるかに改めて感銘を受けました。しかし、私たちを本当に驚かせたのは、Dell Technologies OMIMSWAC の統合で、オペレーターの介入をほとんど必要とせずに、ファームウェアからすべてをカバーするシステムのローリング アップグレードを実行しました。この統合の深さは Azure Stack HCI プロバイダーに特有のものであるため、これは Dell Technologies の根本的な差別化要因です。
このシステムでベンチマークを実行したところ、最適な条件下でアプリケーションのワークロードのパフォーマンスが優れていることがわかりました。 SQL Server TPC-C ワークロードは、クラスター上に均等に配置された 2.25 つの 1,500 スケール VM で 5 ミリ秒を測定し、そのワークロードが 8 つの VM に増加した場合は 5 ミリ秒でした。しかし、さらに印象的だったのは、SSD が故障した場合や 6.5 つのノードのみが動作している場合でも、クラスターがいかに良好にパフォーマンスしたかでした。 SSD に障害が発生した最初のシナリオでは、5.875VM のワークロードの遅延が XNUMX ミリ秒から XNUMX ミリ秒に増加しました。ただし、ノードが完全にオフラインの場合、レイテンシーはかろうじて XNUMX ミリ秒にまで増加しました。
このシステムでのテストを要約すると、ROBO の導入によってかかる負荷を簡単に処理できることがわかりました。これは重要;この種の展開では、このようなシステムのパフォーマンス機能についてはあまり心配せず、長期的な運用について心配する必要があります。まず、Dell Technologies は、パフォーマンスがほとんど問題にならないレベルまでこれらの AX ノードを設計しました。すべてのテストでは、攻撃的な SQL Server ワークロードであっても問題なく吸収されることが検証されています。
ROBO HCI ユースケースのパフォーマンスが効果的に解決された場合、組織は 2 日目の運用に切り替える必要があります。ここで、Dell EMC AX ノードが実際に離れ始めます。継続的な管理の観点から、クラスター更新のための WAC との統合が重要です。 Dell Technologies は、Azure Stack HCI に関しては、この分野で明確なリーダーです。最後に、組織はシステムの復元力に注目する必要があります。ノードが XNUMX つしかなく、多くの場合、即時のオンサイト サポートがないため、稼働時間はビジネス クリティカルです。いくつかの劣化状態のテストでは、AX ノードは中断することなく動作し続けました。つまり、アプリケーションのパフォーマンスに影響を与えることなく、オフィスはオンラインのままになります。 Azure Stack HCI を展開する方法は数多くありますが、Dell Technologies が提供する AX ノードほど包括的なソリューションはありません。
Dell EMC Azure Stack HCI ソリューション
このレポートは、Dell Technologies の提供により提供されています。このレポートで表明されているすべての見解や意見は、検討中の製品に対する当社の公平な見解に基づいています。