Qumulo ファイル システムは、データセンター、プライベート クラウド、パブリック クラウドにまたがる Qumulo 独自のソフトウェア定義分散ファイル システムです。そのソフトウェアはハイブリッド クラウド向けに構築されており、事前に構成および認定された業界標準のハードウェア プラットフォーム上で実行できるだけでなく、複数のパブリック クラウド上でもネイティブに実行できます。私たちの研究室では、Qumulo のソフトウェアとその最も重要な機能のいくつかを学ぶ機会がありました。この特定のレビューでは、Qumulo のファイル システムとそのグラフィカル ユーザー インターフェイス (GUI) を見ていきます。
Qumulo ファイル システムは、データセンター、プライベート クラウド、パブリック クラウドにまたがる Qumulo 独自のソフトウェア定義分散ファイル システムです。そのソフトウェアはハイブリッド クラウド向けに構築されており、事前に構成および認定された業界標準のハードウェア プラットフォーム上で実行できるだけでなく、複数のパブリック クラウド上でもネイティブに実行できます。私たちの研究室では、Qumulo のソフトウェアとその最も重要な機能のいくつかを学ぶ機会がありました。この特定のレビューでは、Qumulo のファイル システムとそのグラフィカル ユーザー インターフェイス (GUI) を見ていきます。
イノベーションを実現するために、組織は最新のストレージ、データ インフラストラクチャ、レガシーおよびクラウドベースのアプリケーションとサービス、クラウド ストレージ、さらには非構造化データの管理とプラットフォームに依存しています。しかし、この種のデータは新たなデータ サイロを生み出すため、クラウドへの移行やハイブリッド クラウド モデルの活用を希望する企業にとって、非構造化データは厄介な問題となっています。利用可能なほとんどのクラウド プラットフォームで利用できます。 IT 部門は、多くの場合、オンプレミスとクラウドの 2 つの異なるファイル システムでワークロードを管理するのに圧倒されるという結果に直面しています。
それにもかかわらず、本当の問題はクラウド プラットフォームや非構造化データ プラットフォームではありません。私たちは依然として、クラウドへの移行には適切ではないレガシー ファイル ストレージを使用しています。 Qumulo が強調しているように、IT は変化しましたが、ファイル ストレージは変化していません。最後に成功したファイル ストレージ アーキテクチャは、クラウドがブームになる 15 年以上前に作成されました。対照的に、最新のファイル ストレージはクラウド対応である必要があります。すべての非構造化データ タイプを統合し、数十億のファイルに拡張し、複数のデータ センターとクラウド自体にまたがる必要があります。また、リアルタイム分析と API 主導の制御により、可視性と自動化を実現します。
Qumulo: クラウド対応ファイル システム
Qumulo は、異なるタイプのストレージ会社であることを自認しており、ハイブリッド クラウドのワークロードに対応し、クラウドネイティブのファイル データ サービスを提供する初のファイル システムを備えていると主張しています。このソフトウェアにより、同社は非構造化データ プラットフォームをターゲットにし、ビルダーと開発者向けのアプリケーションとマイクロサービスを強化します。 Qumulo ファイル システム ソフトウェアは、パブリック クラウド、プライベート クラウド、およびハイブリッド クラウドで利用できます。
Qumulo のソフトウェアのレイヤーには次のものが含まれます。
- プラットフォーム。現在のハードウェア プラットフォームには、HPE と富士通、パブリック クラウドの AWS と GCP が含まれます。 Qumulo は最近、オブジェクト データを活用するクラウドネイティブ アプリケーションやサービスを活用するために、データをファイルからオブジェクトにシフトする機能も発表しました。
- オペレーティング システム。標準の Ubuntu Linux に基づいています。
- スケーラブル ブロック ストア (SBS)。クムロの基礎。スケール、移植性、保護、パフォーマンスを実現します。
- ファイルシステム。これにより、スケーラブルなファイル数と高パフォーマンスのファイル操作が可能になります。また、パフォーマンスと容量に関するリアルタイムの洞察も提供します。
- データサービス。エンタープライズ グレードのツールを使用して、Qumulo プラットフォーム内のデータを保護、保護、管理します。この層は、スナップショット、レプリケーション、クォータ、監査、ロールベースのアクセス制御 (RBAC) の 5 つの機能で構成されます。
- 管理とプログラマビリティ。 Qumulo プラットフォームを使用して統合ソリューションを構築し、管理者がデータ サービスを自動化および管理できるようにします。
- データアクセスと認証。エンタープライズ グレードのセキュリティを確保しながら、標準のアプリケーションとオペレーティング システムを使用してデータにアクセスできるようにします。この層は、NFS、SMB、FTP などのエンタープライズ アクセス プロトコルをサポートします。
ここで焦点を当てるのはファイル システムです。これは、データを論理構造で整理し、大量のファイル数のワークロードを可能にするという概念に基づいています。ファイル システムは、単一の名前空間を提供する分散アーキテクチャを使用します。使用されるプラットフォームは、独立したノードからなるシェアードナッシング クラスターであり、各ノードが容量とパフォーマンスを提供します。また、個々のノードは一貫して相互に連携するため、どのクライアントもどのノードに接続しても名前空間での読み取りと書き込みが可能になります。この構造は非常に興味深いものです。これは、作成者がデータのライフサイクルを通過する際にデータセットで共同作業することを目的としています。また、システムがペタバイトや数十億のファイルに拡張された場合でも、パフォーマンスと容量の使用率に関するリアルタイムの洞察が得られます。
Qumulo ファイル システムは、データをディレクトリに編成し、プロトコル間でデータを共有する機能を備えた SMB および NFS クライアントにデータを提示し、複数の異なるユーザーやアプリケーション タイプが同じデータにアクセスできるようにします。ファイル システムには、B ツリーの使用と組み込みのリアルタイム データ分析エンジンという、際立ったユニークな特性があります。
B ツリー構造を使用することで、Qumulo は他のシステムでよくある問題を経験することなく、数十億のファイルに拡張できます。 B ツリーは、データ数が増加するにつれて各操作に必要な I/O 量を最小限に抑える「浅い」データ構造であるため、大量のデータ ブロックを読み書きするシステムに特に適しています。これらの構造は、ファイル システムや広範なデータベース インデックスに最適です。
Qumulo ファイル システムのもう 1 つの重要な部分は、リアルタイム分析エンジンによるデータ認識機能です。データ認識とは、ストレージ システムに対する多次元の可視性を意味し、システムのコンテンツ、アクティビティ、ユーザーなどに関する強力な洞察を提供します。 Qumulo のリアルタイム分析を使用すると、ストレージ管理者は、スループットや遅延などのストレージの使用状況とパフォーマンスを迅速に監視できます。この可視性により、組織は非構造化データを制御し、現在のニーズをプロアクティブに管理し、将来のストレージ要件をより適切に予測することで、全体的な運用コストと資本コストを削減できるようになります。以下のセクションで説明するように、Qumulo Web-UI は、この可視性を次のシステム管理レベルにもたらします。
Qumulo は、そのソフトウェア アーキテクチャと特定のファイル システムにより、組織がオンプレミスのデータセンターだけでは以前は不可能だったビジネス目標を達成できるようになります。 Qumulo の利点の 1 つは、ファイル システムをオンプレミスで実行し、まったく同じソフトウェアをクラウドで実行できることです。同社はスケールアウト ファイル ストレージ プロバイダーとしてよく知られています。現在、クラウドの弾力性と、クラウド コンピューティングとクラウド ストレージ インフラストラクチャの両方のスケールを利用して、Qumulo のソフトウェアと組み合わせることで、データを非常に強力に相互に移動し、データ センターを簡単にスケールアウトまたはスケールアップできるようになりました。たとえば、企業はオンプレミスのアプリをそのままクラウドに移行し、そのまま機能させることができます。また、ユーザーが機械学習や AI などのクラウド サービスで活用したいファイル データを持っている場合、Qumulo の Shift 機能がそのデータをクラウド オブジェクト ストアにコピーして、クラウド ネイティブ アプリケーションのイノベーションにアクセスします。
組織はこれらのワークロードをクラウドに移行する際に、データがどのように実行されているかを把握したいと考えています。 Qumulo の分析がハードウェア プラットフォームに提供するのと同じエクスペリエンスがクラウドでも提供され、完全なハイブリッド クラウド エクスペリエンスを提供します。企業がソフトウェアを物理アプライアンスで実行する場合でも、クラウドで実行する場合でも、ソフトウェアは同じ GUI と機能を含めて同じです。
機能の詳細については、Qumulo の Web サイトにある技術ドキュメントを参照することをお勧めします。
クムロのパフォーマンス
パフォーマンス構成
5 ノード クラスターの Qumulo ノードの構成には、それぞれ 25 台の 480GB SATA SSD と 6 台の 740TB SATA HDD を備えた LACP のデュアル 25GbE ポートが含まれていました。ストレージ テストでは、NFS 共有に接続する vSwitch に割り当てられた単一の 16G ポートを備えた 125 台の Dell EMC PowerEdge R4xd サーバーに単一の NFS 名前空間をプロビジョニングしました。次に、VMware で XNUMX 個の CentOS LoadGen を使用し、それぞれにツインの XNUMXGB vDisk が割り当てられ、クラスター上に合計 XNUMXTB のフットプリントが得られました。
ストレージ アレイのベンチマークに関しては、アプリケーション テストが最適であり、合成テストは 2 番目になります。実際のワークロードを完全に表現しているわけではありませんが、合成テストは、競合ソリューション間での完全な比較を容易にする再現性係数を備えたストレージ デバイスのベースラインを確立するのに役立ちます。これらのワークロードは、「4 コーナー」テスト、一般的なデータベース転送サイズ テスト、さまざまな VDI 環境からのトレース キャプチャに至るまで、さまざまなテスト プロファイルを提供します。これらのテストはすべて、スクリプト エンジンを備えた共通の vdBench ワークロード ジェネレーターを利用して、大規模なコンピューティング テスト クラスターの結果を自動化して取得します。これにより、フラッシュ アレイや個々のストレージ デバイスを含む幅広いストレージ デバイスにわたって同じワークロードを繰り返すことができます。
Qumulo ストレージ アレイは大規模ブロック転送用に最適化されているため、テストは 64K、1024K、2048K の連続転送に焦点を当てました。
プロフィール:
- 64K シーケンシャル読み取り: 100% 読み取り、32 スレッド、0 ~ 120% の iorate
- 64K シーケンシャル書き込み: 100% 書き込み、32 スレッド、0 ~ 120% iorate
- 1024K シーケンシャル読み取り: 100% 読み取り、32 スレッド、0 ~ 120% の iorate
- 1024K シーケンシャル書き込み: 100% 書き込み、32 スレッド、0 ~ 120% iorate
- 2048K シーケンシャル読み取り: 100% 読み取り、32 スレッド、0 ~ 120% の iorate
- 2048K シーケンシャル書き込み: 100% 書き込み、32 スレッド、0 ~ 120% iorate
まず、64K シーケンシャル ベンチマークは、遅延 74,619 ミリ秒で 4.66 IOPS または 11.3GB/秒です。
64K 書き込みでは、9ms のレイテンシーで約 555K IOPS または 110MB/s のピーク パフォーマンスが見られました。
次に 1024K テストに進みます。読み取りの場合、レイテンシ 7,128ms で 7.13 IOPS または 108GB/s のピーク パフォーマンスが見られました。
1024K 書き込みでは、レイテンシ 1,670 ミリ秒で約 1.6 IOPS または 557GB/秒のピークが見られ、その後若干低下しました。
最終的な連続ベンチマークは 2048K です。読み取りパフォーマンスでは、3,858ms の遅延で 7.7 IOPS または 184GB/s のピークが見られました。
最後に、2048K 書き込みでは、レイテンシ 1,055ms で 2.1 IOPS または 433GB/s のピークが見られました。
Qumulo Web UIの概要
次のセクションでは、Qumulo の Web ユーザー インターフェイスとその主要な構成の一部について概要を説明します。同社は、管理者がデータセンターとクラウド環境を展開、管理、監視できるように、この Web ベースの UI を提供しています。
管理者としてクラスターにログインすると、[ダッシュボード] ページが直接表示されます。この時点で、Qumulo が提案するユニークでモダンな Web UI がすぐにわかります。この Web UI は、タブに整理された直感的なメニューで構成されています。画面の左上に表示されます。これには、インフラストラクチャの展開、管理、監視に必要なすべてのカテゴリがすぐに含まれています。メイン メニューは、[ダッシュボード]、[分析]、[共有]、[クラスター]、[API とツール]、および [サポート] タブで構成されます。これらのタブをポイントすると、UI が提供するすべてのさまざまなページにアクセスするためのドロップダウン リストが UI に表示されます。右上隅に、現在のソフトウェア バージョン、時刻 (Web ブラウザのクライアントのローカル時間に基づく)、および現在ログインしているユーザーが表示されます。
それでも、[ダッシュボード] ページでは、インフラストラクチャの監視を容易にする魅力的な UI レイアウトに気づき、クラスタの概要、容量の傾向、クライアント アクティビティ、およびリアルタイムのクラスタ アクティビティなどのさまざまな重要な領域を観察できます。
ダッシュボード領域の UI で特に気に入ったコンセプトの 24 つは、そのすべての要素との動的な相互作用です。たとえば、「クラスター アクティビティ」では、1 時間以内に監視したい情報アクティビティを簡単にドラッグして移動、展開、または絞り込むことができます。ここには、5 分、1 分、3 時間、およびデフォルトの XNUMX 時間の期間を持ついくつかのプリセットもあります。メトリクス (IOPS とスループット) は、ピーク データに応じて調整されます。
[ダッシュボード] ページを下にスクロールすると、[クライアント アクティビティ] エリアが見つかります。
ここで、Qumulo が際立っている領域である分析に直接進みます。前述したように、Qumulo を使用すると、管理者はデータとユーザーをリアルタイムで管理できます。 [分析] > [統合分析] の下で、左側の情報ペインに、システムのリソースを最も多く使用しているクライアントと、アクティブに読み書きされているディレクトリとファイルが表示されます。この情報は、特定のディレクトリまたはサブディレクトリをクリックすると表示されます。
[Capacity Explorer] ページに移動すると、[Analytics] タブの下にあるため、システム上で容量がどのように分散されているかがわかります。まず、ディレクトリの容量の概要を最大から最小の順に示します。
ディレクトリをクリックすると、より詳細な観点からそれぞれを掘り下げて探索できます。例として、以下の画像は、「vmw」という名前のディレクトリに含まれるサブディレクトリを示しています。
サブディレクトリをクリックし続けると、最終的にはファイル レベルの詳細に到達できます。今回は、「netapp-centos01」という名前のサブディレクトリをクリックしました。
分析の次のページは、容量の傾向です。ここから、クラスターの時間外の容量使用量を監視および管理するために必要なすべての詳細を取得できます。ここでの 72 つの主要な領域は、キャパシティ履歴とキャパシティ変更です。これらの容量には、メタデータ、データ、スナップショットが含まれます (容量の変更でのみ除外されます)。容量の履歴と変更は、過去 30 時間、過去 52 日間、または過去 XNUMX 週間の時間枠によってすばやくフィルター処理できます。これらは、ストレージ管理者がスケールに合わせてクラスターを視覚化および管理し、重大な容量変更イベントを調査するのに役立つ優れたオプションです。
[分析] タブの下で調査した次のセクションはアクティビティです。ここでは、スループット ホット スポット、IOPS ホット スポット、クライアント、およびパスを見つけることができます。 [IOPS ホット スポット] ページでは、ストレージ システム内の 1 秒あたりの入出力ホットスポットを特定できます。グラフには、ファイルおよびメタデータの読み取り/書き込み操作に関して最もアクティブなディレクトリが表示されます。これらのデータの詳細レベルは、グラフの右上にあるスライダーを使用して調整できます。 [自動更新] ラジオ ボタンから、表示を一時停止する優れたオプションも利用できます。
クライアントごとのアクティビティを監視することもできます。分析により、スループットと IOPS の点でどのクライアントが最もアクティブであるかを確認できます。
また、パスごとにアクティビティをクラウド監視します。
メイン メニューの次のタブは [共有] で、ここで分析する最初のページは [クォータ] です。 Qumulo はリアルタイムの容量クォータを有効にし、管理者が特定のディレクトリでファイルに使用できる容量を指定できるようにします。このページから、クォータを作成、編集、または削除できます。
次の 2 ページは、クライアントが特定のディレクトリに保存されているデータを共有できるようにする NFS エクスポートと SMB 共有です。たとえば、NFS エクスポートでは、新しいエクスポートを作成したり、編集したり削除したりできます。
メイン メニューの次は [クラスター] です。 「クラスター」メニューには、クラスターおよびシステム全般に関連するさまざまな構成とオプションがあります。最初のページ「概要」には、クラスターとそのノードの重要な容量情報が表示されます。
いずれかのノードをクリックすると、より具体的なハードウェアの詳細にドリルダウンできます。例として、「sr-qumulo-1」ノードをクリックして、関連するネットワーク情報とドライブの健全性ステータスを検出します。
[クラスター] メニューには、スナップショットやレプリケーションなどの重要なストレージ機能もあります。さらに、ネットワーク構成、クラスター名の変更、クラスターへの新しいホストの追加などのオプションも追加されています。また、FTP および SMB プロトコルを設定します。最後に、このメニューでは認証と認可を管理できます。以下の画像は、例として [ローカル ユーザーとグループ] ページを示しています。
[API とツール] タブから、UI で Qumulo Core ページに直接アクセスできます。ここでは、Qumulo Core REST API 用の Python クライアント ライブラリ ラッパーと CLI をダウンロードできます。
メニューの最後のタブは [サポート] で、ここで見つかった最初のページは Qumulo Care です。これは、Qumulo にデータを送信できるようにするクラウドベースの監視サービスです。このようにして、Qumulo チームはより適切にトラブルシューティングを行い、クラスター関連の問題をスピードアップすることができました。
最後に、メニューには [ソフトウェア アップグレード] ページがあります。
まとめ
組織はイノベーションを実現するために、非構造化データ プラットフォームやデータ対応ストレージに依存していますが、これらのストレージには利用可能なソリューションが十分に提供されていません。このレビューでは、すべての環境で非構造化データを提供するために開発された Qumulo File System について調査しました。 Qumulo は、ハイブリッド クラウド向けの独自のソフトウェア デファインド ソリューションを備えた、データ対応ストレージとクラウド ファイル データ サービスのパイオニアの 1 つです。
この記事の最後のセクションでは、Qumulo の Web-UI について説明しました。これまで私たちは、最も人気のあるサーバーおよびストレージ アプライアンスのいくつかのグラフィカル ユーザー インターフェイス (GUI) について概説してきましたが、今回は Qumulo の新しい GUI について概説できて大変うれしく思います。一目見ただけで、この GUI のエレガントなデザイン、優れたユーザー エクスペリエンス、そして管理者の日常の管理操作がいかに簡単であるかがわかります。
全体として、Qumulo のソフトウェアは、優れた機能、監視、計画ツールのセットを顧客に提供します。このソフトウェアにより、クラウドへの移行が簡素化されます。リフトアンドシフトのクラウド移行によるデータ移動をサポートしながら、貴重なデータに何が起こっているかを検出して即座に洞察を得る強力なリアルタイム分析を提供します。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | Facebook | RSSフィード