ホーム Enterprise パフォーマンスと復元力: AI および HPC ワークロード向けの Graid SupremeRAID

パフォーマンスと復元力: AI および HPC ワークロード向けの Graid SupremeRAID

by ケビン・オブライエン

Graid Technology は、SupremeRAID により、特に AI および HPC ワークロード向けの新しいデータ保護およびパフォーマンス基準を確立しました。

Graid Technology の SupremeRAID は、特に AI やハイパフォーマンス コンピューティング (HPC) などの最新のワークロード向けに、新しいデータ保護とパフォーマンスの標準を設定することで、ストレージ環境を再定義し続けています。従来の RAID 構成では、特に PCIe バスの制限によって制約されるハードウェア RAID カードに依存している場合、これらのデータ集約型環境の要求を満たすのに苦労することがよくあります。Graid は GPU アクセラレーションを活用してこれらの障壁を打ち破り、CPU リソースへの影響を最小限に抑えながら優れたパフォーマンスを提供し、堅牢な RAID 保護を保証します。

AI および HPC 用の Graid SupremeRAID

ギガバイト S183-SH0-AAV1 サーバー

AI や HPC などの高度なワークロードでは、JBOD (Just a Bunch of Disks) やソフトウェア RAID (mdadm) などの代替構成もよく採用されています。データ損失を防ぐためのチェックポイントと組み合わせると実用的ですが、JBOD は障害点を増やし、IT 管理者に困難な回復プロセスの負担をかけます。ソフトウェア RAID はデータの復元力を提供しますが、RAID パリティ データの管理に貴重な CPU リソースを浪費し、多くの領域でパフォーマンスが低下します。対照的に、Graid の SupremeRAID は、速度や信頼性を損なうことなくデータ管理を簡素化する、合理化された高性能ソリューションを提供します。

Graid SupremeRAID カード

このホワイト ペーパーでは、Graid の SupremeRAID、JBOD、ソフトウェア RAID のパフォーマンスを比較し、パフォーマンスとデータ保護が最も重要となる IT 環境にとって Graid が優れた選択肢となる理由を説明します。

パフォーマンステストベッド

私たちは、使用しました ギガバイト S183-SH0-AAV1 このテストベッドには、デュアル Intel 5th Gen Scalable 1U サーバーを使用しました。十分なコンピューティング パワーを備えたコンパクトなサーバーを探していたところ、このサーバーが 32 個の E1.S SSD をサポートしていることが分かりました。これは、単一の Graid SupremeRAID SR-1010 でサポートされる最大数です。Gigabyte サーバーには 32 個の DIMM スロットがあり、96GB RDIMM と 256GB 3DS RDIMM をサポートしています。このプラットフォームは、背面に 5 つの FHHL PCIe Gen1 スロットを備えており、高速ネットワーク接続のオプションが豊富に用意されています。さらに、マザーボードにはデュアル 1GbE オンボード ネットワークと XNUMXGbE 管理ポートが備わっています。

グレイドHPC DRAM

キングストン 96GB DDR5-5600 ECC RDIMM

サーバーは 32 個の DIMM スロットをサポートしていますが、この場合は、DRAM 速度を最大化するために、チャネルあたり 16 DIMM (1DPC) の 1 個の Kingston DIMM を使用しました。ワークロードでより大きなフットプリントが必要な場合は、より高密度の DIMM または 2DPC 構成に移行できますが、後者の場合、DRAM 速度は 4400MT/s に低下します。 この キングストン 96GB DDR5-5600 ECC RDIMM このサーバーの 128GB DIMM は、コストパフォーマンスに優れたバランスを実現しており、XNUMXGB DIMM のコストプレミアムなしで高速 DRAM と適切な DRAM フットプリントを必要とするワークロードにとって魅力的な選択肢となっています。これらのモジュールは、集中的な HPC および AI ワークロードに両方の長所を提供します。 

KIOXIA 7.68TB XD7P SSD

32 個の E1.S SSD ベイには、KIOXIA 7.68TB XD7P SSD が搭載されています。ドライブは PCIe Gen4 x2 インターフェイスを使用し、最大 7.2GB/秒の読み取りと 4.8GB/秒の書き込みの帯域幅を実現します。KIOXIA は、E1.S SSD の密度の利点が活かされる、集中的なハイパースケールおよび HPC ワークロード向けにこれらのドライブを特別に設計しました。重要なのは、KIOXIA が XD7P の熱設計を、高負荷時でもこの高密度サーバー設計に対応できるように準備していることです。

Gigabyte S183-SH0-AAV1 サーバー リア I/O

テストシステムの仕様

  • ギガバイト S183-SH0-AAV1 サーバー
  • 2 x Intel Xeon Platinum 8592+ CPU (64 コア、1.9GHz)
  • 16 x 96GB キングストン DDR5-5600
  • KIOXIA XD32P 7TB E7.68.S SSD x 1
  • グレイド シュプリームRAID SR-1010
  • Ubuntu 22.04.4 サーバー

パフォーマンステストの結果

HPC ワークロードは、一度に数日、数週間、または数か月間実行される可能性があり、回復力のあるバックエンド ストレージがなければ、1 つのドライブ障害によってジョブが振り出しに戻される可能性があります。HPC および AI ワークロードの回復力とパフォーマンスの両方に対する Graid の影響を評価するために、y-cruncher の内部ストレージ ベンチマークのパフォーマンスを調べます。目的は、さまざまなストレージ構成、JBOD、ソフトウェア RAID、および Graid SupremeRAID を比較して、CPU を集中的に使用するワークロードへの影響を理解することです。

RAID 構成

mdadm ソフトウェア RAID では、パリティ データの書き込みヒットがかなり多いことがわかっています。RAID10 ではパフォーマンスが向上しますが、使用可能な容量も大幅に減少します。ソフトウェア RAID5 のパフォーマンスを最適化するために、SSD 5 ~ 0 と 15 ~ 16 に分割された 31 つの RAIDXNUMX プールを構成しました。これにより、両方の CPU 間でバランスが取れました。

Graid の比較では、5 つの RAID0 プールを使用するように調整され、NUMA のバランスをとるために SSD の半分を CPU1 に、残りの半分を CPU5 に均等に分割しました。各 RAID5 プールに XNUMX つのボリューム、および RAIDXNUMX プールごとに XNUMX つのボリュームを使用してテストしました。

各ドライブは JBOD 構成で個別にマップされ、NUMA のバランスが均等に保たれます。

このサーバーではドライブの配線方法により従来のハードウェア RIAD カードがサポートされないため、このレポートにハードウェア RAID を含めることはできませんでした。ただし、たとえ含めることができたとしても、最良のシナリオでは、4 枚のカードで PCIe Gen16 x28 スロットの帯域幅制限 (約 XNUMX GB/秒) に達することになることに注意してください。

ソフトウェア構成

これらのさまざまなストレージシナリオでは、 yクランチャーの内部パフォーマンス テスト ツールです。テスト結果は、シーケンシャル読み取りおよび書き込みパフォーマンス、計算 I/O 速度、ディスク I/O 速度、およびディスク I/O 速度と計算速度の比率に分かれています。このツールを選択したのは、CPU、メモリ、およびドライブ I/O に同時に負荷をかけるためです。特定の単一のワークロードを表すものではありませんが、生成されるデータは、I/O を多用するアプリケーションでの全体的なシステム パフォーマンスと密接に相関していることがわかりました。特に、I/O テストには、インターフェイスを介してビットをできるだけ早くプッシュするだけでなく、実際のデータ処理も含まれるため、実際の負荷でのシステム パフォーマンスをより正確に反映できます。

シーケンシャル読み取りおよび書き込みパフォーマンスは、ディスク アレイの実際の速度を示します。計算速度は CPU がデータを処理する速度で、ディスク I/O 速度は計算作業が発生したときにデータが CPU にストリームされる速度です。ディスクに書き込まれるワークロードでは、速度が低下しないように計算速度よりも高いディスク I/O 速度が必要です。この比率が 1.0 未満の場合、ディスクがボトルネックであり、1.0 を超える場合、CPU がボトルネックです。大規模なワークロード用の y-cruncher は、比率が 2.0 以上のときに最高のパフォーマンスを発揮します。

ストレージ構成 シーケンシャル読み取り GB/秒 シーケンシャル書き込み GB/秒 計算 GB/秒 ディスクI/O GB/秒
ダイレクトJBOD 102 102 18.4 81.5 4.42
グレイド RAID5 x 2 2VD 64.3 43.8 23.1 70.4 3.05
グレイド RAID5 x 2 4VD 85.2 73.7 22.1 69.4 3.14
SW RAID5 x 2 122 3.6 25.7 10.9 0.42

32 個の個別の E1.S SSD に直接 JBOD すると、y-cruncher は内部ストライピング プロセスで読み取り 102GB/秒、書き込み 102GB/秒のパフォーマンスを確認しました。これは通常、このプラットフォームで y-cruncher が確認できる最高のパフォーマンスですが、トレードオフとしてデータ パリティがありません。構成を mdadm でソフトウェア RAID5 ボリューム (両方の CPU に分散) に切り替えると、シーケンシャル パフォーマンスは書き込み 3.6GB/秒、読み取り 122GB/秒に急落しました。5 つの RAID64.3 プールと 43.8 つのボリュームを持つ Graid は、読み取り 5Gb/秒、書き込みパフォーマンス 85.2GB/秒を記録しました。これを 73.7 つの RAIDXNUMX プールに分割して XNUMX つのボリュームにすると、Graid の帯域幅は読み取り XNUMXGB/秒、書き込み XNUMXGB/秒に増加しました。

帯域幅の数値が明らかになり、ストレージ構成オプションの範囲が理解できたので、この決定がアプリケーションに与える影響を詳しく調べました。計算とディスク I/O 帯域幅の比率は、JBOD 構成で 4.43 と最も高くなりました。ソフトウェア RAID5 はわずか 0.42 でしたが、Graid RAID5 は 3.05VD で 2、3.14VD で 4 でした。

サーバーのすべてのパフォーマンス機能を含むこの y-cruncher の例では、最適なパフォーマンスを得るには 2.0 以上の比率が必要です。JBOD 構成は全体的に最高の結果をもたらしますが、パリティ データが犠牲になるため、一瞬でもドライブに障害が発生するとデータが失われます。一方、ソフトウェア RAID はデータの可用性と JBOD よりも高い読み取り速度を提供できますが、書き込みがひどく低下するためディスク I/O が CPU に追いつけず、結果が .42 という悲惨な結果になります。

これら 2 つのデータ ポイントは、Graid SupremeRAID がこれらのワークロードにもたらすメリットを理解する上で重要です。このユース ケースでは、総合的なパフォーマンス数値は JBOD とソフトウェア RAID の間ですが、raw I/O だけでは十分ではありません。この例は、Graid が必要なアプリケーション パフォーマンスを上回るパフォーマンスを提供しながら、データの可用性も提供できることを示しています。この組み合わせにより、Graid を使用する組織は、従来の RAID カードが提供できるものよりもはるかに優れた非ブロッキング アーキテクチャによる RAID 保護、ストレージ、アプリケーション パフォーマンスを期待できます。

まとめ

Graid Technology の SupremeRAID は、データ保護とパフォーマンスの限界を常に押し広げ、業界の新しい標準を確立しています。Graid は、GPU アクセラレーションのパワーを活用することで、RAID 構成で比類のない速度と効率を実現し、CPU の負担を大幅に軽減しながらスループットを最大化します。

このレポートのために収集したデータは、Graid が堅牢なデータ保護を確保しながら、従来の RAID やソフトウェア RAID ソリューションでは対応できないことが多い、最新の AI および HPC ワークロードの厳しい要件を満たす能力を実証しています。この効率性により、CPU、DRAM、ストレージなどの重要なシステム リソースが、サポートするように設計されたアプリケーションのパフォーマンスに完全に貢献できるようになり、システム全体の価値と有効性が向上します。

グライドテクノロジー

このレポートは Graid Technology がスポンサーとなっています。このレポートで表明されたすべての見解と意見は、検討中の製品に対する当社の公平な見解に基づいています。

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード