過去数年間、ハイパースケール分野におけるブート ドライブを巡る問題について多くの議論が行われてきました。ハイパースケーラーはこれらにあまり多額の費用をかけたくありませんが、必要な仕様の中でも特に基本的な最小パフォーマンスのしきい値が必要です。
過去数年間、ハイパースケール分野におけるブート ドライブを巡る問題について多くの議論が行われてきました。ハイパースケーラーはこれらにあまり多額の費用をかけたくありませんが、必要な仕様の中でも特に基本的な最小パフォーマンスのしきい値が必要です。
エンタープライズ SSD メーカーのほとんどがこの分野から撤退しているため、実際に小容量の M.2 NVMe ブート ドライブを製造し続けるのは誰になるのかという問題もあります。 Solidigm のストレージ ポートフォリオには最新の M.2 ブート ドライブが含まれておらず、Samsung、KIOXIA、Micron が提供する最新のオプションのほとんどは、大容量であるためコストの懸念があります。次に、パフォーマンスの必要性があります。それほど優れているわけではありませんが、ブート ドライブは最小限の結果を確実に生成する必要があります。
以下のグラフからわかるように、ブート ドライブとデータ ドライブの両方の容量が継続的に増加しており、これは組織の支出が増加していることを意味します。
ハイパースケール NVMe ブート ドライブの要件とハードル
OCP サミットでは、これらの問題について、Google と Meta の代表者によるプレゼンテーションで議論され、最も重要なこととして、それらの問題に対処するために彼らが何を行っているかについて議論されました。
ハイパースケール ブート SSD の例は、I/O の読み取りと書き込み、TRIM トランザクションを含む 1 日のアクティビティを表す例として示されました。最も顕著なのは TRIM のスループットの高さで、これはデータの有効期間が短いことを示しています (作成され、その後すぐに削除されます)。 TRIM が適切に設計されていない場合、遅延ストールが発生し、読み取りおよび書き込みトラフィックに干渉します。トラフィックのほとんどはランダムな読み取りと書き込みです。
ハイパースケール NVMe ブートが直面するいくつかのハードルは次のとおりです。
- 結局のところ、ハイパースケール ワークロードは遅延の影響を受けやすいため、効率的なユーザー エクスペリエンスを実現するには、持続的なパフォーマンスが非常に重要です。
- また、大規模なデバッグも困難であるため、詳細な監視メトリクスを取得することは、障害の予測と検出の両方にとって最も重要です。
- ブート SSD にとって耐久性は非常に重要です。システムを完成させた後 (これには少し時間がかかる場合があります)、耐久性の高いブート ドライブを使用すると、製品のライフ サイクル全体にわたって持続することができます。. これにより、修理の必要性がなくなり、早期の摩耗を防ぐことができます。
- 最も重要なことは、ハイパースケールの顧客はプライバシーとセキュリティを非常に重視しており、これらの基準をすべて満たすことが難しい場合があるということです。
これは非常に多岐にわたる問題であるため、正しく対処しないと、対処が複雑なプロセスになる可能性があります。
ブートドライブが直面する問題への対処
OCP の背後にある主な推進力と目的と同様に、これらの問題を解決する唯一の方法はコラボレーションとオープン仕様を通じてです。そのため、Meta と Google は協力して要件を組み合わせ、 ハイパースケール NMEe ブート SSD 仕様 (バージョン 1.0)これは、ブート ドライブの効率性にとって重要なマイルストーンです。これは今年初めに提出され、OCP の Web サイトから入手できます。
これらの仕様には多くの利点があります。最終的には、ハイパースケーラーがブート デバイスに必要および使用する機能を市場がより深く理解できるようになり、SSD ブート ドライブの採用に関して業界の調整が得られるようになります。さらに、ブート SSD を管理するためのオープンソース ツールを組織に提供し、3 つの開発につながります。rd-すべての要件を満たすことができるパーティ テスト スイート。
セッション中、ハイパースケール ブート SSD の作成には 2 つの方法があることも示唆されました。エンタープライズ クラスの SSD をダウングレードするか、コンシューマ グレードの SSD をアップグレードします。これは、その要件がこれら 2 つの領域の中間のどこかにあるためです。
ブーツベンチ
SSD のレビューにブート ベンチ パフォーマンスのセクションを追加し始めました。これは、サーバーのブート デューティー向けに設計された SSD を評価するために OCP によって採用されるワークロード プロファイルです。このブート ワークロードは、読み取りの多いワークロード シーケンスをテストする前に、ドライブを書き込みで完全に埋める比較的集中的なテスト プランを実行します。
各テストでは、32MiB/s の同期 15k ランダム書き込みおよび 128MiB/s の同期 5k ランダム書き込み/トリム バックグラウンド ワークロードと並行して、128K ランダム読み取り非同期操作を実行します。このスクリプトは、4 ジョブ レベルのランダム読み取りアクティビティから始まり、ピーク時には 256 ジョブまでスケールアップします。最終結果は、ピーク実行中に実行された読み取り操作です。
このベンチマークの OCP 目標は、60K 読み取り IOPS での合格/不合格です。私たちがテストしたほとんどのドライブは最小値をはるかに超えていますが、結果はいずれにしても有益です。私たちのテストで最も興味深いのは、パフォーマンス重視の NVMe SSD モデルでは IOPS しきい値をはるかに超えることができましたが、SSD の方が遅いということはなかったということです。多くの低速 SSD モデルは簡単に不合格のカテゴリーに分類されるようですが、970 EVO Plus 2TB モデルではより遅い不合格の速度が報告されました。
SSD | IOPSを読む |
SK ハイニックス プラチナ P41 | 220,884 IOPS |
WD SN850X | 219,883 IOPS |
ソリッドジム P44 プロ | 211,999 IOPS |
ファントム ヴェノム8 | 190,573 IOPS |
Samsung 990 Pro | 176,677 IOPS |
サブレント ロケット 4 プラス | 162,230 IOPS |
サムスン 970 EVO プラス 2TB | 52,005 IOPS |
コルセア MP600 GS | リタイア |
Solidigm P41 プラス | リタイア |
ハイパースケール ワークロードの使用例
セッション中に、彼らは 2 つの異なるドライブも比較しました。1 つはより汎用的で、もう 1 つは OCP ハイパースケール仕様に準拠しています。全体として、後者のドライブではレイテンシが全体的に劇的に改善されたことがわかりました。これはハイパースケール領域にとって非常に重要です。
現実の世界では、これは、仕様に合わせてドライブを導入しようとすると、市場投入までの時間が大幅に短縮されることを意味します。
を前進させる OCP ハイパースケール NVMe ブート SSD の仕様
一部の企業はこれまで、自社の特定のニーズ (および顧客からの特定の要求) に合わせて独自のハイパースケール ブート ドライブを作成していましたが、これらの仕様は業界内で共有されていませんでした。その結果、ベンダーは顧客のニーズを満たすために独自にカスタマイズされたハードウェア/ファームウェアを製造する必要がありました。
それ以来、私たちは長い道のりを歩んできました。OCP は現在、 ハイパースケール NVMe ブート SSD 仕様のバージョン 1.0 が正式に利用可能になりました。これにより、システム メーカーと SSD プロバイダーは、さらなるコラボレーションを促進しながら、一連の共通の要件に沿って調整することができます。
OCP はすべての OEM (つまり、システム メーカー) とハイパースケーラーにこの運動への参加を呼び掛けており、ストレージ環境の変化に合わせて仕様を進化させ改善し続けることを約束します。
企業への影響
ブート ドライブのニーズはハイパースケールの使用例に限定されません。 M.2 は現在、ほとんどのサーバーおよびストレージ アレイにとって事実上のブート ドライブ標準です。ほとんどの場合、ドライブは多くのことを行う必要はありませんが、信頼性が高く、ある程度のパフォーマンスがあり、絶対に必要なサイズ (より高価) を超えてはいけない必要があります。インフラプロバイダーがある程度の標準化を維持できるよう、ストレージベンダーがブート固有の SSD でこの取り組みに対応することを期待しています。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード