つい先週、インテルは 第 3 世代 Xeon CPUこれは、Optane SSD ストレージを含むエコシステム プレイに基づいて構築されています。 P5800X そしてもちろん最新の 200 シリーズ永続メモリ モジュール (PMem)。最初の Intel ストレージのレビューが終了したため、私たちはラボにある Intel サーバーとストレージ技術を再利用することにしました。 Optane PMem 2019、Optane P200X SSD、および TLC NAND をテストするために Windows Server 5800 をインストールしました P5510 SSD 面と向かって。このレビューの目的は、Windows Server での Intel ストレージのパフォーマンスを評価し、ベア メタル シナリオにおいてこれらの各テクノロジの強みがどこにあるのかをよりよく理解できるようにすることです。
つい先週、インテルは 第 3 世代 Xeon CPUこれは、Optane SSD ストレージを含むエコシステム プレイに基づいて構築されています。 P5800X そしてもちろん最新の 200 シリーズ永続メモリ モジュール (PMem)。最初の Intel ストレージのレビューが終了したため、私たちはラボにある Intel サーバーとストレージ技術を再利用することにしました。 Optane PMem 2019、Optane P200X SSD、および TLC NAND をテストするために Windows Server 5800 をインストールしました P5510 SSD 面と向かって。このレビューの目的は、Windows Server での Intel ストレージのパフォーマンスを評価し、ベア メタル シナリオにおいてこれらの各テクノロジの強みがどこにあるのかをよりよく理解できるようにすることです。
Optane PMem 対 Optane SSD 対 NAND SSD
Intel のストレージ ピラミッドは長年支持されてきましたが、特定のアプリケーションやユースケースにどのストレージ テクノロジが適しているかについては、依然として多くの疑問があります。確かに DRAM は最速ですが、残念ながら高価でもあります。 Optane PMem は DRAM のように使用でき、再起動時にリハイドレーションを必要としない永続的なストレージを提供します。 PMem は従来の DIMM スロットも活用しているため、簡単に導入できます。また、PMem は従来の SSD と比較して優れたパフォーマンス プロファイルを備えています。
もちろん、Optane SSD は、従来の SSD では困難な書き込みを吸収するように最適化されています。このため、これらは通常、キャッシュまたは階層化プールとして多層ストレージ アーキテクチャの一部として使用されます。ただし、Optane SSD は TLC NAND SSD よりも高価であり、容量の面で非常に不利な点があり、たとえば P5800X の最大容量は 1.6 TB です。
さらに言えば、次のような TLC SSD もあります。 インテル P5510、これは 1 ドルあたりのパフォーマンスのスイートスポットに適合します。最後にフラッシュの領域では、QLC SSD があります。これらは、テラバイトあたり最大の容量と価値を提供しますが、実際には読み取り負荷の高い環境を好みます。書き込みを集約し、穏やかで愛情のこもった方法で QLC SSD に配信するキャッシュまたは層の背後にある場合はさらに良いです。そこから、ストレージ ピラミッドはハード ドライブ、テープ ドライブ、およびクラウド ストレージの組み合わせの泥沼に発展します。
Windows Server におけるインテル ストレージのパフォーマンス
これらの最新の Intel ストレージ テクノロジのパフォーマンスを評価するために、特に PMem と既存のテスト方法を適切にサポートしながら、オーバーヘッドをできる限り少なくする状況を望みました。最初の候補は Microsoft Windows Server 2019 です。私たちは、第 3 世代 Xeon、PMem 200、PCIe Gen4 ストレージのサポートなどの最新のプラットフォーム テクノロジを紹介するように設計されたインテル OEM サーバーでテストしています。
インテル OEM サーバーの仕様
- 2 x Intel Xeon Platinum 8380 @ 2.3GHz 40 コア
- 16×32GB DDR4 3200MHz
- 16 x 128GB Intel Persistent Memory 200 シリーズ
- ブートSSD: Intel 1TB SATA
- OS:Windows Server 2019
エンタープライズ総合ワークロード分析
当社のエンタープライズ共有ストレージ ベンチマーク プロセスでは、スレッドごとに 16 の未処理のキューを備えた 16 スレッドの高負荷下でデバイスがテストされるのと同じワークロードで各デバイスを定常状態に事前調整し、その後複数のスレッド/キューで設定された間隔でテストします。深度プロファイルを使用して、軽い使用状況と重い使用状況でのパフォーマンスを示します。各デバイスのストレージの 20% という小さなフットプリントをテストしているため、各テストの主要なセクションのみをグラフ化します。
プレコンディショニングおよび一次定常状態テスト:
- スループット (読み取り+書き込み IOPS 合計)
- 平均レイテンシ (読み取りと書き込みのレイテンシを合わせて平均)
- 最大遅延 (ピーク読み取りまたは書き込み遅延)
- レイテンシの標準偏差 (読み取りと書き込みの標準偏差を合わせて平均)
当社のエンタープライズ合成ワークロード分析には、現実世界のタスクに基づいた 1 つのプロファイルが含まれており、低負荷パフォーマンスに重点を置いた 1T/4Q 4K ワークロードが含まれています。これらのプロファイルは、過去のベンチマークや、最大 8K の読み取り/書き込み速度やエンタープライズ ドライブで一般的に使用される 70K 30/XNUMX などの広く公開されている値との比較を容易にするために開発されました。
- 4K 1T/1Q
- 100% 読み取りまたは 100% 書き込み
- 100% 4
- 4K 16T/16Q
- 100% 読み取りまたは 100% 書き込み
- 100% 4
- 8K 70/30
- 70% 読み取り、30% 書き込み
- 100% 8
- 8K(シーケンシャル)
- 100% 読み取りまたは 100% 書き込み
- 100% 8
- 128K(シーケンシャル)
- 100% 読み取りまたは 100% 書き込み
- 100% 128
テストのために、インテル第 3 世代サーバー プラットフォーム内のストレージの XNUMX つの構成を調べました。これらには次のものが含まれます。
- 16 つの名前空間に 128 x 200GB Intel Persistent Memory 1 シリーズ (それぞれ約 XNUMXTB のストレージを搭載)
- 2 x 800GB インテル P5800X Optane SSD
- 8 x 7.68TB Intel P5510 SSD
各デバイス グループまたは名前空間は、持続的なパフォーマンスを測定するために 20% のデバイス容量フットプリントを使用して、FIO ジョブで直接テストされました。グループごとの各デバイスに独自のジョブが与えられ、結果が集計されました。たとえば、テスト対象の 1 台のデバイスの場合、それぞれに 1T/1Q のワークロードが与えられたため、そのワークロードでは合計 XNUMX つのキューに XNUMX つのスレッドが存在します。 XNUMX つのデバイスは XNUMX つのキューで合計 XNUMX つのスレッドになります。
最初のテストでは、単一スレッド、単一キュー深さの 4K ランダム読み取りおよび書き込みワークロードに焦点を当てました。一部のデバイスでは、その背後に I/O の深いキュー深度を必要としないため、オフライン パフォーマンスは多くのアプリケーションにとって重要です。
Intel PMem は読み取りパフォーマンスに大きな利点を示し、デュアル Intel P5800X SSD または 5510 台の Intel P5800 SSD と比較してほぼ 5510 倍のパフォーマンスを記録しました。書き込みパフォーマンスを見ると、PMem は依然として PXNUMXX SSD よりも優れていますが、XNUMX 台の PXNUMX ドライブがより高いスループットを提供できました。
次に、1T/1Q 4K 読み取りおよび書き込みテストの平均遅延の影響を見ていきます。
Intel PMem は 10K ランダム読み取りで 4 マイクロ秒の遅延を測定し、続いて P5800X が 24 マイクロ秒、P5510 SSD が 81 マイクロ秒でした。書き込み遅延を見ると、PMem で 11 マイクロ秒、P23x SSD で 5800 ミリ秒、P27 SSD で 5510 ミリ秒でした。
同じ 4K 読み取りおよび書き込みテストのより重い形式に移行して、各デバイス タイプがどこでトップになったかを確認します。
5510 台の Intel P4.8 SSD のグループがほぼ 3.2 万 IOPS という最も多くの読み取りスループットを提供し、次に 5800 万 IOPS の PMem、1.7 万 IOPS のデュアル P4X SSD が続きました。 5800K ランダム書き込みでは、1.91 台の P5510X SSD が 1.78M IOPS でトップとなり、続いて 1.35 台の PXNUMX SSD が XNUMXM IOPS、XNUMX 台の PMem 名前空間が XNUMXM IOPS で続きました。
スループットは重要ですが、PMem と SSD の両方として、Optane の最も興味深い側面の 4 つは、ストレージ レイテンシーをどの程度適切に処理できるかです。これは、より重い XNUMXK ランダム読み取りおよび書き込みワークロードにも反映されていることがわかります。
Intel PMem の読み取りレイテンシは 159 マイクロ秒で最も低く、次に 5800 台の P296X SSD が 5510 マイクロ秒、後ろの 427 台の P5800 SSD が 265 マイクロ秒でした。書き込みレイテンシーは、377 台の P5510X SSD が 1.147 マイクロ秒でトップ、PMem が XNUMX マイクロ秒で続き、XNUMX 台の従来型 PXNUMX SSD が XNUMX ミリ秒でした。
ブロックサイズを 8K 70/30 ワークロードまで上げて、XNUMX つの異なるストレージ タイプと、増加し続けるスレッドとキュー数にそれらがどのように対応するかを見ていきます。
ピーク パフォーマンスの点では、5510 基の Intel P4.34 SSD のグループが本当に力を発揮し、いくつかの印象的なピーク数値を示しました。最高では 16T/16Q で 5800M IOPS に達しましたが、興味深いのは、PMem と XNUMX 台の PXNUMXX が下位のスレッドおよびキュー ポイントの一部でわずかに先を行くことができたことです。
焦点を平均レイテンシに切り替えると、さまざまなストレージ タイプにわたって異なる状況が描かれていることがわかります。 Intel PMem は、最高のスループットを持っていませんでしたが、このテストでは最も低い平均レイテンシでなんとか合格することができ、P5800X SSD がそれに僅差で続きました。 5510 つの PXNUMX SSD は、これまでで最高のスループットを提供したにもかかわらず、XNUMX つの Optane テクノロジーよりもはるかに高い (比較的) レイテンシー レベルでした。
次に、8K 転送サイズから始まる順次ワークロードに移ります。
5510 台の Intel P4.45 SSD のグループが 1.92 万 IOPS でこのテストを簡単に突破し、続いて PMem が 5800 万 IOPS で、1.71 台の P1.75X SSD が 5510 万 IOPS で続きました。書き込みでは、PMem が 1.55 万 IOPS でトップとなり、次に 5800 台の P1.18 SSD が XNUMX 万 IOPS で、次に XNUMX 台の PXNUMXX SSD が XNUMX 万 IOPS で続きました。
最後のテストでは、2 つの異なるストレージ メディアからのピーク帯域幅を調べました。どちらの U.XNUMX デバイス タイプでも、トップエンドの制限の一部は、各展開のレーン数に起因します。
読み取り帯域幅のトップから始まり、5510 台の P54 が 44GB/s という驚異的な速度を記録し、次に 5800 つの名前空間を備えた PMem が 14GB/s を提供し、5510 台の P32.7X SSD が 14.3GB/s の読み取りで続きました。帯域幅に関して、PMem がどれだけ高いレベルに到達できるかを見るのは興味深いことです。ラージ ブロック書き込みに切り替えると、5800 台の P11.1 SSD が XNUMXGB/s でトップとなり、次に PMem が XNUMXGB/s、そして XNUMX 台の PXNUMXX SSD が XNUMXGB/s で続きました。全体的に非常に印象的な数字です。
まとめ:
Intel はここ数年、PMem と SSD の両方のバージョンで Optane に熱心に取り組んできました。データセンターで AMD をかわすために包括的なインテル プラットフォームのストーリーを織り上げている彼らにとって、このストレージ テクノロジーが根本的に重要であることは明らかです。ミッションクリティカルなワークロードについては、結果がこれを裏付けています。ストレージ階層化に関しては、P5800X は NVMe デバイス階層の最上位にきちんと位置しており、主に PCIe Gen4 のおかげで前世代モデルと比べてパフォーマンスが大幅に向上しています。実際、この向上は非常に大きく、PMem が提供するスループットには近づき始めていますが、帯域幅には近づいていません。
テスト全体を通じて、期待どおりの結果が得られました。 PMem は、低いキュー深さでのレイテンシーとスループットに関して、驚異的なパフォーマンス価値を示しました。また、読み取りパフォーマンスにおける帯域幅の大幅な向上も実現します。 P5800X Optane SSD は、5800 台の導入でも、全体的に PMem に非常に近づき始めています。これにより、PXNUMXX は、キャッシュまたは階層として活用できるソリューションにおいて、TLC または QLC ドライブとの素晴らしいペアリングとなることが可能になります。
Intel Gen3 Xeon プラットフォームのどこを見ても、ストレージに関しては優れた点がたくさんあります。私たちの調査結果は、PMem の読み取り 44 GB/秒を超える膨大な読み取り帯域幅と、キュー深度の低い 10K ランダム読み取りおよび書き込みワークロードでの 4 マイクロ秒のレイテンシーによって強調されています。 P5800X も同様のレイテンシの利点を提供し、より一般的な U.2 ベイでより広い範囲に対応し、キュー数とスレッド数が少ない場合に Intel PMem のおよそ 5510 倍のレイテンシを測定します。 PXNUMX SSD でさえ、より高いキューのワークロードに関してはその強みを示し、シーケンシャルまたはランダム IO ベンチマークでチャートトップの数値を提供しました。
重要なのは、Intel ストレージ デバイスの最新版 (PMem と SSD の両方) は、前世代の製品と比較して大幅な進歩を遂げているということです。これは、Intel が DRAM および PCIe Gen4 スロット用のより高速なバスを提供できるようになった現在では特に当てはまります。このベアメタル データを使用すると、各テクノロジーが優れている特定の箇所がわかります。このデータを理解することで、システム ビルダーはあらゆるアプリケーションを優れたものにするプラットフォームをインテリジェントに設計できるようになります。
StorageReview と連携する
ニュースレター | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSSフィード