Home Enterprise Western Digital SN861 Gen5 SSD: 現代のハイパースケールとエンタープライズのニーズに応える多用途ソリューション

Western Digital SN861 Gen5 SSD: 現代のハイパースケールとエンタープライズのニーズに応える多用途ソリューション

by ブライアン・ビーラー

Western Digital SN5 などの最新の Gen861 SSD がビジネスの成果に影響を与えていることは明らかです。その証拠が必要な場合は、AI 革命への影響を見れば明らかです。

WesternDigitalが後援

Western Digital Ultrastar® DC SN861 SSD は、ハイパースケール データ センターとエンタープライズ環境の両方の高性能ニーズを満たすように設計されています。SN861 は PCIe® Gen5 インターフェイスをサポートし、U.2 や E1.S などのさまざまなフォーム ファクターで提供されるため、複数の導入シナリオに適合できます。ただし、SN861 をさまざまなフォーム ファクターで作成するほど簡単ではありません。Western Digital は、ターゲット市場に合わせて SN861 の機能セットを巧みに設計しました。

Gen5インターフェースにより、SN861は前世代に比べてパフォーマンスが即座に向上します。 SN655新しいドライブの利点は、E1.S フォーム ファクターの Flexible Data Placement (FDP) などの機能により、さらに深まります。FDP は書き込み増幅を減らし、データ配置を最適化します。SN861 には、エンドツーエンドのデータ保護、AES-XTS 暗号化、TCG OPAL 2.01 などの高度なセキュリティ機能が含まれています。コントローラは SSD の電力消費も削減し、アイドル時の平均は 5 ワット未満です。さらに、このドライブは NVMe® 2.0 や OCP Cloud Spec 2.0 などの複数の標準をサポートしています。

セキュリティと効率の機能は重要ですが、世代交代ごとにパフォーマンスが大幅に向上しており、SN861 も例外ではありません。このドライブは、最大 13,700 MB/秒のシーケンシャル読み取り速度と最大 3.3 万のランダム読み取り IOPS を実現しており、AI/ML やビッグ データ分析などのアプリケーションに不可欠です。SN861 の両バージョンとも、動作中の平均消費電力は 20 ワット、アイドル時は 5 ワット未満です。電力は調整可能なので、予想されるワークロードに合わせてドライブの電力プロファイルを調整するのは簡単です。たとえば、ハイパースケーラーは、E1.S ドライブをはるかに低い電力状態で実行することがよくあります。

興味深いことに、SN861 の 1 つのフォーム ファクターは技術的に設計が非常に似ていますが、Western Digital は各ドライブを特定のワークロードに合わせて調整しています。たとえば、E2.S バージョンでは、FDP などの機能とクラウド ワークロード向けのパフォーマンス調整が行われます。一方、U.XNUMX ドライブは、高性能エンタープライズ ワークロードや、ドライブ パフォーマンスの大幅な向上の恩恵を受ける AI などの新しいワークロードに間違いなく採用されるでしょう。

EDSFFとFDP

FDP は、CacheLib などのワークロードにおける SSD のパフォーマンスと信頼性を最適化することで、Meta のようなハイパースケーラーに大きなメリットをもたらします。FDP は書き込み増幅係数 (WAF) を削減し、書き込み速度の向上と SSD 寿命の延長を実現します。これは、大量のデータ処理タスクを処理するために不可欠です。

このテクノロジーは、類似データをインテリジェントにグループ化し、オーバープロビジョニングを最小限に抑え、集中的なガベージ コレクションの必要性を減らすことで、データ編成を強化します。また、FDP は複数の名前空間をサポートし、さまざまなワークロード間で一貫したパフォーマンスを保証します。この最適化により、アプリケーションのパフォーマンスと耐久性が向上し、大規模ストレージ インフラストラクチャの総所有コスト (TCO) が大幅に削減されます。

Ultrastar SN1 の E861.S バージョンで FDP がサポートされているということは、このドライブがハイパースケーラーのニーズに対応できることを意味しますが、FDP は方程式の一部にすぎません。このドライブの E1.S バージョンは、ハイパースケールのパフォーマンス要件、特に読み取りパフォーマンスに関する QoS を満たす必要があります。

U.2 エンタープライズ向け

E1.S ドライブはハイパースケールのユースケースに最適ですが、ほとんどの企業が採用するドライブは U.2 SN861 です。当社では、このドライブを一連のテストにかけ、標準テスト スイートで全体的なパフォーマンスを測定しました。

Western Digital Ultrastar DC SN861 SSD データシート

1.60TB 1.92TB 3.20TB 3.84TB 6.40TB 7.68TB
耐久性 3 DWPD 1 DWPD 3 DWPD 1 DWPD 3 DWPD 1 DWPD
セキュリティ
SE、ISE、TCG オパール 2.01
フォームファクター
U.2
インタフェース
PCIe Gen5x4
NVMe仕様
NVMe v2.0
業績(予想) 1.60TB 1.92TB 3.20TB 3.84TB 6.40TB 7.68TB
読み取りスループット (最大 MB/秒、シーケンス 128 KiB) 13,700 13,700 13,700 13,700 13,700 13,700
書き込みスループット (最大 GB/秒、シーケンス 256 KiB) 3,600 3,600 7,200 7,200 7,500 7,500
読み取り IOPS (最大、Rnd 4KiB) 2,100K 2,100K 3,300K 3,300K 3,300K 3,300K
書き込み IOPS (最大、Rnd 4KiB) 350K 165K 665K 330K 800K 430K
読み取りレイテンシ (µS) 65 65 65 65 65 65
書き込みレイテンシ (µS) 8 8 8 8 8 8
信頼性の向上
MTTF(時間、予測)
2.5M
訂正不可能なビット誤り率 (UBER)
1で1017
年間故障率(AFR、予測)
0.35%
限定保証(年)
5年
電力管理(予測)
要件 (DC、+/- 10%)
+ 12v
動作モード(平均、最大)
アイドル(平均)
物理的なサイズ
Z高さ(mm)
15 mm
寸法(幅×長さ、mm)
69.85 mm X 100.45 mm
環境
動作温度(周囲)
0 ℃〜70 ℃
非動作温度
-40 ℃~ 85 ℃

この比較で使用したエンタープライズNVMe® Gen5 SSDのパフォーマンスを測定するために、XNUMXコーナーワークロードにはfioテストスイートを、混合ワークロードにはVdbenchを活用しました。私たちが活用したfioスクリプトパッケージは、一貫した方法でドライブを事前調整し、軽くテストするために設定された自動化されたスクリプトです。 githubで見つかりましたこれを使用して、ピーク帯域幅の 256K シーケンシャル読み取りおよび書き込みテストと、ピーク スループットの 4K ランダム読み取りおよび書き込みテストを実行しました。

ピークスループットと帯域幅
ウエスタンデジタル SN861 7.68TB キオクシア CM7-R 7.68TB サムスン PM1743 7.68TB サムスン PM9A3 7.68TB
256K シーケンシャル読み取り (1T/64Q) 13,283MB /秒 12,092MB /秒 14,495MB /秒 6,751MB /秒
256K シーケンシャル書き込み (1T/64Q) 7,696MB /秒 5,796MB /秒 6,052MB /秒 4,055MB /秒
4Kランダムリード(8T/32Q) 2,108,065 IOPS 1,963,066 IOPS 1,900,838 IOPS 1,068,508 IOPS
4Kランダム書き込み(8T/32Q) 473,658 IOPS 301,061 IOPS 319,758 IOPS 206,660 IOPS

Western Digital SN861 の最高レベルのパフォーマンス数値を見ると、Gen5 インターフェースをうまく活用していることがわかります。シーケンシャル読み取りでは 13.3GB/秒を記録し、Samsung PM1743 の 14.5GB/秒に次ぐ 861 位でした。シーケンシャル書き込みでは、SN5 が 7.7GB/秒の速度で 6.1 位となり、他の 1743 つの GenXNUMX モデルを圧倒しました。次に近かったのは Samsung PMXNUMX の XNUMXGB/秒でした。

ランダム 4K 読み取りパフォーマンスは特に優れており、2.11M IOPS を記録しました。次に近かったのは KIOXIA CM1.96-R の 7M IOPS でした。ランダム 4K 書き込みパフォーマンスを見ると、Western Digital SN861 も 474K IOPS の速度で 1743 位となり、次に近かったのは Samsung PM320 の 861K IOPS でした。私たちの XNUMX つのコーナーのワークロードでは、Western Digital SNXNUMX が XNUMX つのテストのうち XNUMX つで最高の数値を達成しました。

SN861 Gen5 SSDをテストするために、 デル® PowerEdge® R760 当社のテスト ラボでテストしました。これは、2 つの第 4 世代 Intel Xeon プロセッサーをサポートし、最大 24 台の NVMe ドライブをサポートする構成を持つ、非常に汎用性の高い 7U ラックマウント サーバーです。このサーバーは、混合ワークロード、データベース、および VDI を対象としています。このレビューでテストしている CMXNUMX-R のバージョンは、Dell のファームウェア ビルドを搭載した Dell サーバーからのものであることに注意してください。このドライブは、KIOXIA の標準ファームウェアでは異なるパフォーマンスを示す可能性があります。

Dell PowerEdge R760 構成:

  • デュアル Intel® Xeon® Gold 6430 (32 コア/64 スレッド、1.9GHz ベース)
  • 1TB DDR5 RAM
  • Ubuntuの22.04

究極の柔軟性を実現するために、Serial Cables とも協力し、U.8/U.5、M.2、EDSFF SSD テスト用の 3 ベイ PCIe Gen2 JBOF を提供してもらいました。これにより、現在および将来のすべてのドライブ タイプを同じテスト ハードウェアでテストできます。また、VDbench を活用して、さまざまなワークロード タイプで SSD のスケール パフォーマンスを比較しました。これらのベンチマークのテスト プロセスでは、ドライブ サーフェス全体をデータで埋め、ドライブ容量の 25% に相当するドライブ セクションをパーティション分割して、ドライブがアプリケーション ワークロードにどのように応答するかをシミュレートします。これは、ドライブの 100% を使用して安定状態にするフル エントロピー テストとは異なります。その結果、これらの数値は、より高い持続書き込み速度を反映します。

プロフィール:

  • 16K シーケンシャル読み取り: 100% 読み取り、32 スレッド、0 ~ 120% の iorate
  • 16K シーケンシャル書き込み: 100% 書き込み、16 スレッド、0 ~ 120% iorate
  • 4K、8K、および 16K 70R/30W ランダム ミックス、64 スレッド、0 ~ 120% のヨウ素酸塩
  • 合成データベース: SQL および Oracle
  • VDI フル クローンおよびリンク クローン トレース

最初の Vdbench テストでは、16 スレッドの負荷で 32K のシーケンシャル読み取りパフォーマンスを測定しました。ここでは、Western Digital SN325 から 5.1K IOPS と 98 μs で 861GB/s のピーク スループットを測定しました。これは、7K IOPS を記録した KIOXIA CM329-R と互角でした。PCIe Gen5 Samsung PM1743 は 289K IOPS を記録し、リファレンス Gen9 SSD として持ってきた Samsung PM3A4 は 227K IOPS を記録しました。同じ 16K シーケンシャル ワークロードでの書き込みパフォーマンスに焦点を移すと、Western Digital SN861 は、比較した他の U.2 PCIe Gen5 SSD に対して大きなリードを示しました。SN861 は、ピーク 200K IOPS と 3.1 μs で 78GB/s を記録し、KIOXIA CM7-R と Samsung PM1743 の両方よりも優れたリードを示しました。Gen4 ランドスケープと比較すると、すべてが 9K IOPS を記録した Samsung PM3A131 に対して大きなリードを示しました。次の 70 つのテストでは、30/4 R/W ミックスでのランダム転送テストでブロック サイズのスケーリングを調べます。最初のテストでは 861K ブロック サイズを測定しました。ここでは、Western Digital SN7 と KIOXIA CM861-R のパフォーマンスが非常に似ていることがわかります。SN903 は 70 μs で 881K IOPS を計測し、CM7-R は 1743K IOPS でした。Samsung PM521 はピーク速度 4K IOPS で後れを取り、Gen9 PM3A396 は XNUMXK IOPS でした。8/70 R/W ランダム テストで 30K ブロック サイズまで移行すると、Western Digital SN861 は KIOXA CM7-R を上回り、682 μs で 93K IOPS のピークを計測しました。一方、CM7-R は 599K IOPS でした。Samsung PM1743 は 414K IOPS で後れを取り、Gen4 PM9A3 は 301K IOPS でした。最後のランダム 70/30 R/W テストでは、16K ブロック サイズを調べます。Western Digital SN861 はここでも引き続き強力なリードを示し、434 μs で 143K IOPS のピークを記録し、CM7-R は 337K IOPS を記録しました。Samsung PM1743 は引き続き遅れをとり、231K IOPS を記録し、Gen4 PM9A3 は 183K IOPS を記録しました。次の一連のテストでは、合成 SQL ワークロードに焦点を当てます。この最初のテストでは、Western Digital SN861 が KIOXIA CM7-R をわずかに上回り、ピーク速度は 407 μs で 78K IOPS であるのに対し、CM396-R は 7K IOPS でした。Samsung PM1743 はピーク 340K IOPS で後れを取り、Gen4 PM9A3 は 310K IOPS を記録しました。SQL ワークロードを 80/20 R/W ミックスで実行すると、Western Digital SN861 は KIOXIA CM7-R を引き続きリードし、424 μs で 75K IOPS のピーク速度を計測しました。CM407-R は 7K でした。Samsung PM1743 はピーク速度 322K IOPS でこれら 4 社に遅れをとり、Gen9 PM3A281 は XNUMXK IOPS でした。SQL ワークロードで読み取りの分散を 90/10 の R/W 分割に増やしたところ、Western Digital SN861 は KIOXIA CM7-R に対してリードを維持し、CM411-R の 77K IOPS に対して 398 μs で 7K IOPS を記録しました。Samsung はピーク速度 328K IOPS で依然としてこれら 4 社に遅れをとり、Gen9 PM3A297 は XNUMXK IOPS を記録しました。SQL テストの後、焦点を合成 Oracle ワークロードに切り替えます。ここでは、5 つの Gen4 SSD が Gen9 Samsung PM3A861 を大幅に上回っています。Western Digital SN445 は、80 μs で 7K IOPS のピーク速度でリードを維持し、417K IOPS の KIOXIA CM1743-R を上回りました。Samsung PM317 は 9K IOPS でこれに続き、PM3A267 は XNUMXK IOPS でした。合成 Oracle ワークロードの R/W 比を 80/20 に変更すると、Western Digital SN861 と KIOXIA CM7-R の差は縮まり、SN861 は 309 μs で 71K IOPS のピークを記録し、CM7-R は 304K IOPS を記録しました。Samsung PM1743 は 252K IOPS のピークを記録し、Gen4 PM9A3 は 228K IOPS を記録しました。最終的な合成 Oracle ワークロード (90/10 R/W ミックス) では、Western Digital SN861 と KIOXIA CM7-R の間に同様の僅差が見られました。SN861 のピーク速度は 296 μs で 74K IOPS でしたが、CM7-R は 292K IOPS でした。Samsung PM1743 はさらに遅れてピーク速度は 250K IOPS でしたが、Gen4 PM9A3 は 231K IOPS でした。最後の 861 つのワークロードは、フルクローン VM とリンククローン VM の VDI トレースに焦点を当てています。これらはそれぞれ、ブート、初期ログイン、月曜日のログインの 370 つのシナリオをカバーしています。テストはフルクローン ブート シナリオをカバーしており、Western Digital SN94 は 7 μs で 348K IOPS を記録したのに対し、KIOXIA CM1743-R は 263K IOPS でした。Samsung PM4 は 9K IOPS、Gen3 PM227AXNUMX は XNUMXK IOPS でそれに続きました。初期ログイン シナリオでは、KIOXIA CM7-R が Western Digital SN861 をリードし、196 μs で 163K IOPS を記録し、SN861 は 181K IOPS でした。Samsung PM1743 はピークで 157K IOPS を記録し、Gen4 PM9A3 は 117K IOPS でした。月曜日のログイン プロファイルでは、Western Digital SN861 と KIOXIA CM7-R が互角の結果となりました。SN861 は 158 μs で 99K IOPS のピークを記録しましたが、CM7-R は 160K IOPS を記録しました。Samsung PM1743 は 126K IOPS を記録し、Gen4 PM9A3 は 83K IOPS でした。最後の 7 つのテストでは、同じプロファイルをブートから始めて、VDI リンク クローン セットアップで調べました。KIOXIA CM161-R が 861K IOPS を記録して 156 位となり、Western Digital SN102 が 1743 μs で 138K IOPS を記録しました。次に Samsung PM4 が 9K IOPS を記録し、Gen3 PM110AXNUMX が XNUMXK IOPS でそれに続きました。初期ログイン プロファイルを測定した当社のテストでは、KIOXIA CM7-R が 89K IOPS で最高速度を記録し、Western Digital SN861 が 85 μs で 102K IOPS でそれに続きました。Samsung PM1743 は 70K IOPS でそれに続き、その Gen4 兄弟は 53K IOPS でそれに続きました。月曜日のログイン プロファイルを対象とした最新の VDI ワークロードでは、Western Digital SN861 が 122 μs で 129K IOPS のピーク速度でトップに立ち、KIOXIA CM7-R が 115K IOPS でそれに続きました。Samsung PM1743 は 95K IOPS を記録し、Gen4 PM9A3 が 64K IOPS のピーク速度でそれに続きました。

ウエスタンデジタルSN861とAI

このレポートのSN861の作業と多少関連して、私たちは前世代の ウエスタンデジタル ウルトラスター DC SN655 Western Digital システム グループが提供する OpenFlex™ Data24 プラットフォーム内。FMS '24 のデモでは、GPU サーバー、Data24 NVMe-oF™ プラットフォーム、Gen4 SN655 SSD を使用した AI デモを披露しました。

NVIDIA® IndeX® を使用したテストでは、高度なボリューム ビジュアライゼーション機能を活用して、大量のデータセットを高い忠実度で処理することに重点が置かれました。IndeX は GPU アクセラレーションを利用して、石油やガスの探査、医療用画像処理、科学研究などの業界にとって極めて重要な 3D ボリューム データのリアルタイムのインタラクティブなビジュアライゼーションを提供します。

特に GPU を多用する環境で最適なパフォーマンスを実現するには、GPU とストレージ間の高速データ交換を確保する必要があります。たとえば、NVIDIA H100 GPU の帯域幅を完全に飽和させるには、約 64 GB/秒のスループットを実現する必要があり、これには高性能 NVMe ストレージ ソリューションと NVIDIA GPUDirect™ などのテクノロジの使用が含まれます。この統合により、レイテンシが短縮され、データ スループットが最大化され、効率的な GPU 使用が保証され、大規模データセットをより高速かつ効果的に処理できるようになります。

Gen4 SN655 のピーク時 6.8GB/秒と SN13.7 の 861GB/秒の帯域幅の違いを見ると、Gen5 SSD に移行する利点が明らかです。前世代モデルで 64GB/秒を達成するには 861 台の SSD が必要でしたが、SNXNUMX では XNUMX 台でその目標を達成できます。この違いにより、ドライブ数を増やして帯域幅や容量を増やすことができます。

AI やその他の高度なアプリケーションのニーズに合わせてストレージを拡張するには、パフォーマンスと容量が重要です。この点で、SN5 が Gen861 ドライブよりも優れている Gen4 インターフェイスと全体的なパフォーマンスの向上は非常に魅力的です。つまり、これらのドライブは単一のストレージ システム内でより多くの GPU をサポートでき、それらの GPU に十分な速度でデータが供給されるため、完全に活用できます。

まとめ

SN861 は、Western Digital にとって大きな飛躍の兆しです。このドライブは、ハイパースケールとエンタープライズの両方の顧客をサポートするフォーム ファクターで提供され、E1.S ドライブの FDP などのドライブ機能は、想定される使用ケースに合わせて調整されています。しかし、Gen5 インターフェイスは、このドライブの最も明らかな利点であり、総合的に優れたパフォーマンス プロファイルを提供します。

Western Digital SN861 は、発売直後から強力なパフォーマンスを発揮し、ピークシーケンシャル帯域幅とランダムスループットを測定する最初の 4 つのワークロードで上位 2.11 位を獲得しました。ハイライトとしては、ランダム 4K 読み取りパフォーマンスが 474M IOPS、ランダム 1743K 書き込みパフォーマンスが 13.3K IOPS でした。シーケンシャル読み取りパフォーマンスは強力で、Samsung PM7.7 の XNUMXGB/秒に次ぐ XNUMX 位でしたが、シーケンシャル書き込み帯域幅では XNUMXGB/秒を記録し、トップに立つことができました。

主に混合ワークロードまたはより小さなブロック サイズの転送に重点を置いた VDbench ワークロードでは、SN861 は引き続き非常に優れたパフォーマンスを発揮しました。16K シーケンシャル書き込み速度は 200K IOPS と強力で、70K、30K、4K 転送サイズをカバーする 8/16 R/W ミックス テストでは大きなリードを示しました。VDI ワークロードでは、SN861 は KIOXIA CM7-R とトップの座を交代しましたが、一部の領域では互角でした。全体として、Western Digital SN861 はテスト ラインアップ全体で優れたパフォーマンスを発揮しました。

Western Digital SN5 などの最新の Gen861 SSD がビジネス成果に影響を与えていることは明らかです。その証拠が必要な場合は、AI 革命への影響を見れば明らかです。テストで確認したところ、AI システムでは、上記の NVIDIA IndeX の例のようなキャッシュ内、共有ストレージ アレイ内、または GPU サーバー内のいずれであっても、GPU を動作させるために高速ストレージが必要です。Western Digital は、SN861 をこれらの高度なワークロード向けにうまく位置付けると同時に、ハイパースケーラー向けに FDP 対応の SKU も提供しました。

ウエスタンデジタルデータセンターストレージ

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード