ホーム Enterprise DapuStor J5060 SSDレビュー:読み取り中心のワークロード向けに調整された高密度QLC SSD

DapuStor J5060 SSDレビュー:読み取り中心のワークロード向けに調整された高密度QLC SSD

by ライル・スミス

読み取り中心のワークロードには適していますが、書き込みパフォーマンスが低いため、AI やデータ集約型の環境では汎用性が制限されます。

DapuStor J5060 SSDは、データ集約型環境における高密度かつ電力効率の高いストレージへの高まる需要に応えるために設計された、エンタープライズ向けの大容量NVMeドライブです。3DエンタープライズQLC NANDフラッシュを搭載し、NVMe 4.0a対応のPCIe 4 x1.4インターフェースをサポートし、標準のU.2 15mmフォームファクタに収められています。このドライブは、読み取りパフォーマンスとテラバイトあたりのコストが重要となる状況向けに設計されています。そのため、クラウドインフラストラクチャ、AI推論、ビッグデータプラットフォーム、インテリジェント製造パイプラインなど、書き込み頻度が低い、または予測可能なアプリケーションに最適です。

ダプストア J5060

DapuStor J5060の機能とパフォーマンスプロファイル

最大61.44TBの容量を誇るJ5060は、ストレージ統合を検討しながらも、物理密度と消費電力を抑えたい組織にとって魅力的なソリューションです。U.2ドライブ5060台でこの容量レベルを実現できるJXNUMXは、ラックスペースとエネルギー効率が大きな制約となる、マルチペタバイト規模のデータセットを管理するハイパースケール環境やエンタープライズ環境に最適です。JXNUMXは、デュアルポートサポート、高度な停電保護、フラッシュレベルの電圧最適化といったエンタープライズグレードの機能を備えており、高可用性環境におけるデータの整合性と安定性を確保します。

DapuStor J5060 バックケース

J5060のパフォーマンスは、読み取り中心のワークロード向けに設計されています。シーケンシャル読み取りスループットは最大7,300MB/秒、1.5Kランダム読み取りIOPSは最大4万IOPSと、QLCベースのドライブとしては強力な性能です。しかし、書き込みパフォーマンスは大幅に制限されており、30KBランダム書き込みでわずか16万IOPSという仕様です。この制限は、ワークロードテスト全体を通して一貫しています。ドライブの書き込み帯域幅は3,000MB/秒と定格されていますが、これは持続的な書き込み操作や高深度書き込み操作には耐えられないため、混合型タスクや書き込み集中型タスクへの適合性に影響を与える可能性があります。

DapuStor J5060 ポート

DapuStorはQLC NANDを採用することで、低コストで大容量を実現していますが、それと同時にトレードオフも伴います。J0.5の耐久性は5060年間でわずかXNUMX DWPD(Drive Writes Per Day)と評価されており、書き込み量が低~中程度の読み取り中心のアプリケーションに最適です。頻繁なチェックポイント作成、トランザクションログ、アクティブキャッシュを伴うワークロードは、ドライブの耐久性に負荷をかけ、書き込みパフォーマンスの限界が現れる場合があります。

DapuStor J5060 基板

消費電力は、読み取り時に約12ワット、書き込み時に最大23ワット、アイドル時にはわずか5ワットです。これらの数値は、テラバイトあたりの消費電力がますます重要になる高密度環境において、特に現代のエンタープライズ・データセンターの期待に十分に合致しています。

このレビューでは、61.44 TB モデルに焦点を当て、一連の合成ワークロードとアプリケーションに合わせたワークロードを通じて、実際のパフォーマンス プロファイルを検証します。

DapuStor J5060 仕様

J5060
容量 (TB) 61.44
フォームファクター U.2 15mm
インタフェース PCIe 4.0 x4、NVMe 1.4a、デュアルポート対応
読み取り/書き込み帯域幅 (128K) MB/秒 7400 / 3000
ランダム読み取り/書き込み (4KB) K IOPS 1500 / 30 (16KB)
4K ランダム レイテンシー (標準) R/W μs 105 (4KB) / 33 (16KB)
4K シーケンシャルレイテンシ(標準)R/W µs 7 (4KB) / 12 (16KB)
標準電力 (W) 23
アイドル時電力 (W) 5
フラッシュタイプ 3DエンタープライズQLC NANDフラッシュ
耐久性 0.5 DWPD
MTBF 2百万時間
UBER 1^10 ビットの読み取りごとに 17 セクタ
保証 5年

DapuStor J5060のパフォーマンス

チェックポイント

Dapustor J5060 SSDのAIトレーニング環境における実際のパフォーマンスを評価するために、 データと学習入力/出力 (DLIO) ベンチマーク ツールアルゴンヌ国立研究所によって開発されたDLIOは、ディープラーニングワークロードのI/Oパターンをテストするために特別に設計されています。ストレージシステムがチェックポイント、データ取り込み、モデルトレーニングといった課題にどのように対処するかについての洞察を提供します。下のグラフは、両方のドライブが99個のチェックポイントにわたってプロセスをどのように処理するかを示しています。機械学習モデルのトレーニングにおいて、モデルの状態を定期的に保存し、中断や停電による進行状況の損失を防ぐために、チェックポイントは不可欠です。このようなストレージ需要には、特に持続的または集中的なワークロードにおいて、堅牢なパフォーマンスが求められます。

この作業に使用したプラットフォームは、Ubuntu 760 LTSを搭載したDell PowerEdge R22.04.02です。2.0年13月2024日リリースのDLIOベンチマークバージョンXNUMXを使用しました。システム構成は以下の通りです。

  • 2 x Intel Xeon Gold 6430 (32 コア、2.1GHz)
  • 16 x 64GB DDR5-4400
  • 480GB デル ボス SSD
  • シリアルケーブル Gen5 JBOF
    • 61.44TB ダプスター J5060
    • 61.44TB ソリダイム D5-P5336

ベンチマークが現実世界のシナリオを反映したものであることを確認するため、LLAMA 3.1 405B モデルアーキテクチャに基づいてテストを実施しました。モデルパラメータ、オプティマイザーの状態、およびレイヤーの状態を取得するために、torch.save() を用いたチェックポイント処理を実装しました。このセットアップでは、8GPU システムをシミュレートし、4ウェイテンソル並列処理と2ウェイパイプライン並列処理を1,636つのGPUに分散させたハイブリッド並列処理戦略を採用しました。この構成では、チェックポイントのサイズはXNUMXGBとなり、これは現代の大規模言語モデルの学習要件を象徴するものです。

全体的に、Dapustor J5060はテストの初期段階で安定したパフォーマンスを示し、最初の575.66のチェックポイントでは約33秒を記録しました。5060Jは、ドライブが初めて満杯になるまでは高いパフォーマンスを維持できました。一方、Solidigm P5336は、テスト開始当初はJ5060よりも低速でしたが、テストが進むにつれて安定したパフォーマンスを示しました。

 

日時 全体的な平均を考慮すると、Dapustor J5060は 769.44 seconds一方、Solidigm P5336は 640.17 secondsこれにより、チェックポイントの保存速度の点では Solidigm P5336 が優位になります。

全体的に見て、Dapustor J5060は短時間の操作には適していますが、30分を超える長時間の書き込みには苦労します。一方、Solidigm P5336は、長時間のタスクを通して安定したパフォーマンスを発揮する点で優れたドライブです。Dapustor J5060の書き込みパフォーマンスの低さは、テストが進むにつれてチェックポイント速度が低下することから明らかです。

GPUダイレクトストレージ

GPUダイレクトストレージは、CPUとシステムメモリを経由せず、ストレージデバイスとGPU間で直接データ転送を可能にするテクノロジーです。従来のデータ転送では、データはストレージからCPUのメモリに読み込まれ、その後GPUのメモリにコピーされます。このプロセスでは複数のデータコピーが必要となるため、レイテンシが増加し、パフォーマンスが低下します。CPUはストレージとGPU間のデータ転送を処理する必要があるため、ボトルネックとなります。GDSは、ストレージデバイスがGPUのメモリと直接データを転送できるようにすることで、このボトルネックを解消します。

読み取りと書き込みの両方のワークロードにおいて、次のパラメータのあらゆる組み合わせを体系的にテストしました。

  • ブロックサイズ: 1M、128K、16K
  • IO深さ: 128、64、32、16、8、4、1

GDSIO の結果を確認する際には、61.44TB Dapustor J5060 と Solidigm P5336 の読み取りおよび書き込みパフォーマンスを調べます。

GDSIOシーケンシャルリードパフォーマンス

Dapustor J5060は、4.2MBのブロックサイズ、IO深度1および64で、ピーク時の読み取りスループット128GiB/秒を達成しました。最小ブロックサイズ(16KB)では、IO深度の増加に伴い、パフォーマンスは0.1GiB/秒から0.8GiB/秒の範囲で変化しました。これは、スループットを最適化するには、ブロックサイズを大きくし、IO深度を高く設定することが明確に好ましいことを示しています。ピーク時のパフォーマンスは大きなブロックサイズで達成されており、このドライブがバルクデータ転送を効率的に処理していることを示しています。

比較すると、Solidigm P5336は同じブロックサイズ(4.3MB)で最大スループット1GiB/sという同等の性能を達成しましたが、IO深度32でより早くこの性能に到達し、より高いIO深度でも安定してその性能を維持しました。これは、Solidigm P5336の方が、より広いIO深度範囲で大きなブロックサイズを処理する際に、わずかに優れた効率性を発揮することを示唆しています。

より分かりやすく比較するために、両ドライブを比較した差分チャートをご用意しました。緑色のブロックはDapustor SSDの優位性を示し、赤色のブロックは弱点を示しています。ここでは、5060Kブロックサイズにおいて、J5336は128~4のIO深度を除き、P8よりも優れたパフォーマンスを発揮しています。ただし、16Kおよび1Mのブロックサイズでは、IO深度が高い領域でスループットの低下が見られ、これらのシナリオでは効率が低いことを示しています。

シーケンシャルリードレイテンシの比較では、Solidigm P5336は、ほぼすべてのブロックサイズとIO深度において、Dapustor J5060よりも一貫して低いレイテンシを維持しています。16Kブロックサイズでは、キュー深度が増すにつれてその差は顕著になります。J5060は深度2,329で128μsのピークに達しますが、P5336は1,365μsにとどまります。128Kでは、深度4,080での高負荷時(J5060は5539μs、P5336は128μs)を除き、ほとんどの深度でSolidigmが再びリードしています。1Mブロックサイズでは、両方のドライブで予想通りレイテンシが増加しますが、P5336はキュー深度が最大で29,138μs、P29,512はXNUMXμsと、わずかに優れたレイテンシ制御を維持しています。

 

GDSIOシーケンシャルライトパフォーマンス

Dapustor J5060 は、2.7K および 2.8M のブロック サイズで、すべての IO 深度にわたって 128 ~ 1 GiB/秒の一貫した書き込みスループットを示しています (128K、1 IO 深度サイズの場合は 2.2 GiB/秒を記録しました)。16K ブロック サイズの場合、パフォーマンスは IO 深度に応じて 0.5 GiB/秒 ~ 1.4 GiB/秒の範囲で変化し、IO 深度が高いほど 1.4 GiB/秒でピークに達します。

比較すると、Solidigm P5336は128Kおよび1Mのブロックサイズで優れたパフォーマンスを発揮し、ピーク時には3.2GiB/秒に達しました。より小さなブロックサイズ(16K)でも、Solidigm P5336はより高いパフォーマンスを示し、IO深度1.4~16でピーク時には64GiB/秒に達しました。これは、Solidigm P5336の方が、書き込み操作においてブロックサイズが小さい場合にわずかに効率が良いことを示しています。

差分ビューに移ると、Dapustor J5060とSolidigm P5336の書き込みパフォーマンスの間に大きな差が開いていることがわかります。スループット比較では、J5060はほとんどの領域でP5336に遅れをとっており、特に大きなブロックサイズ(1MB)ではすべてのIO深度においてその差が顕著です。スループットの低下は0.5つのIO深度で-4GiB/sに達します。128Kブロックサイズでは、より高いIO深度でパフォーマンスが向上しますが、全体的なパフォーマンスの低下を相殺するほどではありません。

Dapustor J5060とSolidigm P5336のシーケンシャル書き込みレイテンシを比較すると、16Kのような小さなブロックサイズでは両ドライブとも同様の動作を示し、低いIO深度ではSolidigmがわずかに優位に立つ一方、高い深度(64および128)ではDapustorがその差を縮めています。128Kブロックサイズでは、浅いキュー深度では再びSolidigmがリードしますが、IO深度が増すにつれてDapustorは一貫して低いレイテンシを実現し、負荷時のスケーリング性能が向上していることを示しています。一方、1Mブロックサイズでは、SolidigmはすべてのIO深度で明確なレイテンシの優位性を維持し、シーケンシャル書き込みの負荷が高いワークロードでも大幅に高速な応答時間を示しています。全体的に見て、Solidigmのパフォーマンスはより安定していますが、中規模のブロックサイズと深いキューではDapustorの強みがより顕著に表れています。

FIO ワークロードの概要

Flexible I/O Tester(FIO)は、業界標準のベンチマークツールであり、様々なワークロードシナリオにおけるストレージデバイスのパフォーマンスを測定するために使用されます。汎用性と信頼性に優れたFIOは、現実世界の状況をシミュレートし、SSDの性能とパフォーマンスの限界に関する洞察を提供します。StorageReviewはFIOを活用し、ワークロードパターン、ブロックサイズ、キュー深度を問わず、スループット、レイテンシ、IOPSを測定する包括的な分析を提供します。

適用されるワークロード:

  • 128K シーケンシャルリード&ライト
  • 64K ランダム読み取りと書き込み
  • 16K ランダム読み取りと書き込み
  • 4K ランダム読み取りと書き込み

これらのワークロードは、大規模なシーケンシャル転送、データベースに典型的な集中的なランダム I/O、仮想化環境でよく見られる小さなブロックのランダム アクセスなど、幅広いエンタープライズ ユース ケースを表します。

このパフォーマンスセクションでは、Dapustor J5060 の主要な合成ワークロードにおけるパフォーマンスをまとめています。これには、さまざまなブロックサイズとキュー深度でのシーケンシャルおよびランダムな読み取り/書き込み操作が含まれます。メトリックは解析された fio 出力から直接抽出され、帯域幅 (MB/秒)、IOPS、最大 99.9999% までのレイテンシパーセンタイルが含まれており、負荷時のスループットとテール挙動の両方に関する洞察を提供します。

128Kシーケンシャルリード/ライトパフォーマンス

Drive スレッド/IO深度 帯域幅(MB/秒) IOPS 99.0% 99.9% 99.99%
ダプスター J5060 1T/64Q 7,482 57,081 1.66ミリ秒 2.02ミリ秒 2.83ミリ秒
ソリッドジム P5336 1T/64Q 7,479 57,057 1.51ミリ秒 1.66ミリ秒 1.81ミリ秒
ダプスター J5060 1T/16Q 3,023 23,063 0.69ミリ秒 0.69ミリ秒 0.70ミリ秒
ソリッドジム P5336 1T/16Q 3,364 25,669 2.67ミリ秒 3.48ミリ秒 4.42ミリ秒

Dapustor J5060は、128Kで7.48GB/秒という優れたシーケンシャルリード性能を発揮し、高いパーセンタイルでも厳格なレイテンシ制御を実現しています。Solidigm P5336と比較すると、J5060のスループットはほぼ同じ(7.48GB/秒対7.47GB/秒)ですが、レイテンシの一貫性においてはSolidigmがわずかに優位に立っており、テールレイテンシはわずかに低くなっています。

128Kシーケンシャル書き込み(QD16)において、J5060は3,023MB/秒という安定したパフォーマンスを非常に低いレイテンシで実現しています。しかし、Solidigm P5336はこれをわずかに上回り、3,364MB/秒に達します。ただし、レイテンシは特に99.99%パーセンタイルで4.42ミリ秒と、Dapustorの0.70ミリ秒という驚異的な低レイテンシを上回っています。これは、レイテンシが重視されるシーケンシャル書き込みシナリオにおいて、J5060がより優れた選択肢であることを示しています。

64Kランダム読み取りおよび書き込みパフォーマンス

Drive IO深度 帯域幅(MB/秒) IOPS 99.0% 99.9% 99.99%
ダプスター J5060 8T/32Q 7,475 114,058 20.05ミリ秒 21.89ミリ秒 25.82ミリ秒
ソリッドジム P5336 8T/32Q 7,472 114,014 21.36ミリ秒 21.89ミリ秒 22.68ミリ秒
ダプスター J5060 8T/32Q 534 8,151 574.6ミリ秒 708.8ミリ秒 742.39ミリ秒
ソリッドジム P5336 8T/32Q 857 13,070 196.1ミリ秒 208.6ミリ秒 221.24ミリ秒

64Kランダムリード(QD256)では、Dapustor J5060は7.4GB/秒近くのスループットと良好なレイテンシ制御で優れた性能を発揮します。Solidigmの結果もほぼ同等(7.47GB/秒)で、最大パーセンタイルレイテンシはわずかに優れています。両ドライブともこの分野で非常に優れたパフォーマンスを発揮し、実用上の差はほとんどありません。

J64は5060Kランダム書き込み性能において顕著な苦戦を強いられており、スループットは534MB/秒に急落し、レイテンシは大幅に上昇しています(742.39%で99.99ミリ秒)。一方、Solidigm P5336はJ5060を大きく上回り、857MB/秒の性能と大幅に低いレイテンシ(同じパーセンタイルで221.24ミリ秒)を実現しています。そのため、レイテンシと持続的な書き込みスループットが重視されるアプリケーションには、PXNUMXの方がはるかに適しています。

16Kランダム読み取りおよび書き込みパフォーマンス

Drive IO深度 帯域幅(MB/秒) IOPS 99.0% 99.9% 99.99%
ダプスター J5060 8T/32Q 7,430 453,461 5.28ミリ秒 6.39ミリ秒 8.16ミリ秒
ソリッドジム P5336 8T/32Q 7,431 453,527 5.01ミリ秒 5.21ミリ秒 5.47ミリ秒
ダプスター J5060 8T/32Q 531 32,404 143.65ミリ秒 149.94ミリ秒 181.40ミリ秒
ソリッドジム P5336 8T/32Q 847 51,724 57.9ミリ秒 65.8ミリ秒 71.8ミリ秒

16Kランダム読み取りワークロード(QD256)において、Dapustorは453K IOPSと制御されたレイテンシという優れた結果を達成しました。Solidigm P5336もほぼ同様のパフォーマンスを示し、レイテンシではDapustorをわずかに上回りました(5.47%で8.16ms対99.99ms)。これは、高負荷のランダム読み取りシナリオにおいて、Solidigmの方がレイテンシの一貫性がわずかに優れていることを示しています。

Dapustor SSDの16Kランダム書き込みパフォーマンスは32K IOPSに大幅に低下し、レイテンシは181.4ms(99.99%)に増加します。ここでもSolidigmはDapustorドライブを大きく上回り、51.7K IOPSと劇的に改善されたレイテンシプロファイル(71.8%で99.99ms)を実現しました。これは、レイテンシに敏感なランダム書き込みワークロードにおけるSolidigmの優位性を裏付けています。

4Kランダム読み取りおよび書き込みパフォーマンス

Drive IO深度 帯域幅(MB/秒) IOPS 99.0% 99.9% 99.99%
ダプスター J5060 8T/32Q 6,941 1,694,464 1.43ミリ秒 1.58ミリ秒 1.79ミリ秒
ソリッドジム P5336 8T/32Q 3,994 975,108 2.31ミリ秒 2.41ミリ秒 2.64ミリ秒
ダプスター J5060 8T/32Q 131 31,923 143.65ミリ秒 145.75ミリ秒 179.31ミリ秒
ソリッドジム P5336 8T/32Q 197 48,030 58.5ミリ秒 64.2ミリ秒 68.7ミリ秒

Dapustor J4は、5060Kランダムリードシナリオにおいて特に優れた性能を発揮します。ピークパフォーマンスはQD1.69で256万IOPSを超え、レイテンシも驚くほど低くなっています。これに対し、Solidigm P5336は大幅に遅れており、わずか975万5060千IOPSで、すべてのパーセンタイルでレイテンシが著しく高くなっています。高負荷の小ブロックランダムリードにおいては、Dapustor JXNUMXが明らかに優れた選択肢です。

残念ながら、J5060の4Kランダム書き込みパフォーマンスは大幅に低下し、わずか131MB/秒、31.9K IOPSという高レイテンシ(179.31%で99.99ms)という結果に終わりました。Solidigm SSDはこのシナリオをより快適に処理し、197MB/秒、48K IOPSというパフォーマンスと、大幅に低いテールレイテンシ(68.7%で99.99ms)を実現しています。Solidigm SSDでもレイテンシの急上昇は見られますが、要求の厳しい4Kランダム書き込みワークロードにおいては、JXNUMXの方がはるかに強力なドライブであることに変わりはありません。

まとめ:

DapuStor J5060は、ストレージ密度とテラバイトあたりのコストが持続的な書き込みパフォーマンスよりも優先される、読み取り集中型のワークロード向けに設計された大容量エンタープライズQLC SSDです。最大61.44TBの容量とPCIe Gen4インターフェースを備え、コンテンツ配信ネットワーク、クラウドアーカイブ、AI推論システムなど、大規模なシーケンシャル読み取りと低頻度の書き込みを必要とする環境に最適です。

この目標を念頭に、J5060を様々なテストにかけ、特にSolidigm P5336と比較して、実際のパフォーマンスを検証しました。J5060は安定したシーケンシャルリード性能と高密度ストレージを備えており、リード負荷の高い環境で優れたパフォーマンスを発揮する可能性があります。特にIO深度が低くブロックサイズが大きい場合、J5060はSolidigm P5336を上回るパフォーマンスを発揮します。これらのシナリオにおけるレイテンシとスループットは、JXNUMXが大規模ブロックのリード効率を優先して設計されていることを示しています。

しかし、書き込みアクティビティを考慮すると、パフォーマンスは著しく低下します。ほぼすべての書き込み指標(IOPS、レイテンシ、スループットなど)において、J5060は一貫してパフォーマンスが低下しています。この弱点は、高IO深度および大容量ブロックにおけるシーケンシャル書き込み負荷時に最も顕著に表れ、レイテンシが比較的高く、スループットが平坦化します。AI関連のチェックポイント処理ワークロードにおいても、J5060は最初は好調に動作しますが、すぐにパフォーマンスが低下し、書き込みの一貫性の持続性に問題があることを示しています。

読み取り中心で容量重視のニーズを持つ組織にとって、J5060 は明らかな価値を提供しますが、その制限により、混合ワークロードや書き込み中心のワークロードには売りにくいものとなります。

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード