Home Enterprise Memblaze PBlaze5 920 シリーズ NVMe SSD レビュー

Memblaze PBlaze5 920 シリーズ NVMe SSD レビュー

by ブライアン・ビーラー
メンブレイズ Pブレイズ5 926

私たちは長年にわたり、Memblaze のエンタープライズ SSD を数多く見てきましたが、それらはテクノロジーとパフォーマンスの両方において最先端であることがよくあります。最近、Memblaze PBlaze5 ファミリの新しい SSD セットである Memblaze PBlaze5 920 シリーズを発売しました。の その前の916シリーズ、PBlaze5 920 シリーズは、U.2 およびアドイン カード (AIC) フォーム ファクターで提供されます。 920 シリーズとの最大の違いは、新しい NAND セットを使用し、前モデルの 96 層から 3 層 64D TLC NAND に移行していることです。新しい Memblaze SSD は、パフォーマンス スペクトルのトップエンドで 5.9GB/s と 970,000 IOPS を実現すると見積もられています。

私たちは長年にわたり、Memblaze のエンタープライズ SSD を数多く見てきましたが、それらはテクノロジーとパフォーマンスの両方において最先端であることがよくあります。最近、Memblaze PBlaze5 ファミリの新しい SSD セットである Memblaze PBlaze5 920 シリーズを発売しました。の その前の916シリーズ、PBlaze5 920 シリーズは、U.2 およびアドイン カード (AIC) フォーム ファクターで提供されます。 920 シリーズとの最大の違いは、新しい NAND セットを使用し、前モデルの 96 層から 3 層 64D TLC NAND に移行していることです。新しい Memblaze SSD は、パフォーマンス スペクトルのトップエンドで 5.9GB/s と 970,000 IOPS を実現すると見積もられています。

メンブレイズ Pブレイズ5 920 926

920 シリーズには、1 日あたり 3 ドライブ書き込み (DWPD) または 920 DWPD の 926 つの耐久性定格があります。これにより、フォーム ファクターと耐久性に基づいてセグメント化された 920 つの異なるドライブが作成されます。 AIC フォーム ファクタは C926 および C3 として指定されており、C2 はより読み取り中心のドライブであり、C920 は 926 DWPD 耐久性評価を備えています。同様に、U.3.84 ドライブは D7.68 と D3 であり、耐久性の面でも同様です。耐久性の低いドライブには、両方のファーム要素で 3.2 TB と 6.4 TB の容量があります。同様に、916 つの DWPD SSD には、どちらのファミリーでも XNUMX TB と XNUMX TB の容量があります。以前の XNUMX シリーズ ドライブには大容量モデルがありましたが、Memblaze は今回、おそらく容量不足のためそのモデルを削除しました。

メンブレイズ Pブレイズ5 920 926 下

Memblaze には、これらの SSD に多数の重要な機能が組み込まれています。私たちのお気に入りの 32 つは、リセットせずにドライブのファームウェアをアップグレードできる機能です。これは、サーバーを再起動せずにドライブを更新できることを意味します。 Memblaze は、「名前空間によるクォータ」と呼ばれるものも追加しました。ドライブは 256 の名前空間をサポートするようになり、それぞれがデータを暗号化するための異なる AES-256 キーを持ちます。これらの名前空間内では、重要でないアプリケーションを制限して、より重要なアプリケーションの QoS を確保できます。ドライブは、データの信頼性を確保するための多くの機能もサポートしています。 LDPC エラー訂正、AES-10 ビット データ暗号化、完全なデータ パス保護、TXNUMX PI エンドツーエンド保護、および強化された電源障害保護。

ビデオの概要は次のとおりです。

レビューモデルは6.4TB C926です。

Memblaze PBlaze 920 シリーズ仕様

モデル D920 920 D926 926
ユーザー容量 (TB) 3.84 7.68 3.84 7.68 3.2 6.4 3.2 6.4
インタフェース PCIe 3.0×4 PCIe 3.0×8 PCIe 3.0×4 PCIe 3.0×8
フォームファクター 2.5インチU.2 HHHL AIC 2.5インチU.2 HHHL AIC
128KB シーケンシャル読み取り (GB/秒) 3.5 3.5 5.6 5.9 3.5 3.5 5.6 5.9
128KB シーケンシャル書き込み (GB/秒) 3.3 3.5 3.3 3.7 3.3 3.5 3.3 3.7
持続ランダム読み取り (4KB) IOPS 825K 840K 835K 970K 825K 835K 835K 970K
持続ランダム書き込み(4KB) IOPS (定常状態) 140K 150K 140K 150K 280K 300K 280K 300K
読み取り/書き込みレイテンシ(μs) 90 / 12
生涯耐久性 1DWPD 3DWPD
訂正不可能なビット誤り率 < 10 -17
平均故障間隔 2百万時間
プロトコル NVMe 1.2a
NANDフラッシュメモリ 3D eTLC NAND
操作システム RHEL、SLES、CentOS、Ubuntu、Windows Server、VMware ESXi
消費電力 7~25w
基本機能のサポート 停電保護、ホットプラグ可能、完全なデータパス保護、S.M.A.R.T、柔軟な電源管理
高度な機能のサポート TRIM、マルチネームスペース、AES 256 データ暗号化と暗号消去、デュアル ポートと予約 (U.2 のみ)、EUI64/NGUID 可変セクター サイズ管理と T10 PI (DIF/DIX)、リセットなしのファームウェア アップグレード、ネームスペース別のクォータ
ソフトウェアサポート オープンソース管理ツール、CLIデバッグツール OSインボックスドライバー(システム統合が容易)

 メンブレイズ PBlaze5 C926 パフォーマンス

テストベッド

当社の Enterprise SSD レビューでは、アプリケーション テストに Lenovo ThinkSystem SR850 を活用しています。 デル PowerEdge R740xd 合成ベンチマーク用。 ThinkSystem SR850 は、十分に装備されたクアッド CPU プラットフォームであり、高性能ローカル ストレージに必要な能力を十分に上回る CPU パワーを提供します。大量の CPU リソースを必要としない合成テストでは、より従来のデュアルプロセッサ サーバーが使用されます。どちらの場合も、ストレージ ベンダーの最大ドライブ仕様に合わせてローカル ストレージを可能な限り最良の状態で紹介することが目的です。

レノボ シンクシステム SR850

  • 4 x Intel Platinum 8160 CPU (2.1GHz x 24 コア)
  • 16 x 32GB DDR4-2666Mhz ECC DRAM
  • 2 x RAID 930-8i 12Gb/秒 RAID カード
  • 8 つの NVMe ベイ
  • VMware ESXI 6.5

デル PowerEdge R740xd

  • 2 x Intel Gold 6130 CPU (2.1GHz x 16 コア)
  • 4 x 16GB DDR4-2666MHz ECC DRAM
  • 1x PERC 730 2GB 12Gb/秒 RAID カード
  • アドインNVMeアダプター
  • Ubuntu-16.04.3-デスクトップ-amd64

テストの背景と比較対象

この StorageReview エンタープライズ テスト ラボ は、管理者が実際の展開で遭遇するものと同等の環境でエンタープライズ ストレージ デバイスのベンチマークを実施するための柔軟なアーキテクチャを提供します。エンタープライズ テスト ラボには、さまざまなサーバー、ネットワーキング、電源調整、その他のネットワーク インフラストラクチャが組み込まれており、スタッフが実際の条件を確立してレビュー中にパフォーマンスを正確に測定できるようになります。

ラボ環境とプロトコルに関するこれらの詳細をレビューに組み込み、IT プロフェッショナルとストレージ取得の責任者が次の結果を達成した条件を理解できるようにします。私たちのレビューは、私たちがテストしている機器のメーカーによって費用が支払われたり、監督されたりすることはありません。に関する追加の詳細 StorageReview エンタープライズ テスト ラボ と そのネットワーク機能の概要 それぞれのページで入手できます。

このレビューの比較対象:

アプリケーションのワークロード分析

エンタープライズストレージデバイスのパフォーマンス特性を理解するには、実際の運用環境で見られるインフラストラクチャとアプリケーションのワークロードをモデル化することが不可欠です。したがって、Memblaze PBlaze5 916 のベンチマークは次のとおりです。 SysBench による MySQL OLTP のパフォーマンス と Microsoft SQL Server OLTP のパフォーマンス シミュレートされた TCP-C ワークロードを使用します。アプリケーションのワークロードでは、各ドライブで 2 ~ 4 個の同一に構成された VM が実行されます。

SideFX の Houdini

Houdini テストは、CGI レンダリングに関連するストレージ パフォーマンスを評価するために特別に設計されています。このアプリケーションのテストベッドは、デュアル Intel 740 CPU と 6130GB DRAM を搭載し、ラボで使用しているコア Dell PowerEdge R64xd サーバー タイプのバリエーションです。この場合、ベアメタルを実行する Ubuntu デスクトップ (ubuntu-16.04.3-desktop-amd64) をインストールしました。ベンチマークの出力は完了までの秒数で測定され、少ないほど優れています。

Maelstrom デモは、拡張メモリの形式としてスワップ ファイルを効果的に使用する機能をデモンストレーションすることで、ストレージのパフォーマンス機能を強調するレンダリング パイプラインのセクションを表します。このテストでは、基礎となるストレージ コンポーネントに対する待ち時間の影響を分離するために、結果データの書き出しやポイントの処理は行いません。テスト自体は 5 つのフェーズで構成されており、そのうちの 3 つはベンチマークの一部として実行されます。次のとおりです。

  • パックされたポイントをディスクからロードします。これがディスクからの読み取りの時間です。これはシングルスレッドであるため、全体のスループットが制限される可能性があります。
  • ポイントを処理できるようにするために、ポイントを単一のフラット配列に解凍します。ポイントが他のポイントに依存していない場合、ワーキング セットはコア内に留まるように調整できます。このステップはマルチスレッドです。
  • (実行しない)ポイントを処理します。
  • ディスクに戻すのに適したバケット化されたブロックにそれらを再パックします。このステップはマルチスレッドです。
  • (実行しない)バケット化されたブロックをディスクに書き込みます。

ここでは、Memblaze PBlaze5 C926 が 2,883 秒のレンダリングで「中」のパフォーマーの下 44 分の 916 に入り、XNUMX よりも約 XNUMX 秒短いことがわかります。

メンブレイズ PBlaze5 920 フーディーニ

SQLサーバーのパフォーマンス

各 SQL Server VM は 100 つの vDisk で構成されています。ブート用の 500 GB ボリュームと、データベースとログ ファイル用の 16 GB のボリュームです。システム リソースの観点から、各 VM に 64 個の vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。以前にテストした Sysbench ワークロードはストレージ I/O と容量の両方でプラットフォームを飽和させましたが、SQL テストではレイテンシーのパフォーマンスを調べています。

このテストは、Windows Server 2014 R2012 ゲスト VM 上で実行される SQL Server 2 を使用し、Quest のデータベース用ベンチマーク ファクトリによって負荷がかけられます。 StorageReview の Microsoft SQL Server OLTP テスト プロトコル は、複雑なアプリケーション環境で見られるアクティビティをシミュレートするオンライン トランザクション処理ベンチマークである、トランザクション処理パフォーマンス評議会のベンチマーク C (TPC-C) の最新草案を採用しています。 TPC-C ベンチマークは、データベース環境におけるストレージ インフラストラクチャのパフォーマンスの強みとボトルネックを測定するのに、合成パフォーマンス ベンチマークよりも近くなります。このレビューの SQL Server VM の各インスタンスは、333GB (1,500 スケール) SQL Server データベースを使用し、15,000 人の仮想ユーザーの負荷の下でトランザクション パフォーマンスと待機時間を測定しました。

SQL Server テスト構成 (VM ごと)

  • Windows Serverの2012 R2
  • ストレージ フットプリント: 600GB 割り当て、500GB 使用
  • SQL Serverの2014
    • データベースのサイズ: 1,500 スケール
    • 仮想クライアント負荷: 15,000
    • RAMバッファ: 48GB
  • テスト時間: 3 時間
    • 2.5時間のプレコンディショニング
    • 30 分のサンプル期間

SQL Server トランザクション ベンチマークでは、Memblaze PBlaze5 C926 の合計スコアは 12,644.2 TPS で、個々の VM の範囲は 3,161 ~ 3,161.09 TPS でした。これは、合計 916 TPS だった 12,645 をわずかに下回ります。

メンブレイズ PBlaze5 926 SQL

平均レイテンシーでは、C926 は全体的に 2ms でした。こちらも 916 の 1.25 ミリ秒をわずかに下回ります。

システムベンチのパフォーマンス

次のアプリケーション ベンチマークは次のもので構成されます。 Percona MySQL OLTP データベース SysBench 経由で測定。このテストでは、平均 TPS (99 秒あたりのトランザクション数)、平均レイテンシ、平均 XNUMX パーセンタイル レイテンシも測定します。

各 システムベンチ VM は 92 つの vDisk で構成されています。447 つはブート用(約 270 GB)、もう 16 つは事前構築済みデータベース用(約 60 GB)、XNUMX 番目はテスト対象データベース用(XNUMX GB)です。システム リソースの観点から、各 VM に XNUMX 個の vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。

Sysbench テスト構成 (VM ごと)

  • CentOS 6.3 64 ビット
  • Percona XtraDB 5.5.30-rel30.1
    • データベーステーブル: 100
    • データベースのサイズ: 10,000,000
    • データベーススレッド: 32
    • RAMバッファ: 24GB
  • テスト時間: 3 時間
    • 2 スレッドのプリコンディショニングに 32 時間
    • 1時間 32スレッド

Sysbench トランザクション ベンチマークでは、Memblaze PBlaze5 C926 の合計スコアは 8,751.6 TPS で、以前の 916 の合計スコアは 9,298 TPS でした。

Memblaze PBlaze5 926 Sysbench

Sysbench の平均遅延では、C926 の総遅延は 14.6 ミリ秒で、916 の総遅延は 13.8 ミリ秒でした。

最悪のシナリオの遅延 (99 パーセンタイル) では、926 の遅延 26.4 ミリ秒と比較して、C916 の遅延は 25.2 ミリ秒でした。

VDBench ワークロード分析

ストレージ デバイスのベンチマークに関しては、アプリケーション テストが最適であり、総合テストは 25 番目になります。実際のワークロードを完全に表現しているわけではありませんが、合成テストは、競合ソリューション間での完全な比較を容易にする再現性係数を備えたストレージ デバイスのベースラインを確立するのに役立ちます。これらのワークロードは、「100 コーナー」テスト、一般的なデータベース転送サイズ テスト、さまざまな VDI 環境からのトレース キャプチャに至るまで、さまざまなテスト プロファイルを提供します。これらのテストはすべて、スクリプト エンジンを備えた共通の vdBench ワークロード ジェネレーターを利用して、大規模なコンピューティング テスト クラスターの結果を自動化して取得します。これにより、フラッシュ アレイや個々のストレージ デバイスを含む幅広いストレージ デバイスにわたって同じワークロードを繰り返すことができます。これらのベンチマークのテスト プロセスでは、ドライブの表面全体にデータを埋めてから、ドライブ容量の XNUMX% に相当するドライブ セクションを分割して、ドライブがアプリケーションのワークロードにどのように応答するかをシミュレートします。これは、ドライブを XNUMX% 使用して定常状態にするフル エントロピー テストとは異なります。結果として、これらの数値は、より高い持続的な書き込み速度を反映することになります。

プロフィール:

  • 4K ランダム読み取り: 100% 読み取り、128 スレッド、0 ~ 120% iorate
  • 4K ランダム書き込み: 100% 書き込み、64 スレッド、0 ~ 120% iorate
  • 64K シーケンシャル読み取り: 100% 読み取り、16 スレッド、0 ~ 120% の iorate
  • 64K シーケンシャル書き込み: 100% 書き込み、8 スレッド、0 ~ 120% iorate
  • 合成データベース: SQL および Oracle
  • VDI フル クローンおよびリンク クローン トレース

最初の VDBench ワークロード分析であるランダム 4K 読み取りでは、Memblaze PBlaze5 C926 AIC は全体を通して 916 にかなり近い速度で動作しましたが、レイテンシ 789,134μs で 159.8 IOPS のピーク スコアでわずかに遅れて終了しました。

メンブレイズ PBlaze5 926 4k 読み取り

再び 4K ランダム書き込みの場合、C926 は 916 に少し追従し、558,945μs のレイテンシーで 226.3 IOPS に達し、ピークに達しました。

シーケンシャル ワークロードに切り替えると、C926 が低いレイテンシで実行され、916K 読み取りのピークが 64 よりも高くなることがわかります。 C926 のピーク スコアは、遅延 61,356 μs で 3.83 IOPS または 260GB/s でした。

メンブレイズ PBlaze5 926 64k 読み取り

64K シーケンシャル書き込みの場合、C926 は大部分で 916 と同様に追跡しましたが、その後、さらに高いピーク (レイテンシー約 43μs で約 2.7K IOPS または 200GB/s) に達し、その後一部が低下して他のドライブを下回りました。

次のテスト セットは、SQL ワークロード、SQL、SQL 90-10、および SQL 80-20 です。 SQL から始めて、Memblaze PBlaze5 C926 は少し高いレイテンシで開始し、レイテンシ 238,861μs で 133.5 IOPS の XNUMX 番目のピークまでずっとその状態を維持しました。

SQL 90-10 も同様の状況を描き、C926 は再び 916 に次ぎ、ピーク パフォーマンス 249,682 IOPS、レイテンシ 127.6μs で若干低下しました。

SQL 80-20 では、ドライブは傾向を継続し、C926 が 250,990 IOPS、レイテンシ 126.7µs で XNUMX 番目にピークに達しました。

次に、Oracle ワークロード、Oracle、Oracle 90-10、Oracle 80-20 です。 Oracle から始まり、Memblaze PBlaze5 C926 が 268,147 IOPS、レイテンシー 132.2µs で XNUMX 番目にピークに達しました。

Oracle 90-10 は上記のことをさらに示し、C926 は 916 のすぐ後ろで動作し、190,557 IOPS 114.9µs でピークに達しました。

Oracle 80-20 では、C926 は 916μs のレイテンシで 197,016 IOPS で 111 に次ぐピークに達しました。

次に、VDI クローン テスト (完全およびリンク) に切り替えました。 VDI フル クローン(FC)ブートの場合、Memblaze PBlaze5 C926 は 209,687 μs のレイテンシで 165.2 IOPS のピークを達成しましたが、916 には及ばませんでした。

VDI FC の初期ログインでは、C926 が 916 を追い抜き、157,217μs のレイテンシーで 188.2 IOPS のピークでトップに終わりました。

VDI FC Monday Login では、C926 と 916 は終始接戦を繰り広げ、リードを譲ったり奪回したりしましたが、C926 が 103,780 μs のレイテンシで 152.8 IOPS のピーク フィニッシュを達成して先を行きました。

VDI リンク クローン (LC) ブートでは、C926 は 96,226 IOPS のピーク スコア、165.7 μs の遅延でおなじみの XNUMX 位に後退しました。

VDI LC の初期ログインでは、上記の FC テストと同じ結果が示され、C926 が 55,977 μs の遅延で 141 IOPS のピーク スコアを記録し、トップの座を獲得しました。

最後に VDI LC Monday Login を使用すると、C926 は再び 80,393 IOPS、遅延 196.6μs でかろうじてトップになりました。

まとめ

Memblaze は、5 シリーズの導入により PBlaze920 ラインを拡張しました。新しいドライブラインの主な違いは、NAND が 64 層から 96 層に移行していることです。新しいシリーズは、DWPD によって 1 または 3 の 5 つのタイプに分類されます。フォーム ファクターと容量によってさらに細分化されます。この特定のレビューでは、より高いパフォーマンスとより高い耐久性のストレージを必要とするものを対象とした Memblaze PBlaze926 CXNUMX HHHL AIC フォーム ファクターに注目しました。

パフォーマンスについては、ドライブを別の Membalze AIC SSD、Memblaze PBlaze5 916 AIC と比較しました。通常、新しいドライブの方がパフォーマンスが向上すると期待されますが、特に Memblaze のような企業の場合はそうです。しかし、先代の 916 はほぼすべてのカテゴリーで C926 を上回りました。それほどではありませんが、前進しました。アプリケーション ワークロード分析の場合、C926 は SQL Server で平均待機時間 2,644.2ms で 2 TPS に達しました。どちらの場合も 916 をわずかに下回ります。 Sysbench の場合、ドライブは 8,751.6 TPS、平均遅延 14.6 ミリ秒、最悪のシナリオの遅延 26.4 ミリ秒に達し、やはり各テストで 916 をわずかに下回りました。

VDbench テストでは、多かれ少なかれ上記と同様の結果が得られました。すべてではありませんが、ほとんどのケースで、新しい C926 は 916 にわずかに遅れをとりました。ハイライトには、789K 読み取りで 4K IOPS、559K 書き込みで 4K IOPS、3.83K 読み取りで 64GB/秒、2.7K 書き込みで 64GB/秒が含まれます。古いドライブを打ち破ります。 SQL ワークロードでは、SQL 239 ~ 250 で 90 IOPS、SQL 10 ~ 251 で 80 IOPS、SQL 20 ~ 916 で 268 IOPS を記録し、いずれも 191 に次いで 90 位でした。 Oracle ワークロードでも同様の近接配置が見られ、Oracle 10-197 では 80K IOPS、Oracle 20-XNUMX では XNUMXK IOPS、Oracle XNUMX-XNUMX では XNUMXK IOPS となりました。 VDI クローン テストでは、完全クローン テストとリンク クローン テストの両方で、初回ログインと月曜ログインで新しいドライブが古いドライブを上回ることができました。

PBlaze 5 シリーズの古いドライブに後れをとっているものの、新しい Memblaze PBlaze5 920 シリーズは依然として良好な数値を示しています。エッジカード モデルは、2.5 インチ NVMe ベイのないレガシー サーバー プラットフォーム、または U.2 PCIe Gen3 SSD では対応できない単一ドライブからの帯域幅の追加が必要なサーバーでうまく機能します。全体として、Memblaze は、主流市場のニーズを満たすように構築された高品質のエンタープライズ SSD を提供し続けています。

メンブレイズの製品ページ

Redditで議論する

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | Facebook | RSSフィード