北京で開催された Step Ahead イベント中に、Memblaze は 500 NVME ドライブの新しいシリーズと、900 シリーズの 910 および 916 への拡張を発表しました。このレビューでは 910 シリーズについて検討します。新しい 910 ドライブは 64 つのフォーム ファクタで提供され、3 層 16D NAND を活用することで、最大 XNUMX TB のドライブ容量を実現できます。この高密度化により、データセンター内のラックの高密度化やラックの統合が行われる可能性があります。
北京で開催された Step Ahead イベント中に、Memblaze は 500 NVME ドライブの新しいシリーズと、900 シリーズの 910 および 916 への拡張を発表しました。このレビューでは 910 シリーズについて検討します。新しい 910 ドライブは 64 つのフォーム ファクタで提供され、3 層 16D NAND を活用することで、最大 XNUMX TB のドライブ容量を実現できます。この高密度化により、データセンター内のラックの高密度化やラックの統合が行われる可能性があります。
Memblaze PBlaze64 5 は、910 レイヤーを活用して大容量を達成することに加えて、以前のモデルよりも高いパフォーマンスを主張します。同社によれば、このドライブは最大 3.5GB/s のシーケンシャル読み取りと最大 835K IOPS のスループットを実現し、同時にミリ秒未満の遅延を実現すると述べています。このドライブには高可用性も組み込まれており、デュアル ポートなので、単一の障害パスが排除されます。 910 は 1 DWPD の耐久性と XNUMX 万時間の MTBF を備えています。理想的なユースケースには、データベース、検索、インデックス作成、CDN、クラウドおよびハイパースケール、SDS、ディープラーニングおよびビッグデータ分析、ERP、SAP HANA、BOSS、銀行業務、課税、高頻度取引、オンライン決済が含まれます。
このレビューでは、PBlaze3.84 2 の 5TB、U.910 を検討します。
Memblaze PBlaze5 910 NVMe SSD 仕様
フォームファクター | U.2 | ||
容量 | 3.84TB | 7.68TB | 15.36TB |
NAND | 3D eTLC | ||
インタフェース | PCIe 3.0×4 | ||
プロトコル | NVMe 1.2a | ||
性能 | |||
シーケンシャルリード (128KB) | 3.5GB /秒 | 3.5GB /秒 | 3.3GB /秒 |
シーケンシャルライト(128KB) | 3.1GB /秒 | 3.5GB /秒 | 3.3GB /秒 |
持続ランダム読み取り (4KB) | 835K IOPS | 830K IOPS | 826K IOPS |
持続ランダム書き込み (4KB) | 99K IOPS | 135K IOPS | 150K IOPS |
レイテンシー読み取り/書き込み | 87 /12μs | ||
DWPD | 1 | ||
UBER | <10^-17 | ||
MTBF | 2百万時間 | ||
消費電力 | 7〜25W |
性能
テストベッド
当社の Enterprise SSD レビューでは、アプリケーション テストに Lenovo ThinkSystem SR850 を活用しています。 デル PowerEdge R740xd 合成ベンチマーク用。 ThinkSystem SR850 は、十分に装備されたクアッド CPU プラットフォームであり、高性能ローカル ストレージに必要な能力を十分に上回る CPU パワーを提供します。大量の CPU リソースを必要としない合成テストでは、より従来のデュアルプロセッサ サーバーが使用されます。どちらの場合も、ストレージ ベンダーの最大ドライブ仕様に合わせてローカル ストレージを可能な限り最良の状態で紹介することが目的です。
レノボ シンクシステム SR850
- 4 x Intel Platinum 8160 CPU (2.1GHz x 24 コア)
- 16 x 32GB DDR4-2666Mhz ECC DRAM
- 2 x RAID 930-8i 12Gb/秒 RAID カード
- 8 つの NVMe ベイ
- VMware ESXI 6.5
デル PowerEdge R740xd
- 2 x Intel Gold 6130 CPU (2.1GHz x 16 コア)
- 16 x 16GB DDR4-2666MHz ECC DRAM
- 1x PERC 730 2GB 12Gb/秒 RAID カード
- アドインNVMeアダプター
- Ubuntu-16.04.3-デスクトップ-amd64
テストの背景と比較対象
この StorageReview エンタープライズ テスト ラボ は、管理者が実際の展開で遭遇するものと同等の環境でエンタープライズ ストレージ デバイスのベンチマークを実施するための柔軟なアーキテクチャを提供します。エンタープライズ テスト ラボには、さまざまなサーバー、ネットワーキング、電源調整、その他のネットワーク インフラストラクチャが組み込まれており、スタッフが実際の条件を確立してレビュー中にパフォーマンスを正確に測定できるようになります。
ラボ環境とプロトコルに関するこれらの詳細をレビューに組み込み、IT プロフェッショナルとストレージ取得の責任者が次の結果を達成した条件を理解できるようにします。私たちのレビューは、私たちがテストしている機器のメーカーによって費用が支払われたり、監督されたりすることはありません。に関する追加の詳細 StorageReview エンタープライズ テスト ラボ と そのネットワーク機能の概要 それぞれのページで入手できます。
このレビューの比較対象:
- メンブレイズ PBlaze5 3.2TB
- メンブレイズ PBlaze4 3.2TB
- インテル P3700 2TB
- インテル P4500 2TB
- HGST SN100 3.2TB
- 東芝 PX04 1.6TB
アプリケーションのワークロード分析
エンタープライズストレージデバイスのパフォーマンス特性を理解するには、実際の運用環境で見られるインフラストラクチャとアプリケーションのワークロードをモデル化することが不可欠です。したがって、Memblaze PBlaze5 910 のベンチマークは次のとおりです。 SysBench による MySQL OLTP のパフォーマンス と Microsoft SQL Server OLTP のパフォーマンス シミュレートされた TCP-C ワークロードを使用します。アプリケーションのワークロードでは、各ドライブで 2 ~ 4 個の同一に構成された VM が実行されます。
SQLサーバーのパフォーマンス
各 SQL Server VM は 100 つの vDisk で構成されています。ブート用の 500 GB ボリュームと、データベースとログ ファイル用の 16 GB のボリュームです。システム リソースの観点から、各 VM に 64 個の vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。以前にテストした Sysbench ワークロードはストレージ I/O と容量の両方でプラットフォームを飽和させましたが、SQL テストではレイテンシーのパフォーマンスを調べています。
このテストでは、Windows Server 2014 R2012 ゲスト VM 上で実行されている SQL Server 2 を使用し、Quest の Benchmark Factory for Databases を負荷としています。 StorageReview の Microsoft SQL Server OLTP テスト プロトコル は、複雑なアプリケーション環境で見られるアクティビティをシミュレートするオンライン トランザクション処理ベンチマークである、トランザクション処理パフォーマンス評議会のベンチマーク C (TPC-C) の最新草案を採用しています。 TPC-C ベンチマークは、データベース環境におけるストレージ インフラストラクチャのパフォーマンスの強みとボトルネックを測定するのに、合成パフォーマンス ベンチマークよりも近くなります。このレビューの SQL Server VM の各インスタンスは、333GB (1,500 スケール) SQL Server データベースを使用し、15,000 人の仮想ユーザーの負荷の下でトランザクション パフォーマンスと待機時間を測定しました。
SQL Server テスト構成 (VM ごと)
- Windows Serverの2012 R2
- ストレージ フットプリント: 600GB 割り当て、500GB 使用
- SQL Serverの2014
- データベースのサイズ: 1,500 スケール
- 仮想クライアント負荷: 15,000
- RAMバッファ: 48GB
- テスト時間: 3 時間
- 2.5時間のプレコンディショニング
- 30 分のサンプル期間
SQL Server トランザクション ベンチマークでは、Memblaze PBlaze5 910 U.2 が 12,546.5 TPS で最下位となり、他の XNUMX つの PBlaze ドライブよりも低くなりました。
驚くべきことに、910 の遅延も 38.8 ミリ秒で最も高かったです。
システムベンチのパフォーマンス
次のアプリケーション ベンチマークは次のもので構成されます。 Percona MySQL OLTP データベース SysBench 経由で測定。このテストでは、平均 TPS (99 秒あたりのトランザクション数)、平均レイテンシ、平均 XNUMX パーセンタイル レイテンシも測定します。
各 システムベンチ VM は 92 つの vDisk で構成されています。447 つはブート用(約 270 GB)、もう 16 つは事前構築済みデータベース用(約 60 GB)、XNUMX 番目はテスト対象データベース用(XNUMX GB)です。システム リソースの観点から、各 VM に XNUMX 個の vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。
Sysbench テスト構成 (VM ごと)
- CentOS 6.3 64 ビット
- Percona XtraDB 5.5.30-rel30.1
- データベーステーブル: 100
- データベースのサイズ: 10,000,000
- データベーススレッド: 32
- RAMバッファ: 24GB
- テスト時間: 3 時間
- 2 スレッドのプリコンディショニングに 32 時間
- 1時間 32スレッド
Sysbench のトランザクション ベンチマークでは、U.2 910 の方が優れており、テストしたパックのほぼ中央に着地して 6,664.6 TPS を達成しました。
Sysbench の平均遅延では、U.2 910 は 19.2 ミリ秒の遅延で再びパックの真ん中に位置しました。
最悪のシナリオのレイテンシー ベンチマークでは、U.2 910 が 37.8 ミリ秒で再び中央付近に到達しました。
SideFX の Houdini
Houdini テストは、CGI レンダリングに関連するストレージ パフォーマンスを評価するために特別に設計されています。このアプリケーションのテストベッドはコアのバリエーションです デル PowerEdge R740xd 研究室で使用しているサーバー タイプは、デュアル Intel 6130 CPU と 64GB DRAM を搭載しています。この場合、ベアメタルを実行する Ubuntu デスクトップ (ubuntu-16.04.3-desktop-amd64) をインストールしました。ベンチマークの出力は完了までの秒数で測定され、少ないほど優れています。
Maelstrom デモは、拡張メモリの形式としてスワップ ファイルを効果的に使用する機能をデモンストレーションすることで、ストレージのパフォーマンス機能を強調するレンダリング パイプラインのセクションを表します。このテストでは、基礎となるストレージ コンポーネントに対する待ち時間の影響を分離するために、結果データの書き出しやポイントの処理は行いません。テスト自体は 5 つのフェーズで構成されており、そのうちの 3 つはベンチマークの一部として実行されます。次のとおりです。
- パックされたポイントをディスクからロードします。これがディスクからの読み取りの時間です。これはシングルスレッドであるため、全体のスループットが制限される可能性があります。
- ポイントを処理できるようにするために、ポイントを単一のフラット配列に解凍します。ポイントが他のポイントに依存していない場合、ワーキング セットはコア内に留まるように調整できます。このステップはマルチスレッドです。
- (実行ではありません) ポイントを処理します。
- ディスクに戻すのに適したバケット化されたブロックにそれらを再パックします。このステップはマルチスレッドです。
- (実行しない)バケット化されたブロックをディスクに書き込みます。
Houdini テストでは、910 U.2 は中位から下位に位置しましたが、3,093.8 秒のスコアで他の Memblaze 製品とほぼ同じでした。
VDBench ワークロード分析
ストレージ デバイスのベンチマークに関しては、アプリケーション テストが最適であり、総合テストは 25 番目になります。実際のワークロードを完全に表現しているわけではありませんが、合成テストは、競合ソリューション間での完全な比較を容易にする再現性係数を備えたストレージ デバイスのベースラインを確立するのに役立ちます。これらのワークロードは、「100 コーナー」テスト、一般的なデータベース転送サイズ テスト、さまざまな VDI 環境からのトレース キャプチャに至るまで、さまざまなテスト プロファイルを提供します。これらのテストはすべて、スクリプト エンジンを備えた共通の vdBench ワークロード ジェネレーターを利用して、大規模なコンピューティング テスト クラスターの結果を自動化して取得します。これにより、フラッシュ アレイや個々のストレージ デバイスを含む幅広いストレージ デバイスにわたって同じワークロードを繰り返すことができます。これらのベンチマークのテスト プロセスでは、ドライブの表面全体にデータを埋めてから、ドライブ容量の XNUMX% に相当するドライブ セクションを分割して、ドライブがアプリケーションのワークロードにどのように応答するかをシミュレートします。これは、ドライブの XNUMX% を使用して定常状態にするフル エントロピー テストとは異なります。結果として、これらの数値は、より高い持続的な書き込み速度を反映することになります。
プロフィール:
- 4K ランダム読み取り: 100% 読み取り、128 スレッド、0 ~ 120% iorate
- 4K ランダム書き込み: 100% 書き込み、64 スレッド、0 ~ 120% iorate
- 64K シーケンシャル読み取り: 100% 読み取り、16 スレッド、0 ~ 120% の iorate
- 64K シーケンシャル書き込み: 100% 書き込み、8 スレッド、0 ~ 120% iorate
- 合成データベース: SQL および Oracle
- VDI フル クローンおよびリンク クローン トレース
最初の VDBench ワークロード分析であるランダム 4K 読み取りでは、Memblaze PBlaze5 910 U.2 は、ピーク時の 1 IOPS、レイテンシー 665,679μs で全体を通して 191.3 ミリ秒未満にとどまることができ、ドライブはほぼ中間に位置しました。
4K ランダム書き込みでは、全体的にミリ秒未満の遅延が発生しました。 910 U.2 は、ピーク パフォーマンス 296,639 IOPS、遅延 429.6μs で最後から XNUMX 番目に位置しました。
シーケンシャル ワークロードに切り替えると、910 U.2 は再び 64K シーケンシャル読み取りで最後から 38,472 番目に位置し、ピーク スコアは 2.4 IOPS、つまり 415.3GB/秒、レイテンシは XNUMX μs でした。
最後から 910 番目の順位を維持した 2 U.18 は、1.1K シーケンシャル書き込みで約 870μs のレイテンシーで約 64K IOPS または XNUMXGB/s でピークに達しました。
SQL ワークロードに移ると、910 U.2 は 243,228 IOPS に達し、遅延はわずか 130.4μs で、ドライブ全体で XNUMX 位になりました。
SQL 90-10 では、910 が 232,061 IOPS のピーク スコアと 136.5 μs のレイテンシで XNUMX 位を維持しました。
依然として 910 位の 2 U.220,195 は、SQL 144.6-80 ベンチマークで 20 μs のレイテンシーで XNUMX IOPS に達しました。
Oracle ワークロードでは、910 U.2 は引き続き 212,052 位を維持し、ピーク スコアは 168.5 IOPS、遅延は XNUMXμs でした。
Oracle 90-10 では、910 U.2 が 180,723 IOPS のピークと 121.1μs の遅延で XNUMX 位になりました。
Oracle 80-20 では、910 が 900 とほぼ同率で 177,143 位となり、ピーク パフォーマンスは 123.5 IOPS、遅延は XNUMXμs でした。
次に、VDI クローン テスト (完全およびリンク) に進みます。 VDI フル クローン ブートでは、910 U.2 が 176,239 IOPS のピーク パフォーマンスと 197.9μs の遅延で XNUMX 位になりました。
VDI FC Initial Login では、910 U.2 が 66,925 位でしたが、トップ 445.1 ドライブにはさらに及ばず、ピーク パフォーマンスは XNUMX IOPS、遅延は XNUMX μs でした。
VDI FC Monday Login を使用すると、910 U.2 は 67,309 IOPS、遅延 235.7μs で XNUMX 位になりました。
リンク クローン (LC) に切り替えて、最初にブート テストを見てみましょう。ここでは、910 U.2 が 83,210 IOPS、遅延 191.2μs で XNUMX 位になりました。
VDI LC 初期ログインでは、910 U.2 が 40,035 IOPS、遅延 197.4μs で XNUMX 位に安定しました。
最後に、VDI LC Monday Login は 910 U.2 のピークで 45,349 IOPS、レイテンシ 349μs を記録し、再び XNUMX 位になりました。
まとめ
Memblaze PBlaze5 910 は、64 層 3D NAND を活用する同社の新しい NVMe データセンター ドライブです。ドライブには 2 つのフォーム ファクター (このレビューでは U.3.84) があり、容量は 7.68 TB、15.36 TB、および 3.5 TB です。 Memblaze は、最大 3.5GB/s の読み取り、835GB/s の書き込みのパフォーマンス、および最大 150K IOPS の読み取りと 256K IOPS の書き込みのスループットを謳っています。このドライブは、さまざまなユースケースの基準を満たしており、AES 8 データ暗号化などのセキュリティ オプションが付属し、最大 XNUMXTB/秒の TRIM 機能をサポートします。
アプリケーション ワークロード分析のパフォーマンスを見ると、910 U.2 は SQL Server ベンチマークで 12,546.5 TPS、平均遅延 38.8 ミリ秒で最下位となりました。 Sysbench では、ドライブは 6,664.6 TPS、平均遅延 19.2 ミリ秒、最悪のシナリオの遅延 37.8 ミリ秒で、パックの中央にわずかに優れた着陸を実行しました。 SideFX による Houdini ベンチマークでは、910 U.2 のスコアは 3,093.8 秒で、この分野では下位ですが、他の Memblaze 製品と同等でした。
VDBench の場合、Memblaze PBlaze5 910 U.2 の遅延はすべてのテストを通じてミリ秒未満でした。このドライブは、すべてのテストにおいてパックの中央から中下位に位置する傾向がありました。主な結果には、666K 読み取りで 4K IOPS、297K 書き込みで 4K IOPS、2.4K 読み取りで 64GB/秒、1.1K 書き込みで 64GB/秒が含まれます。 SQL の結果は約 177 万 IOPS を保持し、Oracle テストは 212 IOPS から XNUMX IOPS の間で実行されました。
全体的には良好なパフォーマンスを発揮しましたが、前世代の PBlaze5 900 と比較するとパフォーマンスが低下し始めました。
StorageReview ニュースレターにサインアップする