NVMe SSD が全体的にトップのパフォーマンスを獲得しました。最初は SAS および SATA ドライブを大きく上回る飛躍を遂げましたが、近年では、反復するたびにパフォーマンスが少しずつ向上しています。 PCIe 3.0 には上限があり、現在のドライブは上限に達しています。しかし現在、第 7002 世代 AMD EPYC 4.0 CPU では PCIe 6 が導入されており、KIOXIA はそれを CMXNUMX SSD で活用しています。
NVMe SSD が全体的にトップのパフォーマンスを獲得しました。最初は SAS および SATA ドライブを大きく上回る飛躍を遂げましたが、近年では、反復するたびにパフォーマンスが少しずつ向上しています。 PCIe 3.0 には上限があり、現在のドライブは上限に達しています。しかし今は第二世代になって、 AMD EPYC 7002 CPU、PCIe 4.0 が登場し、キオクシアは CM6 SSD でそれを活用しています。
キオクシアは、物理的なイベントが忘れ去られていた時代に遡り、前回のフラッシュ メモリ サミットでデモとして新しい PCIe 4.0 ドライブ CM6 および CD6 を発表しました。当時、これらは最初の PCIe 4.0 SSD であり、この記事の執筆時点では、CM6 SSD シリーズはまだ、エンタープライズ向けの PCIe 4.0 SSD にすぎないとしても数少ないものの 6.9 つである可能性があります。新しいドライブの大きな特徴はパフォーマンスの向上です。最大 1.4GB/s と XNUMX 万 IOPS の読み取りに達するといわれています。これらは印象的な理論上の数字です。このドライブには、インバンド NVMe-MI、永続的なイベント ログ、および名前空間の粒度も備わっています。
KIOXIA CM6 は U.3 フォームファクタで、SFF-TA-1001 に準拠しており、トライモード対応のバックプレーンで使用できます。 CM6 には、800 GB から 30.72 TB までの幅広い容量があります。ドライブには、ユーザーのニーズに応じて、読み取り集中型 (CM6-R) と混合使用型 (CM6-V) の種類があります。ユースケース固有のモデルに加えて、Sanitize Instat Erase (SIE)、自己暗号化ドライブ (SED)、FIPS 140-2 (レベル 2) モデルなど、さまざまな安全なバージョンがあります。ドライブはデュアルポートで高可用性も提供します。
このレビューでは、容量 6TB の KIOXIA CM6.4-V を検討します。
キオクシア CM6 PCIe 4.0仕様
モデル | CM6-R (読み取り集中) | CM6-V(混合使用) |
フォームファクター | 2.5 インチ 15 mm Z 高さ | |
容量1 | 960GB、1.92TB、3.84TB、7.68TB、15.36TB、30.72TB | 800GB、1.6TB、3.2TB、6.4TB、12.8TB |
インタフェース | PCIe Gen3 / 4、1×4および2×2 | |
コンプライアンス | PCIe 4.0およびNVMe 1.4 | |
NANDタイプ | キオクシア BiCS FLASH96層3D TLC | |
シーケンシャルリード | Gen3 = 最大 3,500MB/秒 Gen4 = 最大 6,900MB/秒 |
Gen3 = 最大 3,500MB/秒 Gen4 = 最大 6,900MB/秒 |
シーケンシャルライト | Gen3 = 最大 3,100MB/秒 Gen4 = 最大 4,200MB/秒 |
Gen3 = 最大 3,100MB/秒 Gen4 = 最大 4,200MB/秒 |
ランダムリード | Gen3 = 最大 800K IOPS Gen4 = 最大 1.4 万 IOPS |
Gen3 = 最大 800K IOPS Gen4 = 最大 1.4 万 IOPS |
ランダム書き込み | Gen3 = 最大 155K IOPS Gen4 = 最大 170K IOPS |
Gen3 = 最大 290K IOPS Gen4 = 最大 350K IOPS |
消費電力 | アクティブ: 20W。アイドル時: <5W | |
耐久性 | 1 DWPD (5 年間) | 3 DWPD (5 年間) |
修正不可能な BER | 1^10 ビットの読み取りごとに 17 セクタ | |
MTTF / AFR | 2.5万時間 / 0.35% | |
使用温度 | 0から70C |
性能
テストベッド
新しい PCIe Gen4 Enterprise SSD のレビューでは、 レノボ シンクシステム SR635 アプリケーションテストと合成ベンチマーク用。 ThinkSystem SR635 は、十分に装備されたシングル CPU AMD プラットフォームであり、高性能ローカル ストレージに必要な能力を十分に上回る CPU パワーを提供します。これは、私たちの研究室で PCIe Gen4 U.2 ベイを備えた唯一のプラットフォーム (そして現在市場にある数少ないプラットフォームの XNUMX つ) でもあります。合成テストは多くの CPU リソースを必要としませんが、同じ Lenovo プラットフォームを利用します。どちらの場合も、ストレージ ベンダーの最大ドライブ仕様に合わせてローカル ストレージを可能な限り最良の状態で紹介することが目的です。
PCIe Gen4 合成およびアプリケーション プラットフォーム (Lenovo ThinkSystem SR635)
- 1 x AMD 7452 (2.35GHz x 32 コア)
- 8 x 64GB DDR4-3200MHz ECC DRAM
- CentOS 7.7 1908
- ESXi 6.7u3
PCIe Gen3 アプリケーション プラットフォーム (レノボ シンクシステム SR850)
- 4 x Intel Platinum 8160 CPU (2.1GHz x 24 コア)
- 16 x 32GB DDR4-2666Mhz ECC DRAM
- 2 x RAID 930-8i 12Gb/秒 RAID カード
- 8 つの NVMe ベイ
- VMware ESXI 6.7u3
PCIe Gen3 合成プラットフォーム (デル PowerEdge R740xd)
- 2 x Intel Gold 6130 CPU (2.1GHz x 16 コア)
- 4 x 16GB DDR4-2666MHz ECC DRAM
- 1x PERC 730 2GB 12Gb/秒 RAID カード
- アドインNVMeアダプター
- Ubuntu-16.04.3-デスクトップ-amd64
新しいプラットフォームでの最初のレビューとして、過去のドライブの結果も含めました。古いプラットフォームでテストしていたので、近いものではありますが、100% 一致した比較ではありません。合成テストの違いにより、結果に大きな偏りはありませんが、シングル CPU AMD プラットフォームとクアッド CPU Intel プラットフォームで動作するアプリケーションのワークロードには、ある程度の偏りがある可能性があります。 MySQL テストでは、新しい Gen4 KIOXIA 製品の 4 つがリードしましたが、SQL サーバーの遅延は平均的でした。公開できた GenXNUMX ドライブは XNUMX つだけなので、比較できるデータはそれほど多くありませんが、これらの結果を表示する際に注目してください。また、より高速な SSD を活用するために合成テストを強化し、より高いピーク スレッド数でのテスト結果を表示するようになりました。
テストの背景と比較対象
この StorageReview エンタープライズ テスト ラボ は、管理者が実際の展開で遭遇するものと同等の環境でエンタープライズ ストレージ デバイスのベンチマークを実施するための柔軟なアーキテクチャを提供します。エンタープライズ テスト ラボには、さまざまなサーバー、ネットワーキング、電源調整、その他のネットワーク インフラストラクチャが組み込まれており、スタッフが実際の条件を確立してレビュー中にパフォーマンスを正確に測定できるようになります。
ラボ環境とプロトコルに関するこれらの詳細をレビューに組み込み、IT プロフェッショナルとストレージ取得の責任者が次の結果を達成した条件を理解できるようにします。私たちのレビューは、私たちがテストしている機器のメーカーによって費用が支払われたり、監督されたりすることはありません。に関する追加の詳細 StorageReview エンタープライズ テスト ラボ およびそのネットワーキング機能の概要については、それぞれのページでご覧いただけます。
アプリケーションのワークロード分析
エンタープライズストレージデバイスのパフォーマンス特性を理解するには、実際の運用環境で見られるインフラストラクチャとアプリケーションのワークロードをモデル化することが不可欠です。したがって、KIOXIA CM6 のベンチマークは次のとおりです。 SysBench による MySQL OLTP のパフォーマンス と Microsoft SQL Server OLTP のパフォーマンス シミュレートされた TCP-C ワークロードを使用します。アプリケーションのワークロードでは、各ドライブで 4 つの同一に構成された VM が実行されます。
SQLサーバーのパフォーマンス
各 SQL Server VM は、ブート用の 100 GB ボリュームとデータベースおよびログ ファイル用の 500 GB ボリュームの 8 つの vDisk で構成されています。システム リソースの観点から、各 VM に 64 つの vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。以前にテストした Sysbench ワークロードはストレージ I/O と容量の両方でプラットフォームを飽和させましたが、SQL テストではレイテンシーのパフォーマンスを調べています。
このテストは、Windows Server 2014 R2012 ゲスト VM 上で実行される SQL Server 2 を使用し、Quest のデータベース用ベンチマーク ファクトリによって負荷がかけられます。 StorageReview の Microsoft SQL Server OLTP テスト プロトコル は、複雑なアプリケーション環境で見られるアクティビティをシミュレートするオンライン トランザクション処理ベンチマークである、トランザクション処理パフォーマンス評議会のベンチマーク C (TPC-C) の最新草案を採用しています。 TPC-C ベンチマークは、データベース環境におけるストレージ インフラストラクチャのパフォーマンスの強みとボトルネックを測定するのに、合成パフォーマンス ベンチマークよりも近くなります。このレビューの SQL Server VM の各インスタンスは、333GB (1,500 スケール) SQL Server データベースを使用し、15,000 人の仮想ユーザーの負荷の下でトランザクション パフォーマンスと待機時間を測定しました。
SQL Server テスト構成 (VM ごと)
- Windows Serverの2012 R2
- ストレージ フットプリント: 600GB 割り当て、500GB 使用
- SQL Serverの2014
-
- データベースのサイズ: 1,500 スケール
- 仮想クライアント負荷: 15,000
- RAMバッファ: 48GB
- テスト時間: 3 時間
-
- 2.5時間のプレコンディショニング
- 30 分のサンプル期間
SQL Server トランザクション ベンチマークでは、KIOXIA CM6 が 12,633.6 TPS で全体で 10.6 位になりましたが、トップ パフォーマンスとの差はわずか XNUMX TPS でした。
SQL Server の平均遅延では、CM6 の平均遅延は 5.5 ミリ秒で、これは同類の CD6 SSD と同じでした。
システムベンチのパフォーマンス
次のアプリケーション ベンチマークは次のもので構成されます。 Percona MySQL OLTP データベース SysBench 経由で測定。このテストでは、平均 TPS (99 秒あたりのトランザクション数)、平均レイテンシ、平均 XNUMX パーセンタイル レイテンシも測定します。
各 システムベンチ VM は 92 つの vDisk で構成されています。447 つはブート用 (~270 GB)、8 つは事前構築済みデータベース用 (~60 GB)、XNUMX 番目はテスト対象データベース用 (XNUMX GB) です。システム リソースの観点から、各 VM に XNUMX つの vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。
Sysbench テスト構成 (VM ごと)
- CentOS 6.3 64 ビット
- Percona XtraDB 5.5.30-rel30.1
-
- データベーステーブル: 100
- データベースのサイズ: 10,000,000
- データベーススレッド: 32
- RAMバッファ: 24GB
- テスト時間: 3 時間
-
- 2 スレッドのプリコンディショニングに 32 時間
- 1時間 32スレッド
Sysbench のトランザクション ベンチマークを見ると、KIOXIA CM6 は 8,632 TPS で、同様のパック内で XNUMX 位になりました。
Sysbench の平均レイテンシーでは、CM6 が 14.82 ミリ秒で再び XNUMX 位になりました。
最悪のシナリオの遅延 (99 パーセンタイル) では、CM6 は 29.86 ミリ秒で XNUMX 位で快適な水準に留まりました。
VDBench ワークロード分析
ストレージ デバイスのベンチマークに関しては、アプリケーション テストが最適であり、総合テストは 25 番目になります。実際のワークロードを完全に表現しているわけではありませんが、合成テストは、競合ソリューション間での完全な比較を容易にする再現性係数を備えたストレージ デバイスのベースラインを確立するのに役立ちます。これらのワークロードは、「100 コーナー」テスト、一般的なデータベース転送サイズ テスト、さまざまな VDI 環境からのトレース キャプチャに至るまで、さまざまなテスト プロファイルを提供します。これらのテストはすべて、スクリプト エンジンを備えた共通の vdBench ワークロード ジェネレーターを利用して、大規模なコンピューティング テスト クラスターの結果を自動化して取得します。これにより、フラッシュ アレイや個々のストレージ デバイスを含む幅広いストレージ デバイスにわたって同じワークロードを繰り返すことができます。これらのベンチマークのテスト プロセスでは、ドライブの表面全体にデータを埋めてから、ドライブ容量の XNUMX% に相当するドライブ セクションを分割して、ドライブがアプリケーションのワークロードにどのように応答するかをシミュレートします。これは、ドライブを XNUMX% 使用して定常状態にするフル エントロピー テストとは異なります。結果として、これらの数値は、より高い持続的な書き込み速度を反映することになります。
プロフィール:
- 4K ランダム読み取り: 100% 読み取り、128 スレッド、0 ~ 120% iorate
- 4K ランダム書き込み: 100% 書き込み、128 スレッド、0 ~ 120% iorate
- 4K ランダム読み取り (高負荷): 100% 読み取り、512 スレッド、0 ~ 120% の iorate
- 4K ランダム書き込み (高負荷): 100% 書き込み、512 スレッド、0 ~ 120% iorate
- 64K シーケンシャル読み取り: 100% 読み取り、32 スレッド、0 ~ 120% の iorate
- 64K シーケンシャル書き込み: 100% 書き込み、16 スレッド、0 ~ 120% iorate
- 64K シーケンシャル読み取り (高負荷): 100% 読み取り、64 スレッド、0 ~ 120% の iorate
- 64K シーケンシャル書き込み (高負荷): 100% 書き込み、64 スレッド、0 ~ 120% の iorate
- 合成データベース: SQL および Oracle
- VDI フル クローンおよびリンク クローン トレース
比較対象:
最初の VDBench ワークロード分析であるランダム 4K 読み取りでは、KIOXIA CM6 は 846,288μs のレイテンシでピークに達する 150 IOPS という素晴らしいパフォーマンスを示しました。これにより、ドライブがトップの位置に配置されます。
新しい PCIe 4.0 ドライブはより高い負荷に耐えることができ、その機能を確認するにはもう少し力を入れないと怠慢になるでしょう。したがって、ランダム 4K 読み取りの高負荷では、CM6 は 1,507,564μs のレイテンシーで 337.9 IOPS のピークに達することができました。 CD6 の同等品よりもはるかに優れています。
ランダム 4K 書き込みでは、全体で 100 位になりました。約 490K IOPS までは 548,169μs 未満の遅延で実行され、226.4μs の遅延で XNUMX IOPS に達しました。
ランダム 4K 書き込み高負荷では、CM6 は 549,103μs のレイテンシーで 922 IOPS のピークに達し、今回は CD6 に続きました。
シーケンシャル ワークロードに切り替えると、CM6 は再び輝くチャンスを得て、わずか 64 μs のレイテンシで 97,779 IOPS または 6.11GB/s のピーク スコアで 325K 読み取りでトップの座を獲得しました。
高負荷の 64K シーケンシャル読み取りは、CM4 が 6μs のレイテンシーで 101,018 IOPS または 6.3GB/s でピークに達した 629K 読み取りの配置と同様でした。
64K 書き込みでは、CM6 が強力なピーク スコアを示しましたが、ピーク後にパフォーマンスが低下し、49 位になりました。ピーク パフォーマンスは、約 3.1μs の遅延で約 50K IOPS または XNUMXGB/s でした。
高負荷 64K シーケンシャル書き込みでは、CM6 のピークは高くなりましたが、その後パフォーマンスが低下しました。 CM6 のピークは約 49 IOP、つまり 3.1 GB/秒で、遅延がほとんど見えないほど低遅延でした。
次のテスト セットは、SQL ワークロード、SQL、SQL 90-10、および SQL 80-20 です。 SQL から始めて、KIOXIA CM6 は 266,458μs のレイテンシーで 119 IOPS のピークを達成し、全体で XNUMX 位になりました。
SQL 90-10 では、CM6 が 265,276μs のレイテンシで 119.2 IOPS のピーク パフォーマンスを示し、再び XNUMX 位になりました。
SQL 80-20 では、CM6 が 263,819 IOPS 119.4µs のピーク パフォーマンスで XNUMX 位となり、その実力を示すチャンスが与えられました。
次に、Oracle ワークロード、Oracle、Oracle 90-10、Oracle 80-20 です。 Oracle から始まり、CM6 が 271,230μs のレイテンシで 128.6 IOPS のピーク パフォーマンスを示し、再び XNUMX 位になりました。
Oracle 90-10 では、わずか 6μs の遅延で 202,341 IOPS のピーク パフォーマンスを示し、CM107.4 が XNUMX 位になりました。
CM6 は競合他社を追い抜き、80μs の低遅延でピーク 20 IOPS を達成し、Oracle 206,733-104.7 で再び XNUMX 位になりました。
次に、VDI クローン テスト (完全およびリンク) に切り替えました。 VDI フル クローン (FC) ブートでは、CM6 が 223,668 IOPS、レイテンシ 153.5µs でトップの座を獲得しました。
VDI FC の初期ログインでは、CM6 が 154,836µs のレイテンシで 189 IOPS のピーク パフォーマンスを示し、XNUMX 位に後退しました。
VDI FC Monday Login ベンチマークでは、CM6 が 98,867 IOPS、レイテンシ 158.4μs で XNUMX 位を維持しました。
VDI リンク クローン (LC) ブートでは、KIOXIA CM6 が 115,058μs のレイテンシーで 137.7 IOPS のピーク スコアを記録し、トップの座に戻りました。
VDI LC の初期ログインはグラフでは少し読みにくいですが、CM6 は 38,848μs のレイテンシで 202.4 IOPS のピークを示し、パックの中央に位置し、その後いくつかの値が下がりました。
最後に、VDI LC Monday Login では、CM6 が再び最高のパフォーマンスを示し、ピーク スコアは 96,008 IOPS、遅延は 162.5 μs でした。
まとめ
KIOXIA CM6 は、エンタープライズ向けの最初の PCIe 4.0 SSD ではないにしても、その 6.9 つでした。新しいドライブには、より高いパフォーマンスが約束されており、この場合は最大 1.4GB/秒、最大 6 万 IOPS になります。 CM800 はデュアルポートであり、ドライブに高可用性レベルを追加します。このドライブには、30.72 GB から最大 9 TB までの幅広い容量があり、その間に 6 つの容量オプションがあります。 CM1 には、それぞれ 3 と XNUMX の DWPD を備えた読み取り集中モデルと混合使用モデルの両方があります。また、SSD にはさまざまなセキュア モデル オプションが付属しています。
パフォーマンスのために、いくつかの例外を除いて、アプリケーション ワークロード分析と VDBench の通常の集中攻撃を実行しました。テスト プラットフォームは Intel であり、KIOXIA ドライブは Gen3 ポートによってハンディキャップを受けるため、Houdini テストをスキップする必要がありました。 VDBench では、新しいドライブが処理できるように設計されているため、負荷をもう少し高めるために、より高負荷のテストを追加しました。
アプリケーション ワークロード分析では、SQL Server と Sysbench を実行しました。 SQL Server を使用した場合、CM6 は TPS と平均遅延の両方で 12,633.6 TPS と 5.5 ミリ秒で 8,632 位となり、依然として非常に優れたスコアを記録しました。 Sysbench を使用すると、ドライブは 14.82 TPS、平均遅延 29.86 ミリ秒、最悪のシナリオの遅延 XNUMX ミリ秒で全体で XNUMX 位に再び留まりました。
VDBench では、ドライブが本当に輝きました。 CM6 は、いくつかのベンチマークで最高のパフォーマンスを示しました。基本的なハイライトには、846K 読み取りで 4K IOPS、1.5K 読み取り高負荷で 4 万 IOPS、548K 書き込みで 4K IOPS、549K 書き込み高負荷で 4K IOPS、6.1K 読み取りで 64GB/s、6.3K 読み取り高負荷で 64GB/s、 3.1K 書き込みと 64K 書き込み高負荷の両方で 64GB/秒。 SQL では、ピークが 266 IOPS、SQL 265 ~ 90 では 10 IOPS、SQL 264 ~ 80 では 20 IOPS に達しました。 Oracle は、Oracle 271-202 で 90 IOPS、Oracle 10-207 で 80 IOPS、Oracle 20-224 で 155 IOPS のピークを示しました。 VDI FC では、ブート時に 99K IOPS、初回ログインで 115K IOPS、月曜日のログインで 39K IOPS が得られました。 VDI LC では、起動時に 96 IOPS、初回ログインで XNUMX IOPS、月曜日のログインで XNUMX IOPS が発生しました。
このレビューと CD6 のレビューでは、PCIe 4.0 と、さらに市場に参入するストレージ デバイスの将来について具体的に考察します。 PCIe 4.0 の全面的なサポートを提供しているサーバー ベンダーは多くありません。この記事の執筆時点で、私たちの研究室にあるのは Lenovo だけです。 Lenovo は、KIOXIA CM2 のようなストレージ製品を先取りして、第 7002 世代 AMD EPYC 6 プロセッサーが提供するすべての利点をすぐに活用しました。しかし、KIOXIA にとっては、他社に先んじるという興味深い立場に立つことができますが、そのドライブの可能性を最大限に発揮できるのは、より新しい AMD ベースのサーバーのみです (Intel もこのゲームに参入することを決定するまで)。今のところ、CM6 は従来の機器でも引き続き動作し、企業のアップグレードに応じてさらなるパフォーマンスを発揮できるようになります。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | Facebook | RSSフィード