NVMe インターフェイス、特に PCIe 3.0 NVMe 1.3 は、これまでほぼあらゆるユースケースに推奨される SSD インターフェイスでした。ベンダーが新しい世代ごとにパフォーマンスを向上させ続けるため、このインターフェイスは何度も使用されてきました。 PCIe は現在 4.0 に入り、シーケンシャルおよびランダムのパフォーマンスが大幅に向上しています。 KIOXIA CD6 は、市場に投入された最新の SSD (エンタープライズ向けの最初の PCIe 4.0 の 24 つ) であり、要求の厳しい 7 時間 6 日の環境での一貫したパフォーマンスに重点を置いています。これにより、混合使用や読み取り集中型の耐久性が必要なデータセンターに最適です。 KIOXIA CD1001 SSD は SFF-TA-800 にも準拠しており、同じバックプレーン上の SAS、SATA、および NVMe ドライブ (およびトライモード コントローラー) との接続が可能です。 KIOXIA 製品ラインは、15.36 GB から XNUMX TB までの容量を備えており、いくつかの異なるセキュリティおよび耐久性のオプションが利用可能です。
NVMe インターフェイス、具体的には PCIe 3.0 NVMe 1.3 は、これまでほぼあらゆるユースケースに推奨される SSD インターフェイスでした。ベンダーが新しい世代ごとにパフォーマンスを向上させ続けるため、このインターフェイスは何度も使用されてきました。 PCIe は現在 4.0 に入り、シーケンシャルおよびランダムのパフォーマンスが大幅に向上しています。 KIOXIA CD6 は、市場に投入された最新の SSD (エンタープライズ向けの最初の PCIe 4.0 の 24 つ) であり、要求の厳しい 7 時間 6 日の環境での一貫したパフォーマンスに重点を置いています。これにより、混合使用や読み取り集中型の耐久性が必要なデータセンターに最適です。 KIOXIA CD1001 SSD は SFF-TA-800 にも準拠しており、同じバックプレーン上の SAS、SATA、および NVMe ドライブ (およびトライモード コントローラー) との接続が可能です。 KIOXIA 製品ラインは、15.36 GB から 6 TB までの容量を備えており、いくつかの異なるセキュリティおよび耐久性のオプションが利用可能です。また、CD2.5 は 15 インチ、96 mm Z ハイトのフォームファクタで提供され、KIOXIA 独自のコントローラ、ファームウェア、BiCS FLASH 3 層 XNUMXD TLC メモリを搭載しています。シングルポート設計を使用しています (つまり、ホストから SSD へのデータ パスが XNUMX つあります)。
更新 4/2/22 – を再レビューしました。 キオクシアCD6 より成熟したファームウェアを搭載
PCIe 4.0 のパフォーマンスは、かなり驚異的な数値に達する可能性があり、KIOXIA CD6 も例外ではありません。 KIOXIA は、新しいドライブラインが読み取りと書き込みでそれぞれ最大 6.2GB/s と 4.0GB/s のシーケンシャルパフォーマンスを実現し、ランダムパフォーマンスでは読み取りで最大 250,000 万 IOPS、書き込みで XNUMX IOPS に達する可能性があると述べています。これらは控えめに言っても印象的な数字です。
また、第 6 世代ドライブの障害回復、二重パリティ保護、電力損失保護 (PLP)、信頼性を高めるためのエンドツーエンドのデータ修正など、幅広い信頼性機能が組み込まれています。 KIOXIA CD6 は NVMe 1.4 に準拠しており、ドライブにいくつかの重要な機能をもたらします。これには、永続的なイベント ログ、サニタイジングの改善、名前空間の粒度、名前空間の書き込み保護が含まれます。
キオクシア CD6の仕様
製品仕様 | CM6-R (読み取り集中) | CM6-V(混合使用) |
フォームファクター |
2.5 インチ 15 mm Z 高さ |
|
容量【1]【2] | 960GB、1.92TB、3.84TB、 7.68TB、15.36TB | 800GB、1.6TB、3.2TB、6.4TB、12.8TB |
インタフェース | PCIe Gen3/4、1×4 | |
コンプライアンス | PCIe 4.0およびNVMe 1.4 | |
NANDタイプ | キオクシア BiCS FLASH 96層3D TLC | |
シーケンシャルリード | Gen3 = 最大 3,500MB/秒。 Gen4 = 最大 6,200MB/秒 | Gen3 = 最大 3,500MB/秒。 Gen4 = 最大 6,200MB/秒 |
シーケンシャルライト | Gen3 = 最大 2,350MB/秒。 Gen4 = 最大 4,000MB/秒 | Gen3 = 最大 2,350MB/秒。 Gen4 = 最大 4,000MB/秒 |
ランダムリード | Gen3 = 最大 770K IOPS; Gen4 = 最大 1.0 万 IOPS | Gen3 = 最大 770K IOPS; Gen4 = 最大 1.0 万 IOPS |
ランダム書き込み | Gen3 = 最大 75 IOPS。 Gen4 = 最大 85K IOPS | Gen3 = 最大 165 IOPS。 Gen4 = 最大 250K IOPS |
消費電力 |
アクティブ: 20W。アイドル時: <5W |
|
耐久性 | 1 DWPD (5 年間) | 3 DWPD (5 年間) |
修正不可能な BER |
1^10 ビットの読み取りごとに 17 セクタ |
|
MTTF / AFR |
2.5万時間 / 0.35% |
|
使用温度 |
0から70C |
キオクシアCD6の性能
テストベッド
新しい PCIe Gen4 Enterprise SSD のレビューでは、 レノボ シンクシステム SR635 アプリケーションテストと合成ベンチマーク用。 ThinkSystem SR635 は、十分に装備されたシングル CPU AMD プラットフォームであり、高性能ローカル ストレージに必要な能力を十分に上回る CPU パワーを提供します。これは、私たちの研究室で PCIe Gen4 U.2 ベイを備えた唯一のプラットフォーム (そして現在市場にある数少ないプラットフォームの XNUMX つ) でもあります。合成テストは多くの CPU リソースを必要としませんが、同じ Lenovo プラットフォームを利用します。どちらの場合も、ストレージ ベンダーの最大ドライブ仕様に合わせてローカル ストレージを可能な限り最良の状態で紹介することが目的です。
PCIe Gen4 合成およびアプリケーション プラットフォーム (Lenovo ThinkSystem SR635)
- 1 x AMD 7452 (2.35GHz x 32 コア)
- 8 x 64GB DDR4-3200MHz ECC DRAM
- CentOS 7.7 1908
- ESXi 6.7u3
PCIe Gen3 アプリケーション プラットフォーム (レノボ シンクシステム SR850)
- 4 x Intel Platinum 8160 CPU (2.1GHz x 24 コア)
- 16 x 32GB DDR4-2666Mhz ECC DRAM
- 2 x RAID 930-8i 12Gb/秒 RAID カード
- 8 つの NVMe ベイ
- VMware ESXI 6.7u3
PCIe Gen3 合成プラットフォーム (デル PowerEdge R740xd)
- 2 x Intel Gold 6130 CPU (2.1GHz x 16 コア)
- 4 x 16GB DDR4-2666MHz ECC DRAM
- 1x PERC 730 2GB 12Gb/秒 RAID カード
- アドインNVMeアダプター
- Ubuntu-16.04.3-デスクトップ-amd64
新しいプラットフォームでの最初のレビューとして、過去のドライブの結果も含めました。古いプラットフォームでテストしていたので、近いものではありますが、100% 一致した比較ではありません。合成テストの違いにより、結果に大きな偏りはありませんが、シングル CPU AMD プラットフォームとクアッド CPU Intel プラットフォームで動作するアプリケーションのワークロードには、ある程度の偏りがある可能性があります。 MySQL テストでは、新しい Gen4 KIOXIA 製品の 4 つがリードしましたが、SQL サーバーの遅延は平均的でした。公開できた GenXNUMX ドライブは XNUMX つだけなので、比較できるデータはそれほど多くありませんが、これらの結果を表示する際に注目してください。また、より高速な SSD を活用するために合成テストを強化し、より高いピーク スレッド数でのテスト結果を表示するようになりました。
テストの背景と比較対象
この StorageReview エンタープライズ テスト ラボ は、管理者が実際の展開で遭遇するものと同等の環境でエンタープライズ ストレージ デバイスのベンチマークを実施するための柔軟なアーキテクチャを提供します。エンタープライズ テスト ラボには、さまざまなサーバー、ネットワーキング、電源調整、その他のネットワーク インフラストラクチャが組み込まれており、スタッフが実際の条件を確立してレビュー中にパフォーマンスを正確に測定できるようになります。
ラボ環境とプロトコルに関するこれらの詳細をレビューに組み込み、IT プロフェッショナルとストレージ取得の責任者が次の結果を達成した条件を理解できるようにします。私たちのレビューは、私たちがテストしている機器のメーカーによって費用が支払われたり、監督されたりすることはありません。に関する追加の詳細 StorageReview エンタープライズ テスト ラボ と そのネットワーク機能の概要 それぞれのページで入手できます。
アプリケーションのワークロード分析
エンタープライズストレージデバイスのパフォーマンス特性を理解するには、実際の運用環境で見られるインフラストラクチャとアプリケーションのワークロードをモデル化することが不可欠です。したがって、キオクシア CD6 のベンチマークは次のとおりです。 SysBench による MySQL OLTP のパフォーマンス と Microsoft SQL Server OLTP のパフォーマンス シミュレートされた TCP-C ワークロードを使用します。アプリケーションのワークロードでは、各ドライブで 4 つの同一に構成された VM が実行されます。
SQLサーバーのパフォーマンス
各 SQL Server VM は、ブート用の 100 GB ボリュームとデータベースおよびログ ファイル用の 500 GB ボリュームの 8 つの vDisk で構成されています。システム リソースの観点から、各 VM に 64 つの vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。以前にテストした Sysbench ワークロードはストレージ I/O と容量の両方でプラットフォームを飽和させましたが、SQL テストではレイテンシーのパフォーマンスを調べています。
このテストは、Windows Server 2014 R2012 ゲスト VM 上で実行される SQL Server 2 を使用し、Quest のデータベース用ベンチマーク ファクトリによって負荷がかけられます。 StorageReview の Microsoft SQL Server OLTP テスト プロトコル は、複雑なアプリケーション環境で見られるアクティビティをシミュレートするオンライン トランザクション処理ベンチマークである、トランザクション処理パフォーマンス評議会のベンチマーク C (TPC-C) の最新草案を採用しています。 TPC-C ベンチマークは、データベース環境におけるストレージ インフラストラクチャのパフォーマンスの強みとボトルネックを測定するのに、合成パフォーマンス ベンチマークよりも近くなります。このレビューの SQL Server VM の各インスタンスは、333GB (1,500 スケール) SQL Server データベースを使用し、15,000 人の仮想ユーザーの負荷の下でトランザクション パフォーマンスと待機時間を測定しました。
SQL Server テスト構成 (VM ごと)
- Windows Serverの2012 R2
- ストレージ フットプリント: 600GB 割り当て、500GB 使用
- SQL Serverの2014
-
- データベースのサイズ: 1,500 スケール
- 仮想クライアント負荷: 15,000
- RAMバッファ: 48GB
- テスト時間: 3 時間
- 2.5時間のプレコンディショニング
- 30 分のサンプル期間
SQL Server トランザクション ベンチマークでは、KIOXIA CD6 のスコアは 12,633.7VM で 4 TPS でした。
平均遅延では、KIOXIA CD6 は 5.5VM で 4 ミリ秒 (CD6 と同じ) となり、Huawei および Memblaze ドライブにわずかに遅れをとっています。
システムベンチのパフォーマンス
次のアプリケーション ベンチマークは次のもので構成されます。 Percona MySQL OLTP データベース SysBench 経由で測定。このテストでは、平均 TPS (99 秒あたりのトランザクション数)、平均レイテンシ、平均 XNUMX パーセンタイル レイテンシも測定します。
各 システムベンチ VM は 92 つの vDisk で構成されています。447 つはブート用 (~270 GB)、8 つは事前構築済みデータベース用 (~60 GB)、XNUMX 番目はテスト対象データベース用 (XNUMX GB) です。システム リソースの観点から、各 VM に XNUMX つの vCPU、XNUMX GB の DRAM を構成し、LSI Logic SAS SCSI コントローラーを活用しました。
Sysbench テスト構成 (VM ごと)
- CentOS 6.3 64 ビット
- Percona XtraDB 5.5.30-rel30.1
-
- データベーステーブル: 100
- データベースのサイズ: 10,000,000
- データベーススレッド: 32
- RAMバッファ: 24GB
- テスト時間: 3 時間
- 2 スレッドのプリコンディショニングに 32 時間
- 1時間 32スレッド
Sysbench のトランザクション ベンチマークに移ると、KIOXIA は 9,333VM で 4 TPS という最高のスコアを記録しました。
Sysbench の平均レイテンシでは、CD6 が 13.71VM でわずか 4 ミリ秒のレイテンシを示し、再び群をリードしました。
最悪のシナリオの遅延 (99 パーセンタイル) では、CD6 は 27.48VM で 4 ミリ秒に達し、今回は Huawei にほんのわずか (27.22 ミリ秒) 遅れました。
VDBench ワークロード分析
ストレージ デバイスのベンチマークに関しては、アプリケーション テストが最適であり、総合テストは 25 番目になります。実際のワークロードを完全に表現しているわけではありませんが、合成テストは、競合ソリューション間での完全な比較を容易にする再現性係数を備えたストレージ デバイスのベースラインを確立するのに役立ちます。これらのワークロードは、「100 コーナー」テスト、一般的なデータベース転送サイズ テスト、さまざまな VDI 環境からのトレース キャプチャに至るまで、さまざまなテスト プロファイルを提供します。これらのテストはすべて、スクリプト エンジンを備えた共通の vdBench ワークロード ジェネレーターを利用して、大規模なコンピューティング テスト クラスターの結果を自動化して取得します。これにより、フラッシュ アレイや個々のストレージ デバイスを含む幅広いストレージ デバイスにわたって同じワークロードを繰り返すことができます。これらのベンチマークのテスト プロセスでは、ドライブの表面全体にデータを埋めてから、ドライブ容量の XNUMX% に相当するドライブ セクションを分割して、ドライブがアプリケーションのワークロードにどのように応答するかをシミュレートします。これは、ドライブを XNUMX% 使用して定常状態にするフル エントロピー テストとは異なります。結果として、これらの数値は、より高い持続的な書き込み速度を反映することになります。
プロフィール:
- 4K ランダム読み取り: 100% 読み取り、128 スレッド、0 ~ 120% iorate
- 4K ランダム書き込み: 100% 書き込み、128 スレッド、0 ~ 120% iorate
- 4K ランダム読み取り (高負荷): 100% 読み取り、512 スレッド、0 ~ 120% の iorate
- 4K ランダム書き込み (高負荷): 100% 書き込み、512 スレッド、0 ~ 120% iorate
- 64K シーケンシャル読み取り: 100% 読み取り、32 スレッド、0 ~ 120% の iorate
- 64K シーケンシャル書き込み: 100% 書き込み、16 スレッド、0 ~ 120% iorate
- 64K シーケンシャル読み取り (高負荷): 100% 読み取り、64 スレッド、0 ~ 120% の iorate
- 64K シーケンシャル書き込み (高負荷): 100% 書き込み、64 スレッド、0 ~ 120% の iorate
- 合成データベース: SQL および Oracle
- VDI フル クローンおよびリンク クローン トレース
比較対象:
最初の VDBench ワークロード分析、ランダム 4K 読み取りでは、KIOXIA CD6 のピーク スコアは 760,160 IOPS、遅延は 165.5μs でした。ランダム 4K 読み取りの高負荷中に、KIOXIA CD6 が 1 万 IOPS マークに近づくと若干速度が低下し、1,067,840 μs で 472 IOPS のピークに達することがわかりました。
4K ランダム書き込みでは、CD6 が最高のパフォーマンスを発揮し、レイテンシー 579,919μs で最高 211.1 IOPS を達成しました。
高い書き込み負荷において、KIOXIA CD6 は 709,547μs のレイテンシーで 713.3 IOPS という素晴らしいピークを示しました。
シーケンシャル ワークロードに切り替えると、CD6 は 68,413 μs で 4.28 IOPS (または 465.6GB/s) のピークを達成し、堅実な結果を示しました (もう XNUMX つの KIOXIA が読み取りで最高のドライブであると予想されました)。 シーケンシャル読み取りの高負荷中、CD6 は 75,598 IOPS (4.72GB/秒) でピークに達し、その後速度が低下して 843.5 ミリ秒もの遅延に達しました。
64K シーケンシャル書き込みの場合、KIOXIA CD6 は書き込みにおいて強力であることを再度示しました。ピーク 53,402 IOPS (または 3.33GB/秒)、遅延 291.6 ミリ秒を記録し、最後に少し低下しました。
書き込み負荷が高い場合、KIOXIA CD6 は 42,299 IOPS (または 2.58GB/秒) に達し、遅延はわずか 65.1 ミリ秒でした。
次のテスト セットは、SQL ワークロード、SQL、SQL 90-10、および SQL 80-20 です。 SQL を始めとして、KIOXIA CD6 のピークは 241,700 IOPS で、レイテンシは 131.1 ミリ秒でした。 SQL 90-10 では、CD6 は Memblaze ドライブとほぼ同じパフォーマンスを発揮し、最大 243,292 IOPS、遅延は 129.9 ミリ秒でした。SQL 80-20 では、最高パフォーマンスのドライブはほぼ同様のパフォーマンスを誇り、CD6 は 244,857 ミリ秒の遅延で 128.3 IOPS のピークを記録しました。
次に、Oracle ワークロード、Oracle、Oracle 90-10、Oracle 80-20 です。 Oracle に続いて、KIOXIA CD6 が 253,635 IOPS と 137.5µs のレイテンシーを達成し、XNUMX 位にランクインしました。
Oracle 90-10 では上記のことをさらに詳しく示し、CD6 のピークは 168,000 IOPS、遅延は 116.8μs でした。Oracle 80-20 では、CD4 のピークが 6、遅延が 192,663 ミリ秒であったため、上位 112.3 つのドライブは非常に類似したパフォーマンスを示しました。次に、VDI クローン テスト (完全およびリンク) に切り替えました。 VDI フル クローン (FC) ブートでは、KIOXIA CD6 が 196,584μs の遅延で 172.3 IOPS のピークを達成し、XNUMX 位になりました。 VDI FC 初期ログインでは、KIOXIA CD6 が最高のパフォーマンスを示し、169,412 ミリ秒でピーク 172.6 IOPS を達成しました。
VDI FC 月曜日のログインでは、CD6 は 109,488 ミリ秒で 142.7 IOPS のピークを記録し、再び最高のパフォーマンスを示しました。
VDI リンク クローン (LC) ブートの場合、CD6 は 100,678 ミリ秒の遅延で 157 IOPS という驚異的な結果を示し、KIOXIA CM6 にわずかに続きました。 VDI LC の初期ログインでは、初期ログイン プロファイル中に不均一な数値が示され、25,235 IOPS と 313.8 ミリ秒の遅延でピークに達し、その後パフォーマンスが大幅に低下しました。最後に、VDI LC Monday Login を使用した場合、KIOXIA CD6 は 84,903 ミリ秒で 184.3 IOPS を誇る、これまた優れたパフォーマンスでテストを終了しました。
まとめ
KIOXIA CD6 は、新しい PCIe 4.0 インターフェイスを活用した、市場に投入される最新の高性能データセンター SSD です。これは、要求の厳しい 24 時間 7 日の環境、特に混合使用や読み取り集中型の耐久性が必要な環境向けに専用に構築されています。新しいKIOXIAドライブは、2.5インチ15mm Zハイトフォームファクタで利用可能で、KIOXIA BiCS FLASH 96層3D TLCを備え、960GBから15.36TBまでの幅広い容量で利用できます。さまざまなセキュリティオプションも付属しています。
パフォーマンスに関しては、CD6 を KIOXIA CM6 などの他の同様のクラスの SSD と比較しました。アプリケーション ワークロード分析では、SQL Server で CD6 が 12,633.7 TPS に達し、平均遅延が 5.5 ミリ秒で、Memblaze ドライブと Huawei ドライブのすぐ下に位置しました。 Sysbench の場合、ドライブは 9,333 TPS、平均遅延 13.71 ミリ秒、最悪のシナリオの遅延 27.48 ミリに達しました。
VDbench テストでは、KIOXIA の方がより安定したパフォーマンスを示しました。ただし、ほとんどの場合、CM6 ドライブの後に続きます。ハイライトは次のとおりです: 760,160K 読み取りで 4 IOPS (1,067,840 IOPS 高負荷)、579,919K 書き込みで 4 IOPS (709,547 IOPS 高負荷)、4.28K 読み取りで 64GB/秒 (高負荷 4.72GB/秒)、3.33K で 64GB/秒書き込み(2.58GB/秒の高負荷)。 SQL ワークロードでは、SQL 242 ~ 243 で 90 IOPS、SQL 10 ~ 245 で 80 IOPS、SQL 20 ~ 6 で 254 IOPS が発生しました。 Oracle では、最高パフォーマンスのドライブ (その中の CD168) はほぼ同様のパフォーマンスを示し、ワークロードは 90 IOPS、Oracle 10-192 では 80 IOPS、Oracle 20-6 では XNUMX IOPS でした。 VDI クローン テストでは、CDXNUMX は全体的に印象的なパフォーマンスを示し、VDI FC 月曜日ログイン テストと VDI FC 初期ログイン テストで最高のパフォーマンスが示されたことが強調されました。
このレビューの焦点は、印象的なスコアカードをまとめた CD6 のパフォーマンスにあります。おそらく、より大きな話は PCIe Gen4 の将来です。 Lenovo は、最初から最後まで PCIe Gen4 をサポートするサーバーを提供しました。他のほとんどのサーバーは、Gen4 を後方でのみサポートしていますが、これは基本的な設計上の決定です。前方のベイをスキップする方が簡単かつ迅速でした。 Lenovo は、より包括的な道を選択し、AMD が提供するすべてを活用できるように Rome サーバーを開発しました。その結果、Lenovo は、KIOXIA の CD6 のような、他のほとんどの企業が利用できない新しいテクノロジーを利用できるようになります。これにより、キオクシアは、少なくともインテルが次世代サーバー CPU を発売するまでは、卵が先か鶏が先かのシナリオに陥ることになる。この場合、IT の進歩を先取りするのは問題ありませんが、CD6 はレガシー プラットフォームでも問題なく動作し、PCIe Gen4 システムが利用可能になったときにさらに多くの機能を提供できるようになります。現時点では、特に Lenovo デュアル CPU システムが市場に投入されるにつれて、AMD サーバーの利点を宣伝するベンチマークが数多く登場すると予想されます。
更新 4/2/22 – を再レビューしました。 キオクシアCD6 より成熟したファームウェアを搭載
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | Facebook | RSSフィード