Micron RealSSD P320h は、ハーフハイト、ハーフレングス (HHHL) アプリケーション アクセラレータであり、SLC NAND と PCIe Gen 2 x8 インターフェイスを利用して、3.2 GB/秒のシーケンシャル読み取りと最大 785,000 のランダム読み取り IOPS の推定パフォーマンスを実現します。 P320h アーキテクチャは、一般に複数のフラッシュ ドライブを RAID で構成する、これまでレビューした他の最近のアプリケーション アクセラレータの多くとは異なります。 Micron の製品は異なり、カスタム コントローラーを備えた RAIN (独立 NAND の冗長アレイ) を使用しています。これは、Fusion-io や Virident が採用しているアプローチと似ています。このアーキテクチャにより、Micron はドライブ上で高レベルのデータ セキュリティを提供しながら、驚異的な速度と遅延を実現します。このレビューでは、700GB カードのペアをテストし、カード単体でどれだけ高速に動作するかだけでなく、Windows Server 320 で P2012h がどのように拡張されるかを確認します。
Micron RealSSD P320h は、ハーフハイト、ハーフレングス (HHHL) アプリケーション アクセラレータであり、SLC NAND と PCIe Gen 2 x8 インターフェイスを利用して、3.2 GB/秒のシーケンシャル読み取りと最大 785,000 のランダム読み取り IOPS の推定パフォーマンスを実現します。 P320h アーキテクチャは、一般に複数のフラッシュ ドライブを RAID で構成する、これまでレビューした他の最近のアプリケーション アクセラレータの多くとは異なります。 Micron の製品は異なり、カスタム コントローラーを備えた RAIN (独立 NAND の冗長アレイ) を使用しています。これは、Fusion-io や Virident が採用しているアプローチと似ています。このアーキテクチャにより、Micron はドライブ上で高レベルのデータ セキュリティを提供しながら、驚異的な速度と遅延を実現します。このレビューでは、700GB カードのペアをテストし、カード単体でどれだけ高速に動作するかだけでなく、Windows Server 320 で P2012h がどのように拡張されるかを確認します。
前述したように、ドライブ アーキテクチャと NAND 管理ポリシーは、スループットと遅延の両方の観点から見たデバイスのパフォーマンスに関して重要な役割を果たします。 P320h では、Micron は独自の IP と ASIC 設計および IDT による製造を融合しています。その最終結果は、RAIN を含む、NAND の管理と制御に関する Micron 独自のインテリジェンスを備えた ASIC コントローラーです。 Micron の RAIN アプローチは、NAND の処理方法において非常に効率的であり、その効率が最終的に P320h のパフォーマンスとデータ保護を推進します。 Micron は、RAIN 内で 7+1P RAID5 アーキテクチャに相当するものを使用しています。 7+1 レベルで使用されるストライピングにより、Micron は企業が必要とするデータ保護を提供しながら、パリティなしのドライブと同じパフォーマンスを提供できます。
P320h は Micron NAND 管理技術のおかげで興味深いものですが、物理的にも興味深いものです。 HHHL PCB には、もちろん SLC NAND や DDR を含む Micron 部品が多数搭載されており、最大のパフォーマンスを発揮するために外部電源接続は必要ありません。当社の 700GB ドライブには、ボード上に 64 個の NAND ピースが挟まれており、単一コントローラー上のパッシブ ヒートシンクによって強調表示されます。単一コントローラーの設計により、ハードウェアとソフトウェアを介して複数のコントローラーを組み合わせることに依存する競合ソリューションよりも優れたパフォーマンスと信頼性が可能になります。 Micron NAND 用に特別に設計されたコントローラーを使用すると、ドライブの相互運用性、パフォーマンス、サポートに関して Micron に別の利点がもたらされます。他で報告されている内容とは異なり、このドライブは NVMe をサポートしていませんが、Micron は将来の製品でその方向に向かっていることは間違いありません。
Micron は、320GB と 350GB の 700 つの SLC 専用容量で P350h を提供しています。 512GB ドライブは最初は 12.5GB RAW ですが、RAIN の 22% とオーバープロビジョニングの 350% を差し引くと、ドライブは 320GB になります。 P25h は、350GB モデルで最大 50PB、700GB モデルで最大 XNUMXPB の耐久性を実現し、ドライブ管理と健全性レポート用のソフトウェア ツールが付属しています。
Micron RealSSD P320h の仕様
- キャパシティ
- 350GB (MTFDGAR350SAH-1N1AB)
- シーケンシャル読み取り: 3.2 GB/秒 (128 KB、定常状態)
- シーケンシャル書き込み: 1.9 GB/秒 (128 KB、定常状態)
- ランダム読み取り: 785,000 IOPS (4KB、定常状態)
- ランダム書き込み: 175,000 IOPS (4KB、定常状態)
- 700GB (MTFDGAR700SAH-1N1AB)
- シーケンシャル読み取り: 3.2 GB/秒 (128 KB、定常状態)
- シーケンシャル書き込み: 1.9 GB/秒 (128 KB、定常状態)
- ランダム読み取り: 785,000 IOPS (4KB、定常状態)
- ランダム書き込み: 205,000 IOPS (4KB、定常状態)
- 350GB (MTFDGAR350SAH-1N1AB)
- レディレイテンシ: <42µs (512 バイト)
- 書き込みレイテンシ: <9μs
- インターフェース: PCIe Gen2 x8
- 電力: 最大 25W、アイドル時 10W
- フォームファクタ: HHHL
- 最大 256 個のコマンドをキューイングするネイティブ コマンド
- 耐久性: 350GB – 25PB、700GB – 50PB
- 寸法:68.90mm X 167.65mm X 18.71mm
- 動作温度:0°C〜+50°C
- OSとの互換性
- Microsoft: Windows Server 2008 R2 SP1 (x86-64)、Windows Server 2008 R2 SP1 Hyper-V (x86-64)、Windows Server 2012 (x86-64) SP128、Windows Server 2012 Hyper-V (x64)
- Linux: RHEL Linux 5.5、5.6、5.7、5.8 (SP128)、6.1、6.2 (x86-64)、SLES Linux 11 SP1 および SP2 (x86-64)
- オープンソース GPL (カーネル Rev. 2.6.25+)
- サポート終了後のデータ保持期間は 1 年間
ビデオの概要
ビルドとデザイン
Micron RealSSD P320h は、設計の点で市場で最も基本的な PCIe AA レイアウトを特徴とするハーフハイト、ハーフレングスの x8 PCI-Express カードです。 XNUMX つのコントローラーと XNUMX つの小さなドーター カードを備えたこのソリューションは、これまでにレビューした他のソリューションよりもスリムで、最も複雑さが少ないです。これはさまざまな点でマイクロンにとって有利に機能します。まず、このカードは、PCIe 拡張カードをサポートする市場のほぼすべてのサーバーに自動的に適合しますが、エンタープライズ ソリューションの全体的な信頼性を比較するときにも重要になります。 Fusion-io「Duo」製品にあるような PCIe スイッチさえなく、単一のコントローラーを使用すると、故障する可能性のある部品が少なくなります。これは、複数の SandForce コントローラを RAID で構成する一部の競合ソリューションに見られるマルチコントローラ構成とは著しく対照的です。将来の最終的な交換を除いて、プラットフォームが一度稼働すると停止することを嫌う市場では、今日設置したデバイスが何年も問題を引き起こすことなく動作することがわかっていることは大きな利点です。
Micron RealSSD P320h の中心となるのは、このソリューションに固有のカスタム Micron/IDT ASIC コントローラーです。 700 つの 1GB サンプルでは、このコントローラーは Micron SLC NAND の 2.25TB プールにリンクされ、XNUMXGB Micron DDR RAM でバッファリングされています。見方によっては、これらのアイテムはマイクロンに大きな利点をもたらします。なぜなら、マイクロンは、これらすべてのコンポーネントを社内に持つことで、コアレベルでどのように動作するかについて非常に詳細な知識を持っているからです。
Micron RealSSD P320h は電力消費に関して非常に機敏で、PCIe 25 x2.0 バスからの消費電力は 8 ワット未満です。外部電源接続は必要ありません。これにより、P320h は、追加の電源リードを必要としたり、PCIe 仕様で電力を供給するサーバーをテストしたりすることなく、インストールする適切なプラットフォームを見つける際の柔軟性が向上します。
管理ソフトウェア
ほとんどのアプリケーション アクセラレータには何らかのソフトウェアが付属していますが、それらのツールの使いやすさと有効性は優れたものから不十分なものまでさまざまです。 Micron は、P320h をより効率的に管理できるように設計された、CLI と GUI の両方を含む RealSSD Manager ツールを提供しています。これらのツールは Windows と Linux の両方と互換性があり、幅広い機能を提供します。ユーザーは、これらのソフトウェア ツールを利用して、ドライブ ファームウェアの更新、PCIe AA の健全性の確認、デバイス フォーマットの開始を行うことができます。より高度なレベルでは、組み込みのログ機能を使用して、現在のドライブの使用状況と温度を監視できます。
これまでに見てきたメーカー付属のユーティリティと比較すると、Micron の機能セットと全体的な設計の点では Fusion-io のすぐ下にあります。 Micron RealSSD Manager は、ioSphere と比較して設計が少し簡素化されていますが、ローカル レベルでのみではありますが、同じ管理および監視機能の多くを提供します。現在、リモート システム上のデバイスの監視はサポートされていませんが、全体として、LSI または OCZ 管理ツールと比較して機能が大幅に向上しています。
テストの背景と比較対象
エンタープライズ ハードウェアのテストに関しては、その評価に使用されるテスト プロセスと同じくらい環境が重要です。 StorageReview では、テスト対象のデバイスが最終的に使用される多くのデータセンターと同じハードウェアとインフラストラクチャを提供しています。これには、エンタープライズ サーバーと、エンタープライズ ネットワーキング、ラック スペース、電源調整/監視、およびデバイスのパフォーマンスを適切に評価するための同クラスの同等のハードウェアなどの適切なインフラストラクチャ機器を使用したテストのみが含まれます。私たちのレビューはいずれも、私たちがテストしている機器のメーカーによって支払われたり管理されたりするものではありません。当社が保有する製品から当社の裁量により選択された関連する比較対象との比較 私たちのラボで.
StorageReview エンタープライズ テスト プラットフォーム:
- 2 x Intel Xeon X5650 (2.66GHz、12MB キャッシュ)
- Windows Server 2008 Standard Edition R2 SP1 64 ビットおよび CentOS 6.2 64 ビット
- インテル 5500+ ICH10R チップセット
- メモリ – 8GB (2 x 4GB) 1333Mhz DDR3 レジスタード RDIMM
このレビューで比較対象を選択する際には、各メーカーの最有力候補を選択しましたが、SLC 搭載の Micron RealSSD P320h と比較して意味のある領域のみを選択しました。そのため、当社は第 4 世代の LSI WarpDrive を廃止し、第 XNUMX 世代の Nytro WarpDrive と、パフォーマンス エンタープライズ ストレージ市場のニーズの遅延曲線から大きく外れすぎた OCZ Z-Drive RXNUMX に置き換えました。 。
640GB Fusion-io ioDrive Duo
- リリース: 1 年上半期
- NANDタイプ: MLC
- コントローラー: 2 x 独自仕様
- デバイスの可視性: JBOD、OSに応じたソフトウェアRAID
- Fusion-io VSL Windows: 3.1.1
- Fusion-io VSL Linux 3.1.1
200GB LSI ナイトロ ワープドライブ WLP4-200
- リリース: 1 年上半期
- NAND タイプ: SLC
- コントローラー: 4 x LSI SandForce SF-2500 ~ LSI SAS2008 PCIe to SAS ブリッジ
- デバイスの可視性: 固定ハードウェア RAID0
- LSI Windows: 2.10.51.0
- LSI Linux: ネイティブ CentOS 6.2 ドライバー
700GB ミクロン RealSSD P320h
- リリース: 2 年上半期
- NAND タイプ: SLC
- コントローラー: 1 x 独自仕様
- デバイスの可視性: 単一デバイス
- マイクロン Windows: 7.03.3452.00
- マイクロン Linux: 1.3.7-1
エンタープライズ総合ワークロード分析 (ストック設定)
PCIe ストレージ ソリューションを検討する方法は、従来のバーストまたは定常状態のパフォーマンスだけを検討するだけではなく、より深く掘り下げたものになります。長期間にわたる平均パフォーマンスを見ると、その期間全体でデバイスがどのようにパフォーマンスを発揮するかの背後にある詳細が見えなくなります。フラッシュのパフォーマンスは時間の経過とともに大きく変化するため、新しいベンチマーク プロセスでは、各デバイスのプレコンディショニング フェーズ全体にわたる合計スループット、平均レイテンシー、ピーク レイテンシー、標準偏差などの領域でパフォーマンスを分析します。ハイエンドのエンタープライズ製品では、多くの場合、スループットよりも遅延が重要です。このため、私たちは、テストを行った各デバイスの完全なパフォーマンス特性を示すために多大な労力を費やしています。 エンタープライズテストラボ.
また、Fio ワークロード ジェネレーターを使用して、Windows と Linux の両方のオペレーティング システムで異なるドライバー セットの下で各デバイスがどのように動作するかを示すパフォーマンス比較も追加しました。 Windows の場合、最初のレビュー時点で最新のドライバーが使用されており、各デバイスは 64 ビット Windows Server 2008 R2 環境でテストされています。 Linux の場合、各 Enterprise PCIe Application Accelerator がサポートする 64 ビット CentOS 6.2 環境を使用します。このテストの主な目的は、OS のパフォーマンスがどのように異なるかを示すことです。製品シートに互換性があると記載されているオペレーティング システムがあっても、それらのパフォーマンスが必ずしも同じであるとは限りません。
テストされるすべてのデバイスは、最初から最後まで同じテスト ポリシーの下で行われます。現在、個々のワークロードごとに、デバイスはベンダーが提供するツールを使用して安全に消去され、スレッドごとに 16 の未処理のキューを持つ 16 スレッドの高負荷下でデバイスがテストされるのと同じワークロードで定常状態に事前調整されます。次に、複数のスレッド/キュー深さプロファイルで設定された間隔でテストし、軽い使用状況と重い使用状況でのパフォーマンスを示します。 100% 読み取りアクティビティのテストでは、100% 書き込みに切り替えられても、プリコンディショニングは同じワークロードで行われます。
プレコンディショニングおよび一次定常状態テスト:
- スループット (読み取り+書き込み IOPS 合計)
- 平均レイテンシ (読み取りと書き込みのレイテンシを合わせて平均)
- 最大遅延 (ピーク読み取りまたは書き込み遅延)
- レイテンシの標準偏差 (読み取りと書き込みの標準偏差を合わせて平均)
現時点では、Enterprise Synthetic Workload Analysis には、現実世界のアクティビティの反映を試みることができる 4 つの共通プロファイルが含まれています。これらは、当社の過去のベンチマークとある程度の類似性があること、および最大 8K 読み取りおよび書き込み速度、エンタープライズ ドライブで一般的に使用される 70K 30/XNUMX など、広く公開されている値と比較するための共通の根拠を持つように選択されました。また、幅広い転送サイズの組み合わせを提供する従来のファイル サーバーと Web サーバーを含む、XNUMX つの従来の混合ワークロードも含めました。これらの最後の XNUMX つは、サイトで紹介されているカテゴリのアプリケーション ベンチマークとともに段階的に廃止され、新しい合成ワークロードに置き換えられます。
- 4K
- 100% 読み取りまたは 100% 書き込み
- 100% 4
- 8K 70/30
- 70% 読み取り、30% 書き込み
- ファイルサーバー
- 80% 読み取り、20% 書き込み
- 10% 512b、5% 1k、5% 2k、60% 4k、2% 8k、4% 16k、4% 32k、10% 64k
- ウェブサーバー
- 100% 読み取り
- 22% 512b、15% 1k、8% 2k、23% 4k、15% 8k、2% 16k、6% 32k、7% 64k、1% 128k、1% 512k
4K ランダム書き込みプリコンディショニング ワークロードをカバーする最初のテストに進むと、Micron RealSSD P320h は、Lenovo ThinkServer で 400k IOPS にわずかに迫るバースト速度で、高いスタートを切ります。パフォーマンスは 200 分あたりで 80k IOPS を超えて横ばいになり、CentOS 6.2 と Windows Server 2008 のテスト環境ではほぼ同様のパフォーマンスが得られました。
4K プレコンディショニング テストの期間中の平均レイテンシーを見ると、P320h は 1T/16Q 負荷で 16ms 強のレイテンシーにすぐに落ち着き、SLC 搭載 LSI Nytro WarpDrive をはるかに下回っていました。
プレコンディショニング ワークロードの期間にわたって Windows と Linux の最大レイテンシを比較すると、Linux 環境では高レイテンシのスパイクが最も少ないのに対し、Windows ドライバーセットでは時々 1,000 ミリ秒まで変動することがわかりました。
1,000 ミリ秒のスパイクは当惑させる可能性がありますが、標準偏差を比較すると、テスト期間中の全体的な遅延の全体像がより正確にわかります。 P320h の場合、Windows Server 2008 での急増にもかかわらず、Linux では依然として PXNUMXh に次ぐ XNUMX 位に入ることができました。
プレコンディショニング フェーズから移行した後、4T/16Q 負荷の 16K ワークロードで各アプリケーション アクセラレータのより長いサンプルを採取しました。 Micron RealSSD P320h は、Linux ドライバー セットの優位性により、4K ランダム読み取りとランダム書き込みの両方でこれまでで最高のパフォーマンスを提供しました。 CentOS では読み取り 417 IOPS を測定しましたが、Windows では「ちょうど」378 IOPS でした。 4K ランダム書き込み速度は両方のプラットフォームで一貫しており、202k IOPS を超えました。
ほぼ信じられないほどのスループットを備えているため、P320h の平均遅延が最も低いのは驚くべきことではありません。平均読み取りレイテンシは 0.6 ミリ秒をわずかに上回り、書き込みレイテンシは 1.26 ミリ秒でした。
4K ランダム読み取りおよび書き込みパフォーマンスの最終サンプリングでピーク レイテンシーを比較すると、Micron RealSSD P320h は、Windows と Linux の両方で最も高い 4K ランダム読み取りのパフォーマンスを発揮しました。ランダム書き込みパフォーマンスはさらに分割され、Windows 側のピーク レイテンシが高く、Linux セグメントのピーク レイテンシが低くなりました。
全体的なレイテンシーをさらに詳しく調べると、Micron realSSD P320h は、Linux ではこれまでで最も安定したランダム 4K パフォーマンスを提供しましたが、Windows ドライバーでは若干劣りました。
次のテストでは、焦点を 8K 70/30 ワークロードに移します。そこでは、Micron P320h がスループットで再びグループをリードしています。このセグメントでは、バースト速度はテスト開始から 30 分以内に変化し、120 分あたりで安定状態に落ち着きました。
P320h は、8K 70/30 ワークロードにおいて非常に低い平均レイテンシーを実現し、プリコンディショニング プロセス全体で約 1.5 ミリ秒を測定しました。 Linux ドライバー セットがわずかにリードしていましたが、物事の全体的な計画では、その違いに気づくのは難しいでしょう。
平均レイテンシからピークレイテンシに焦点を切り替えると、Windows と Linux の動作には顕著な違いがあります。 Windows ドライバーの最大応答時間は 1,000 ~ 1,200 ミリ秒の間で変動しましたが、Linux 側の最大応答時間は約 200 ミリ秒と低くなりました。
ピーク レイテンシは最悪の単一応答時間を示しますが、次のセクションでは標準偏差を見て、プリコンディショニング段階でレイテンシの全体像がどのように展開されるかを確認します。 Linux では、Micron P320h は Windows 側と比較してはるかに高いレベルの一貫性を提供しました。 Windows のパフォーマンスはそれほど安定していませんでしたが、それでも中位にランクされました。
16% 16K 書き込みテストで実行した固定の 100 スレッド、4 キューの最大ワークロードと比較して、混合ワークロード プロファイルは、幅広いスレッド/キューの組み合わせにわたってパフォーマンスを拡張します。これらのテストでは、ワークロード強度を 2 スレッドと 2 キューから最大 16 スレッドと 16 キューまで広げます。 Micron P320h は、このグループの同等製品よりも高いキュー深さで圧倒的なリードを提供しましたが、2T/2Q レベルでは最小限のパフォーマンスしか譲りませんでした。 Linux ドライバー セットは、スペクトル全体にわたって、ほとんどの領域でわずかな差でより高いスループットを提供しました。
Micron RealSSD P320h は、2T/2Q 負荷を除くすべてのセグメントでグループの中で最高の応答時間を提供し、1T/16Q セグメントを除くすべてのセグメントで 16ms 未満にとどまりました。
Windows の P320h では、テストの中盤にかけて、同時スレッドが 4 つを超えると応答時間が長くなり始めました。 Linux ドライバーは、128 ミリ秒近くに達した最も効果的な QD256 および QD200 テストを除くすべてのテストで、これらのブリップを抑制しました。
標準偏差を比較すると、Micron RealSSD P320h は Linux 環境で最も安定したパフォーマンスを提供し、Windows ドライバーセットでは中位にランクされました。
ファイル サーバーのワークロードは、特定のデバイスごとに大きな転送サイズのスペクトルを表すため、ドライブは静的な 4k または 8k ワークロードに落ち着くのではなく、512b から 64K の範囲のリクエストに対応する必要があります。ファイル サーバーのプレコンディショニング テストは、Micron P320h がバースト速度で他のモデルを上回ることができなかった最初の領域でしたが、テストが終了するにつれて安全に消去された状態から高速化し続けただけでした。開始時は 80 IOPS 未満でしたが、100 分後には定常状態で 120 IOPS を超えました。このセグメントの既存モデルを大きく上回りました。
平均レイテンシーを見ると、Micron RealSSD P320h は有効キュー深さ 256 で定常状態に近づき、応答時間は平均 2ms でわずかに短縮されました。
焦点をピーク応答時間に切り替えたところ、Windows ドライバー セットは再び高いピーク応答時間を示し、テスト全体を通じて 1,000 ミリ秒前後で推移しました。これを、50 ミリ秒を超えないピーク レベルを維持する Linux ドライバー セットと比較しました。
ピーク応答時間は必ずしも良好であるようには見えませんが、Micron P320h からの全体的な遅延をより明確に描くために、焦点を標準偏差に移します。この領域では、テスト期間中に Windows の P320h からいくつかのブリップが見られますが、依然としてグループ内で最も低いレベルを維持しています。
プレコンディショニング段階を終了した後、16T/16Q から 2T/2Q までの範囲で負荷を変化させて一次テストに移行しました。 Micron RealSSD P320h は素早くスタートし、有効キューの深さが増加するにつれて大幅なリードで集団をリードしました。最終的に、デュアル プロセッサ サーバーのパフォーマンスは 130 IOPS 未満に達しました。
平均レイテンシを比較すると、P320h は 130T/16Q で最高の 4k IOPS スループットを実現し、平均レイテンシは約 0.5 ミリ秒で、EQD1 および EQD2 レベルでは 128 ~ 256 ミリ秒まで増加しました。
ファイル サーバー テストのメイン セグメント中の最大遅延の状況は、テストの Windows セグメント中に前のテストと同じ 1,000 ミリ秒のブリップがあり、Linux ドライバーのピーク応答時間ははるかに短くなっていました。
レイテンシの標準偏差を比較すると、Micron RealSSD P320h は、Linux ではグループの中で最高のレイテンシを実現し、Windows ではパックの真ん中あたりに入りました。
Web サーバー プロファイルをカバーする最後の合成ワークロードでは、従来は 100% 読み取りテストでしたが、メイン テストの前に 100% 書き込みアクティビティを適用して各ドライブを完全に事前調整しました。このテストでは、Micron RealSSD P320h が最速の定常状態パフォーマンスを示しましたが、このテストでは Windows ドライバーと Linux ドライバーのスループットに明らかな違いがあることが新たにわかりました。 Linux のパフォーマンスは大幅に向上し、バースト パフォーマンスも向上しました。
平均遅延に焦点を切り替えたところ、Micron P320h はテスト開始 20 分強から平坦な曲線を示し、Linux のパフォーマンスが 2ms 近くリードしました。
P1,000h から頻繁に 320 ミリ秒のブリップが発生した以前のテストの読み取り/書き込み混合ワークロードと比較すると、Web サーバーのプリコンディショニング テストははるかに穏やかでした。そうは言っても、Linux 側はさらに落ち着いており、プリコンディショニング プロセス中にレイテンシーに急激な変化は見られませんでした。
Web サーバーのプレコンディショニング フェーズでのレイテンシーの標準偏差を比較すると、Windows ドライバーで発生するブリップを含めた場合でも、Micron RealSSD P320h がこれまでで最も安定したレイテンシーを提供しました。ドライブが定常状態に近づくにつれて遅延が非常に緩やかに増加するのを見ると、60 ~ 80 分の間にパフォーマンスが完全に横ばいになっていることがわかります。
100% 読み取りプロファイルを使用して Web サーバー テストのメイン セグメントに切り替えても、テストの 320T/2Q セクションでの Windows パフォーマンスを除くすべてのカテゴリで Micron P2h が依然として先頭に立っていました。パフォーマンスを比較した興味深い点の 152 つは、Linux 側の書き込みパフォーマンスが優れているのに対し、Windows ドライバー セットの方が読み取りパフォーマンスが高いことです。これにより、キューの深さが増し、最高速度が大幅に向上し (170k IOPS 対 XNUMXk IOPS)、すべてのセクションで Windows のパフォーマンスが向上しました。
Micron RealSSD P320h の平均レイテンシは、有効キュー深度が 1 の場合を除き、すべてのステージで 256 ミリ秒未満にとどまりました。ピーク スループットと平均レイテンシを比較すると、Web サーバー トレースにおけるこのカードのスイート スポットは、有効キュー深度 64 の間にあることがわかります。そして128。
スループットと平均遅延の点では Windows ドライバーが最終的に優位に立ったにもかかわらず、テストのほとんどのセクションで最大応答時間は依然として 1,000 ミリ秒近くにとどまりました。 Linux のパフォーマンスには高いレイテンシのピークはありませんでした
このグループのドライブ間のレイテンシーの標準偏差を比較すると、Linux の Micron RealSSD が最高のレイテンシーの広がりを示し、一方、Windows ドライバーはパックの中央付近にありました。
エンタープライズ総合ワークロード分析 (マルチドライブ/ネットワーク)
700 つの 320GB Micron RealSSD P2012h PCIe アプリケーション アクセラレータを装備し、Windows Server 3.0 を実行する高性能 Supermicro サーバーで構成されるテスト環境を構成しました。このテスト プラットフォームは、6036 つの個別の PCIe 380 Mellanox InfiniBand アダプターを介して SX8 IB スイッチに接続されました。 HP Proliant DL2012p Gen50 サーバーも Windows Server XNUMX を実行しています。高性能 Supermicro ストレージ サーバー上で、記憶域スペースを使用してシンプルなストレージ アレイを作成し、SMB 経由で共有しました。ドライブの LBA サーフェス全体をテストする主要なベンチマークとは異なり、これらのテストでは、ストライプ ボリューム全体に広がる XNUMX つの XNUMXGB セグメントに重点を置き、ローカルおよび InfiniBand ネットワーク上でベンチマークを実行しました。
InfiniBand テストの概要ビデオを以下に示します。
StorageReview 56Gb/s エンタープライズ テスト プラットフォーム:
スーパーマイクロコンピューター スーパーサーバー 7047R-TXRF
- スーパーマイクロコンピュータ X9DRX+-F
- デュアル Intel E5-2670 CPU (2.6GHz、20MB キャッシュ)
- Windows Server 2012 データセンター
- 128GB RAM (8GB x 16 Hynix DDR3、CPU あたり 64GB)
- インテル Xeon E5-2640 (6 コア、2.50 GHz、15MB、95W)
- のWindows Serverの標準2012
- Intel C600チップセット
- 64GB (8 x 8GB) および 16GB (4 x 4GB) 1333Mhz DDR3 レジスタード RDIMM
Mellanox SX6036 56Gb/s InfiniBand スイッチおよびハードウェア
- 36 56Gb/秒 FDR ポート
- パッシブ QSFP 銅線ケーブル
- Mellanox ConnectX-3 VPI PCIe 3.0 ツイン 56Gb/s InfiniBand アダプター
当社の現在の InfiniBand 高性能インターコネクト テスト インフラストラクチャは、Mellanox の 380 ポート 8Gb/s IB スイッチを介して接続された Mellanox ConnectX-3 VPI PCIe アダプターを備えた 36 台の HP Proliant DL56p GenXNUMX サーバーで構成されています。この環境では、ネットワーク機器自体ではなく、テストしているストレージ デバイスが I/O ボトルネックになる可能性があります。
ローカルのシンプル スペースと InfiniBand テスト セクションでは、完全なスイートではなく、限られたテストの選択に絞りました。比較を容易にするために、8K 70/30 ワークロードを使用して、ローカル アクセスとネットワーク経由で共有した場合のパフォーマンスの違いを示しました。
プライマリ テストでテストした全体的なフットプリントを小さくすることで、パフォーマンスがデュアル カード環境で非常にうまく拡張できることがわかりました。ローカルでは、ネットワーク上で実行されている 490 台のサーバーを模倣するために 8 つのワークロード ジェネレーター セッションを同時に実行し、70K 30/380 ワークロードで 8k IOPS を超えるパフォーマンスを測定しました。その単一のストライプ アレイを 402 つの共有上に提供し、XNUMX 台の HP Proliant DLXNUMXp GenXNUMX サーバーからアクセスすると、パフォーマンスは XNUMXk IOPS に低下しました。どちらのシナリオでもスループットを XNUMX 倍以上に向上させることができ、サーバーごとの優れたパフォーマンスを維持することができました。
ツイン P320h 環境の平均レイテンシを見ると、ローカル アクセスと InfiniBand 経由のリモート アクセスを比較すると、平均レイテンシに多少の違いがありましたが、レイテンシはプライマリ テスト ベッドで 320 台の PXNUMXh から測定した値よりもまだ低かったです。この高 I/O デバイスを複数のシステム間で共有することで遅延への影響が最小限に抑えられたことを考えると、高価な高性能リソースを複数のシステムで共有するための扉が開かれます。
ローカル アクセスとリモート アクセスを比較した場合、ピーク レイテンシーに測定可能な差はありませんでした。これは、InfiniBand ネットワークによって PCIe アプリケーション アクセラレータなどのデバイスに対するレイテンシーが大幅に増加していないことを知ることが重要です。
ピーク レイテンシと同様に、ストライプ環境でローカルに見られるレイテンシの標準偏差と、InfiniBand ネットワーク上で見られるレイテンシの標準偏差の間には、識別可能な違いは見られませんでした。
有効キュー深度 8 の 70 つの同時ロードで 30K 256/2 のパフォーマンスを確認した後、ローカルと比べてネットワーク経由でパフォーマンスがわずかに低下することを確認した後、2T/16Q から 16T/4Q までのさまざまなワークロードに焦点を切り替えました。 。これは 2 つのサーバーまたは 32 つのローカル ワークロード ジェネレーターで同時に発生するため、合計負荷は 16T/320Q から最大 XNUMXT/XNUMXQ になります。ストライプ PXNUMXh アレイへのローカル アクセスとネットワーク アクセスの両方で、増加する負荷に対して同じ応答性が得られました。どちらのテストでも、全範囲にわたってほぼ同一のパターンが示され、ローカル アクセスが最高のパフォーマンスを提供しました。
ストライプ P8h 構成上の 70K 30/320 ワークロードのメイン セクションの平均レイテンシーは、ローカルおよびネットワーク上で優れたパフォーマンスを提供しました。最も印象的なのは InfiniBand の結果で、ネットワーク上で 0.8 IOPS を超える場合、各サーバーの遅延は 400,000 ミリ秒未満でした。
8K 70/30 ワークロードの最大遅延をデュアル P320h セットアップと比較すると、ローカルとリモートで同様の結果が得られ、どちらもテスト期間中に 1,000 ミリ秒以上のブリップが発生しました。
上記の最大遅延の結果と同様に、P320h アレイへのローカル アクセスと、InfiniBand ネットワーク上の Windows ストレージ スペースを介して共有されたアレイとの間には、ほとんど違いはありませんでした。
まとめ
Micron RealSSD P320h は、適切に実行されたエンジニアリングの好例です。ボードの設計やレイアウトからカスタム コントローラーに至るまで、すべてが P320h を真の統合ユニットにしていますが、企業のストレージ スペースであっても常にそうであるとは限りません。マイクロンは、カスタム ASIC の NAND 管理 IP から、SLC フラッシュ コンポーネントの最大のパフォーマンスと耐久性につながる可能な限り詳細な NAND 特性評価に至るまで、ドライブ全体に価値を付加する方法を見つけます。
P320h のパフォーマンスを評価すると、ドライブは悲鳴を上げ、CentOS と Windows Server のテスト環境の間でほぼ同等の状態を維持しました。より良い環境という点では、特に最適なレイテンシに関しては Linux が常に優位に立っています。ただし、Micron P320h が速いと言うのは少し控えめな表現です。これは、これまでにテストした他のソリューションを大幅に上回り、ほとんどのソリューションよりもバースト速度が速く、競合ソリューションよりもはるかに優れた定常状態パフォーマンスを備えています。その応答性を詳しく見ると、平均レイテンシは申し分ありませんでしたが、さらに印象的だったのは、ピーク レイテンシとレイテンシの標準偏差が非常に低い、新しい完璧な Linux パフォーマンスでした。 Windows 側もそれほど遠くありませんでしたが、ピーク遅延と遅延標準偏差は比較すると中位にランクされました。
互換性に関しては、Micron RealSSD P320h がエンタープライズ環境で完璧に動作することがわかりました。私たちにとって、この最上位のエンタープライズ製品をコンシューマ プラットフォームでテストすることは意味がありません。コンシューマ プラットフォームで実行されている実稼働環境に持ち込むことは決してないからです。そのため、私たちがテストした第 320 層サーバーでは、複数のオペレーティング システムにわたって問題なく動作しました。ビデオで見られるように、P7047h は、Windows Server 2012 を実行する Supermicro SuperServer XNUMXR のデュアル ドライブ構成でも問題なく動作しました。
あえて不満を言うとすれば、特にすべてのワークロードのピーク レイテンシーと標準偏差を比較した場合に、Windows 環境に改善が必要ないくつかの小さな領域が残っているということです。レイテンシが高くても、すべてではないにしても、テストした PCIe アプリケーション アクセラレータの多くを上回っていますが、より洗練されたドライバで絞り出せるパフォーマンスがまだ残っている可能性があると感じています。小さな不満のもう 2 つの領域は、SLC のみの製品が 320 つの容量しか提供されていないことです。競合他社は MLC または eMLC でドライブを提供しています。これにより、コストの低いエントリーポイントとはるかに大きな容量が可能になります。場合によっては 320 枚のカードで XNUMXTB を超えることもあります。確かに、注目度の高いエントリーエンタープライズ市場は PXNUMXh のターゲットではありませんが、より多くのニーズに対応するための多様性があれば、PXNUMXh ファミリはより汎用性の高いものになる可能性があります。
メリット
- これまでにテストした中で最速の PCIe アプリケーション アクセラレータ
- 非常に低い平均レイテンシとピークレイテンシ
- Windows 環境と Linux 環境で同等の優れたパフォーマンス
デメリット
- SLC NANDに限定
- 最高は700GB
ボトムライン
Micron RealSSD P320h は、PCIe ストレージが提供する機能を最大限に活用したい企業向けに、よく機能した完全な製品です。 P320h はクラス最高の性能を誇り、Micron コンポーネントとコントローラに統合された優れた NAND 管理知的財産のおかげで、優れた一貫したマルチ OS パフォーマンスを実現します。
このレビューについて話し合う