Fusion-io ioDrive2 Duo は、フルハイト、ハーフレングスのアプリケーション アクセラレータであり、SLC NAND と組み合わせることで、今日の最も要求の厳しいアプリケーションに 1.2TB の低遅延、高耐久性のストレージを提供します。第 2 世代の製品としてブランド化されていますが、Fusion-io はさまざまな ioMemory 製品でストレージとしてのメモリの分野で長い間先駆者であったため、このネーミングはやや誤解を招きます。その経験は、製品開発やスペックシートのハイライトだけでなく、管理に至るまですべてに反映されています。 Fusion-io は、ioSphere を備えた市場で最も堅牢なドライブ管理ソフトウェア スイートを誇ります。それでも、優れたソフトウェアと実証済みのドライブ設計は方程式の一部にすぎません。企業は 47 つの目標を念頭に置いてこれらの製品を導入します。ストレージ システムの遅延を攻撃することで、アプリケーションの応答時間を短縮します。 ioDrive15 の SLC 反復により、この問題に重点が置かれ、68 μs の読み取りアクセス レイテンシと 2 μs の書き込みアクセス レイテンシが実現されました。これは、MLC ベースの ioDrive20 の読み取りアクセス レイテンシ XNUMX μs と比較すると (書き込みレイテンシは同じです)、約 XNUMX μs というと大したことには思えませんが、フラッシュ ストレージで使用するように調整されたアプリケーションにとっては、事実上永遠の時間となる可能性があります。 。
Fusion-io ioDrive2 Duo は、フルハイト、ハーフレングスのアプリケーション アクセラレータであり、SLC NAND と組み合わせることで、今日の最も要求の厳しいアプリケーションに 1.2TB の低遅延、高耐久性のストレージを提供します。第 2 世代の製品としてブランド化されていますが、Fusion-io はさまざまな ioMemory 製品でストレージとしてのメモリの分野で長い間先駆者であったため、このネーミングはやや誤解を招きます。その経験は、製品開発やスペックシートのハイライトだけでなく、管理に至るまですべてに反映されています。 Fusion-io は、ioSphere を備えた市場で最も堅牢なドライブ管理ソフトウェア スイートを誇ります。それでも、優れたソフトウェアと実証済みのドライブ設計は方程式の一部にすぎません。企業は 47 つの目標を念頭に置いてこれらの製品を導入します。ストレージ システムの遅延を攻撃することで、アプリケーションの応答時間を短縮します。 ioDrive15 の SLC 反復により、この問題に重点が置かれ、68 μs の読み取りアクセス レイテンシと 2 μs の書き込みアクセス レイテンシが実現されました。これは、MLC ベースの ioDrive20 の読み取りアクセス レイテンシ XNUMX μs と比較すると (書き込みレイテンシは同じです)、約 XNUMX μs というと大したことには思えませんが、フラッシュ ストレージで使用するように調整されたアプリケーションにとっては、事実上永遠の時間となる可能性があります。 。
Fusion-io は、スペックシート上のレイテンシとスループット パフォーマンスの向上を超えて、この最新世代のプラットフォームに対する他のいくつかの重要な改善に熱心に取り組んできました。前世代の ioDrive デバイスには、NAND 障害が発生した場合でもドライブの動作を継続できる FlashBack と呼ばれる機能があり、ioDrive2 アプリケーション アクセラレータは、Adaptive FlashBack と呼ばれる新しいバージョンでその特性に基づいて構築されています。アダプティブ フラッシュバックは、NAND ダイの障害耐性を高め、万が一複数の NAND 障害が発生した場合でも、ドライブをオンラインに保ち、データを安全に保ちます。このようなイベントが発生した場合、ioDrive2 はオフラインにならずに再マッピングして回復できます。
Fusion-io は、ioDrive2 ファミリ用の新しい NAND コントローラーとファームウェア ビルドも展開しました。ここでの利点は主にパフォーマンス関連、スループットの向上、レイテンシーの改善ですが、NAND 互換性の利点もあります。 Fusion-io は、VSL ソフトウェアを 3.2.x に更新しました。これにより、新しい NAND コントローラーと組み合わせることで、ioDrive2 のブロック サイズが小さくなりパフォーマンスが向上します。 NAND をテーマにしながら、Fusion-io はハードウェア アーキテクチャの変更を行い、NAND を独自のモジュールに配置し、NAND コントローラーから分離し、よりシンプルな設計を実現しました。最終的な利点は、Fusion-io が同じ PCB レイアウトを利用して、新しい NAND または NAND パッケージをより迅速にサポートできることです。
以下の設計セクションでハードウェアの概要をさらに詳しく説明しますが、ここで Fusion-io アーキテクチャの概要を簡単に説明することは有益です。以下のような ヴィリデント FlashMAX II 以前にレビューしましたが、ioDrive2 の設計は、NAND 管理業務のほとんどをホスト CPU にオフロードする FPGA を活用しています。他のデザインは似ていますが、 マイクロンのP320h これらの業務のほとんどにはオンボード コントローラを利用しますが、Fusion-io はホスト システム内の強力で十分に活用されていないことが多い CPU を利用することを好みます。この設計では、ストレージへのより直接的なパスが提供される傾向があり、ストレージの待ち時間が短縮されます。 Duo の設計は、FlashMAX II のようなツイン コントローラーを活用していますが、個々の PCB 上で NAND とコントローラーを組み合わせるのではなく、NAND のみを含む 3.2.2 つのドーター ボードを使用するという点で異なります。ただし、Virident ソリューションとは異なり、VSL 300 を備えた Fusion-io は、Virident が提供する 1 つのボリュームではなく、1 つの 2GB ドライブをシステムに提供します。ユーザーは各ボリュームを独自にアドレス指定することを選択できますが、単一のボリュームを取得するにはソフトウェア RAID に配置する必要があります。 Fusion-io Duo カードはフルハイト、ハーフレングスであるため、Virident、Micron などが提供する一般的に汎用のハーフハイト、ハーフレングスのカードよりも大きいことにも注目してください。とはいえ、現在市場にあるほとんどの Tier XNUMX XNUMXU および XNUMXU サーバーは FHHL カードに簡単に対応できるため、カードの形状はフリンジ ケースにのみ関係します。
Fusion-io は、MLC 構成と SLC 構成の両方で ioDrive2 Duo を出荷します。 MLC の容量は 2.4 TB、SLC の容量は 1.2 TB です。ドライブには XNUMX 年間の保証が付いています。
Fusion ioDrive2 Duoの仕様
- ioDrive2 Duo 容量 1.2TB SLC
- 読み取り帯域幅 (1 MB) 3.0 GB/秒
- 書き込み帯域幅 (1 MB) 2.5 GB/秒
- ランちゃん。読み取り IOPS (512B) 700,000
- ランちゃん。書き込み IOPS (512B) 1,100,000
- ランちゃん。読み取り IOPS (4K) 580,000
- ランちゃん。書き込み IOPS (4K) 535,000
- 読み取りアクセス遅延 47μs
- 書き込みアクセスのレイテンシ 15μs
- 2xnm NAND フラッシュ メモリ シングルレベル セル (SLC)
- バス インターフェイス PCI-Express 2.0 x8 電気 x8 物理
- 重量: 11オンス未満
- フォームファクター: フルハイト、ハーフレングス (FHHL)
- 保証: 5 年間または最大使用耐久期間
- 耐久性: 190PBW (コントローラーあたり 95PBW)
- サポートされているオペレーティングシステム
- Microsoft Windows Microsoft Windows: 64 ビット Windows Server 2012、Windows Server 2008 R2、Windows Server 2008、Windows Server 2003
- Linux RHEL 5/6; SLES 10/11; OEL 5/6; CentOS 5/6; Debian スクイーズ;フェドーラ 16/17; openSUSE 12; Ubuntu 10/11/12
- UNIX Solaris 10/11 x64。 OpenSolaris 2009.06 x64; OSX10.6/10.7/10.8
- ハイパーバイザー VMware ESX 4.0/4.1/ESXi 4.1/5.0/5.1、Hyper-V を搭載した Windows 2008 R2、Hyper-V Server 2008 R2
設計と構築
Fusion ioDrive2 Duo 1.2TB SLC は、フルハイト ハーフレングス (FHHL) x8 PCI-Express 2.0 カードで、XNUMX つのコントローラーと XNUMX つの PCIe スイッチがメイン回路基板に取り付けられています。 NAND は XNUMX つのドーター ボードを介して接続されているため、新しい NAND 構成に切り替えるときに Fusion に製造上の利点が与えられます。リソグラフィーの変更が起こるたびにカードを再設計するのではなく(NAND ダイシュリンク)、新しいドーターボードをインストールし、FPGA に新しいファームウェアをフラッシュできます。当社の SLC ioDrive2 Duo は 600 つの 4GB ioMemory デバイスで構成されており、それぞれが PCIe 接続の XNUMX レーンを使用します。 PCB レイアウトは非常に効率的で、カードの右側にある XNUMX つのコントローラーを大型のパッシブ ヒートシンクで覆っています。
各コントローラーは、独自の 2nm Xilinx Virtex-40 FPGA と 6GB の SLC NAND プールを備えた 768 つの ioDrive2 を表します。私たちがレビューした ioDrive24 Duo は Micron NAND を使用していますが、Fusion-io は NAND メーカーに依存しません。 NAND はデバイスごとに 32 個の 600GB チップに分割されており、ストック フォーマットでは 22GB が使用可能です。この比率により、在庫のオーバープロビジョニング レベルは XNUMX% となり、ほとんどのエンタープライズ フラッシュ デバイスとほぼ同等になります。
Fusion ioMemory は、プロセッサがシステム メモリとやり取りするのと同じように、NAND フラッシュとインターフェイスします。 PCIe 経由で直接通信する Fusion-io の NAND コントローラー (FPGA) と、ホスト システムにインストールされている Fusion-io のドライバーまたは仮想ストレージ層 (VSL) ソフトウェアを組み合わせて使用し、デバイスを従来のブロック デバイスに変換します。 Fusion-io の VSL を通じて、ソフトウェアは互換性のためにブロック デバイスをエミュレートしますが、Fusion はソフトウェア ベンダーがエミュレーション オーバーヘッドをバイパスして NAND とネイティブに通信できるようにする SDK も提供します。 ioMemory は、VSL ドライバーが機能するためにシステム リソースを消費し、ホスト CPU を活用しながらシステム メモリにフットプリントを作成するという意味でも従来とは異なります。製品サポートの点では、Fusion-io は ASIC ではなく NAND コントローラーとして FPGA を使用しているため、バグ修正やパフォーマンス強化に対処できる非常に低レベルのソフトウェア アップデートを展開できます。これは、新しいコントローラーを製造することによってのみ根本的な変更を加えることができる標準的な SSD コントローラーとは対照的です。ただし、どちらの設計でも、ファームウェアのアップデートによるより高度な調整が可能です。
ioDrive3.2.2 デバイス用の VSL 2 のリリースに伴う機能強化の 2 つは、新しいコントローラー機能です。以前は、各 ioMemory デバイスはホスト システムにとって単一のデバイスとして認識されていました。 Fusion の VSL の最新バージョンでは、コントローラは 2 つのデバイスに分割され、「デュアル パイプ」モードで動作します。したがって、ioDrive3.2.2 には XNUMX つの LUN、ioDriveXNUMX Duo には XNUMX つの LUN ではなく、それぞれ XNUMX つまたは XNUMX つの LUN になります。新旧のレイアウトを使用したテストでは、すべての正式なベンチマークは VSL XNUMX のみで実行されましたが、小規模な I/O パフォーマンスが大幅に向上したことがわかりました。
Fusion ioMemory デバイスが PCIe 環境と比較される場合、電源も頻繁に話題になります。これは、これらのデバイスが、特定のアプリケーション向けに外部電源接続を備えた数少ないデバイスの 25 つとして際立っているためです。これは、8 枚の PCIe カード上の 25 つの ioMemory デバイスである Duo ファミリ製品に適用されます。このような場合、フルパワーで動作するには、x8 PCIe の最小定格電力定格である 2 ワットを超えて消費します。 Fusion-io には、この電力要件に対処する XNUMX つの方法があります。XNUMX つは外部電源ケーブル、もう XNUMX つはカードが xXNUMX PCIe スロットを通じて XNUMX W 以上を消費できるようにする電源オーバーライドです。 ioDriveXNUMX Duo SLC を内部で評価したレビューでは、 レノボ ThinkServer RD630では、電源オーバーライドを有効にしてすべてのベンチマークを実行したため、外部電源を必要とせずに最大限のパフォーマンスが得られました。 Fusion-io は、ハードウェア インストール ガイドで、ホスト サーバーの定格電力が 55 W であれば、ソフトウェア オーバーライドを安全に有効にできると述べています。
管理ソフトウェア
Fusion-io は、他のメーカーが ioSphere ioMemory データセンター管理スイートで到達しようとしている基準を継続的に設定してきました。競合するアプリケーション アクセラレータと幅広く連携することでわかったように、Windows では基本的な GUI ですら入手するのが難しく、多くのメーカーが限定的な CLI サポートを提供しています。これは、特定のフラッシュ デバイスの長期管理において大きな役割を果たします。保証と予想寿命は、特定の環境での使用状況に応じて決まるためです。
Fusion の ioSphere は、リアルタイムおよび履歴パフォーマンス、状態監視、保証予測など、IT 管理者にとって重要な領域の多くに Web インターフェイスを通じて対応します。 ioSphere は、ローカルにインストールされた ioMemory デバイスと大規模なネットワーク上にインストールされた ioMemory デバイスの両方の監視をサポートしており、管理者がデータセンターの外部のデータを監視できるようにリモート アクセスを構成することもできます。この広範な機能セットは他に類を見ません。
何よりも興味深い機能の 1 つは、リアルタイム パフォーマンス ストリーミングです。 ioSphere を使用すると、ユーザーは特定の ioMemory デバイスに接続し、デバイスにアクセスするアクティビティをその都度監視できます。上記の内部処理中にキャプチャされたストリームに示されているように、この機能をテストで広範囲に使用しました。 MarkLogic NoSQL データベース ベンチマーク。 ioSphere は、接続されているすべての ioMemory デバイスからのデータを常に記録しているため、過去のパフォーマンス情報を示すレポートを作成することもできるため、特定の ioMemory デバイスが特定の実稼働環境でどのくらい持続するかをより正確に見積もることができます。
高度な情報に興味のあるユーザーのために、ioSphere は電力使用量、カード温度、読み書きされた合計データ、およびデバッグ時に役立つその他の多数の詳細も追跡します。このデータには、ioSphere と、デバイス ドライバーとともにデフォルトでインストールされる Fusion-io CLI の両方を介してアクセスできます。これらの高度な機能が活躍するもう 2 つの分野は、ドライブのオーバープロビジョニングまたはアンダープロビジョニングであり、これにより容量とパフォーマンスが引き換えになります。私たちの評価では、ioDrive20 Duo SLC を標準モードと高性能モードの両方でテストしました。ハイパフォーマンス モードでは 2% の追加オーバー プロビジョニングが行われますが、上級ユーザー向けに Fusion-io はオーバー プロビジョニングまたはアンダー プロビジョニングの正確なレベルを選択する機能を提供します。プロビジョニングが不足している場合、ユーザーは (パフォーマンスと耐久性を犠牲にして) ioDriveXNUMX の容量を宣伝されている容量よりも増やすことができます。
テストの背景と比較対象
このレビューで比較したすべてのアプリケーション アクセラレータは、Intel Romley ベースの第 2 世代エンタープライズ テスト プラットフォームでテストされています。 レノボ ThinkServer RD630。この新しいプラットフォームは Windows Server 2008 R2 SP1 と Linux CentOS 6.3 の両方で構成されているため、ドライバーがサポートするさまざまな環境でさまざまな AA のパフォーマンスを効果的にテストできます。各オペレーティング システムは、Windows の電源プロファイルを高パフォーマンスに設定するだけでなく、CentOS 6.3 でプロセッサを最高のクロック速度でロックするために cpuspeed を無効にするなど、最高のパフォーマンスを実現するように最適化されています。合成ベンチマークには、Linux では FIO バージョン 2.0.10、Windows ではバージョン 2.0.12.2 を使用し、許可されている場合には各 OS で使用される同じテスト パラメータを使用します。
StorageReview Lenovo ThinkServer RD630 構成:
- 2 x Intel Xeon E5-2620 (2.0GHz、15MB キャッシュ、6 コア)
- Intel C602チップセット
- メモリ – 16GB (2 x 8GB) 1333Mhz DDR3 レジスタード RDIMM
- Windows Server 2008 R2 SP1 64 ビット、Windows Server 2012 Standard、CentOS 6.3 64 ビット
- 100GB Micron RealSSD P400e ブート SSD
- LSI 9211-4i SAS/SATA 6.0Gb/s HBA (ブート SSD 用)
- LSI 9207-8i SAS/SATA 6.0Gb/s HBA (SSD または HDD のベンチマーク用)
このレビューで比較対象を選択する際に、最新の最高性能の SLC および MLC アプリケーション アクセラレータを選択しました。これらは、各製品の性能特性と価格帯に基づいて選択されました。 ioDrive2 Duo SLC の標準ベンチマーク結果と高性能ベンチマーク結果の両方を含め、Micron RealSSD P320h および高性能モードでオーバープロビジョニングされた Virident FlashMAX II と比較します。
1.2TB フュージョン ioDrive2 デュオ SLC
- リリース: 2 年上半期
- NAND タイプ: SLC
- コントローラー: 独自のファームウェアを備えた 2 x FPGA
- デバイスの可視性: 4 つの JBOD デバイス
- Fusion-io VSL Windows バージョン: 3.2.2
- Fusion-io VSL Linux バージョン: 3.2.2
- プレコンディショニング時間: 12 時間
- リリース: 2 年上半期
- NAND タイプ: SLC
- コントローラー: 1 x 独自の ASIC
- デバイスの可視性: 単一デバイス
- マイクロン Windows: 8.01.4471.00
- マイクロン Linux: 2.4.2-1
- プレコンディショニング時間: 6 時間
- リリース: 2 年上半期
- NANDタイプ: MLC
- コントローラー: 独自のファームウェアを備えた 2 x FPGA
- デバイスの可視性: フォーマットに応じてシングルまたはデュアルデバイス
- ヴィリデント Windows: バージョン 3.0
- Virident Linux: バージョン 3.0
- プレコンディショニング時間: 12 時間
エンタープライズ総合ワークロード分析
PCIe ストレージ ソリューションを検討する方法は、従来のバーストまたは定常状態のパフォーマンスだけを検討するだけではなく、より深く掘り下げたものになります。長期間にわたる平均パフォーマンスを見ると、その期間全体でデバイスがどのようにパフォーマンスを発揮するかの背後にある詳細が見えなくなります。フラッシュのパフォーマンスは時間の経過とともに大きく変化するため、当社のベンチマーク プロセスでは、各デバイスのプレコンディショニング フェーズ全体にわたる合計スループット、平均レイテンシー、ピーク レイテンシー、標準偏差などの領域でパフォーマンスを分析します。ハイエンドのエンタープライズ製品では、多くの場合、スループットよりも遅延が重要です。このため、私たちはエンタープライズ テスト ラボで検査した各デバイスの完全なパフォーマンス特性を示すために多大な労力を費やしています。
また、Windows と Linux の両方のオペレーティング システムで異なるドライバー セットの下で各デバイスがどのように動作するかを示すパフォーマンスの比較も含まれています。 Windows の場合、最初のレビュー時点で最新のドライバーが使用されており、各デバイスは 64 ビット Windows Server 2008 R2 環境でテストされています。 Linux の場合、各 Enterprise PCIe Application Accelerator がサポートする 64 ビット CentOS 6.3 環境を使用します。このテストの主な目的は、OS のパフォーマンスがどのように異なるかを示すことです。製品シートに互換性があると記載されているオペレーティング システムがあっても、それらのパフォーマンスが必ずしも等しいとは限りません。
フラッシュのパフォーマンスは、各ストレージ デバイスのプリコンディショニング フェーズ全体を通じて異なります。さまざまな設計とさまざまな容量で、プレコンディショニング プロセスは、定常状態の動作に達するまでに必要な時間の長さに応じて 6 時間または 12 時間続きます。私たちの主な目標は、一次テストを開始するまでに各ドライブが完全に定常状態モードになっていることを確認することです。合計すると、同等の各デバイスはベンダーのツールを使用して安全に消去され、スレッドごとに 16 の未処理のキューを備えた 16 スレッドの高負荷下でデバイスがテストされるのと同じワークロードで定常状態に事前調整され、その後テストされます。複数のスレッド/キューの深さプロファイルを設定された間隔で実行して、軽い使用量と重い使用量の両方でパフォーマンスを示します。
プリコンディショニングおよび一次定常状態テストで監視される属性:
- スループット (読み取り+書き込み IOPS 合計)
- 平均レイテンシ (読み取りと書き込みのレイテンシを合わせて平均)
- 最大遅延 (ピーク読み取りまたは書き込み遅延)
- レイテンシの標準偏差 (読み取りと書き込みの標準偏差を合わせて平均)
当社のエンタープライズ合成ワークロード分析には、実際のタスクに基づいた 4 つのプロファイルが含まれています。これらのプロファイルは、過去のベンチマークや、最大 8K 読み取りおよび書き込み速度、エンタープライズ ドライブで一般的に使用される 70K 30/XNUMX などの広く公開されている値との比較を容易にするために開発されました。また、従来のファイル サーバーと Web サーバーという XNUMX つの従来の混合ワークロードも含まれており、それぞれが幅広い転送サイズの組み合わせを提供します。
- 4K
- 100% 読み取りまたは 100% 書き込み
- 100% 4
- 8K 70/30
- 70% 読み取り、30% 書き込み
- 100% 8
- ファイルサーバー
- 80% 読み取り、20% 書き込み
- 10% 512b、5% 1k、5% 2k、60% 4k、2% 8k、4% 16k、4% 32k、10% 64k
- ウェブサーバー
- 100% 読み取り
- 22% 512b、15% 1k、8% 2k、23% 4k、15% 8k、2% 16k、6% 32k、7% 64k、1% 128k、1% 512k
最初のワークロードでは、4T/16Q という優れたワークロードを備えた完全にランダムな 16K 書き込みプリコンディショニング プロファイルを調べます。このテストでは、Fusion ioDrive2 Duo SLC は、Linux ドライバーで約 550,000 IOPS バーストを測定し、グループ内で最高のバースト パフォーマンスを提供しました。 Windows では、バースト速度は「わずか」 360 ~ 420,000 IOPS と低くなりました。定常状態に近づくにつれてのパフォーマンスを見ると、HP モードの ioDrive2 Duo は Linux で約 230,000 IOPS、Windows で約 200,000 IOPS で横ばいになりました。ストック容量モードでは、パフォーマンスは Linux で約 140,000 IOPS、Windows で 115,000 IOPS と測定されました。
16T/16Q の高負荷の場合、Fusion ioDrive2 Duo の平均レイテンシは、Linux と Windows のストック容量モードでそれぞれ 1.85 ミリ秒から 2.20 ミリ秒と測定されました。高性能構成では、遅延は約 1.10 ミリ秒と 1.25 ミリ秒に低下しました。
Windows および Linux の ioDrive2 Duo の最大遅延を 4K ランダム書き込みプロファイルと比較すると、ピーク応答時間に関しては Linux 環境が有利であることが簡単にわかりました。プレコンディショニング期間中、Windows の最大遅延は標準容量で 40 ~ 360 ミリ秒、高パフォーマンス モードで 100 ~ 250 ミリ秒の範囲でした。これは、ストック構成と高性能構成の両方でピーク応答時間を 20 ~ 50 ミリ秒に維持した Linux でのパフォーマンスとは対照的です。
レイテンシの標準偏差を詳しく調べると、Fusion ioDrive2 Duo SLC は、Windows ではストック モードとハイパフォーマンス モードの両方で、Linux よりもレイテンシの一貫性が低くなりました。 HP モードの Micron P320h および Virident FlashMAX II と比較すると、これらのモデルはどちらも、両方のオペレーティング システム間でほぼ同じ一貫性を維持していました。
ioDrive12 Duo SLC で 2 時間のプレコンディショニング期間が終了した後、高性能モードでプロビジョニングした場合、Linux でピーク 4 IOPS を測定する定常状態のランダム 231,456K パフォーマンスが得られました。これにより、グループ内で最高のランダム 4K 書き込みパフォーマンスが得られましたが、Windows のパフォーマンスは Micron P320h の書き込み速度とほぼ同等でした。ストック パフォーマンス モードでは、ランダム 4K 書き込み速度は Windows で 114,917 IOPS、Linux で 139,421 IOPS に低下しました。これは、ハイパフォーマンス モードで構成された FlashMAX II とほぼ同等でした。グループの 4K ランダム読み取り速度を見ると、Micron P320h が Linux で 637k IOPS で群をリードし、ioDrive2 Duo SLC は Linux で 460 ~ 463k IOPS、Windows で 384 ~ 392k IOPS を測定しました。
16% 16K ランダム読み取りアクティビティを伴う重い 100T/4Q ワークロードの平均レイテンシを比較すると、ioDrive2 Duo SLC は Windows で 0.550 ~ 0.552 ミリ秒、Linux で 0.649 ~ 0.663 ミリ秒と測定されました。書き込みパフォーマンスに切り替えると、Linux 側の書き込み強度で、ハイパフォーマンス モードで 1.102 ~ 1.255 ミリ秒、ストック容量で 1.832 ~ 2.223 ミリ秒が測定されました。
最大レイテンシーを比較すると、Fusion ioDrive2 Duo は Windows で突出しており、グループ内で最高のピーク応答時間となり、373k ランダム書き込みアクティビティで 1018 ~ 4 ミリ秒を測定しました。 Linux でのパフォーマンスははるかに優れており、最高値で 43 ~ 51 ミリ秒を測定しました。ピーク読み取り遅延に関しては、Windows の ioDrive2 Duo が 3.32 ~ 3.76 ミリ秒の最大遅延で群をリードしました。
ランダム 4K プロファイルの各 PCIe AA 間のレイテンシの標準偏差を比較すると、ioDrive2 Duo SLC は Windows で優れた読み取りレイテンシの一貫性を実現しましたが、書き込みアクティビティではグループ内で一貫性の低いレイテンシがいくつかありました。これは Linux 環境で改善されましたが、グループ内の他の環境よりも上位にありました。グループの最上位にあるのは Micron RealSSD P320h で、読み取りおよび書き込みアクティビティの両方でバランスの取れたレイテンシー標準偏差を提供します。
次のテストは、8K 70/30 混合ワークロードに切り替えます。ここでは、ioDrive2 Duo SLC が 424 ~ 443,000 IOPS の最高バースト速度で群をリードし、Windows でのより高いスループットを実現しました。パフォーマンスが定常状態に近づくにつれて、ioDrive2 Duo SLC の在庫容量は 140 ~ 148k IOPS と測定され、高性能モードでは 195 ~ 200k IOPS に増加しました。
8k 70/30 ワークロードの平均レイテンシを比較すると、Fusion ioDrive2 Duo SLC はバーストで 0.57 ~ 0.59 ミリ秒 (Windows ではわずかなリード) を測定しましたが、ストック容量では約 1.70 ~ 1.80 ミリ秒、ハイパフォーマンス モードでは 1.28 ~ 1.33 ミリ秒に増加しました。 。
ioDrive2 Duo SLC がバースト状態から持続状態または定常状態に移行すると、Windows と Linux の両方でピーク レイテンシーが発生し、ストック モードとハイパフォーマンス モードでも 50 ~ 250 ミリ秒の間で変動しました。これは、320 ~ 10 ミリ秒を測定した Micron P30h や 30 ~ 50 ミリ秒の間で測定した Virident FlashMAX II と比較したものです。
ioDrive2 Duo の最大レイテンシーは、8k 70/30 プレコンディショニング テストでは高くなりましたが、Micron P320h のすぐ後ろにスロットに組み込まれたハイパフォーマンス モードではレイテンシーの一貫性が認められました。標準容量構成では、Virident FlashMAX II よりわずかに大きくスケールされました。
16% 16K 書き込みテストで実行した固定の 100 スレッド、4 キューの最大ワークロードと比較して、混合ワークロード プロファイルは、幅広いスレッド/キューの組み合わせにわたってパフォーマンスを拡張します。これらのテストでは、ワークロード強度を 2 スレッドと 2 キューから最大 16 スレッドと 16 キューまで広げます。拡張された 8K 70/30 テストでは、Fusion ioDrive2 Duo SLC が高性能構成でグループ内で最高のピーク パフォーマンスを示しました。 Micron P320h と直接比較すると、2、4、8、および 16 スレッドではるかに高い低キュー深度のパフォーマンスを提供できましたが、キュー深度が増加するにつれて遅れが生じました。ストック プロビジョニングでは、ハイパフォーマンス モードで構成された Virident FlashMAX II に著しく近いパフォーマンスを提供しました。
8k 70/30 テストのスケーリングされた平均レイテンシ セグメントでは、Fusion ioDrive2 Duo SLC が、低いキュー深度での強力なパフォーマンスのおかげで、グループ内で最も低い平均レイテンシを提供することがわかりました。キューの深さが増すにつれて、Micron P320h が 16T/16Q までリードを奪い、ioDrive2 Duo SLC が再び先頭に立ちました。
スケーリングされた 8k 70/30 テストで最大レイテンシーを比較したところ、ioDrive2 Duo SLC からのより大きなスパイクがいくつか記録されました。これは、有効なキューの深さが増加するにつれて徐々に高くなっているように見えました。これは、Windows の標準容量の ioDrive2 で最も顕著でした。その Linux パフォーマンスと高パフォーマンス モードの Windows は、QD70 以下の実効負荷でピーク レイテンシを 64 ミリ秒未満に維持しましたが、QD128 と QD256 でのレイテンシはそれぞれ 160 ミリ秒と 220 ミリ秒まで増加しました。
当社のスケールされた 8k 70/30 テストでは、Micron P320h がすべてのワークロードにわたって最も安定したレイテンシで先頭に立ち、Virident FlashMAX II が 2 位となり、高性能の ioDriveXNUMX Duo SLC が僅差でそれに続きました。
ファイル サーバーのワークロードは、特定のデバイスごとに大きな転送サイズのスペクトルを表すため、ドライブは静的な 4k または 8k ワークロードに落ち着くのではなく、512b から 64K の範囲のリクエストに対応する必要があります。 Fusion ioDrive2 Duo SLC は、より大きな転送スプレッドへの対処を開始する必要があったため、このワークロードである程度の筋力を発揮し、高性能モードで群をリードすることができました。バーストでは、ioDrive2 Duo SLC のスループットは Micron P320h および Virident FlashMAX II のほぼ 305,000 倍で、約 136,000 IOPS を測定しました。高性能モードで定常状態に近づくと、P320h の 125,000 IOPS と比較して、Windows と Linux の両方で約 110,000 IOPS で横ばいになりました。ストック容量フォーマットでは、ハイパフォーマンス モードの Virident FlashMAX II のスループットが 70,000 IOPS 近くだったのに対し、スループットは約 XNUMX IOPS まで減少しました。
強力なバースト パフォーマンスにより、プリコンディショニング カーブの開始時の平均レイテンシーは、ioDrive0.83 Duo SLC で約 2 ミリ秒と測定され、その後、高性能モードで 1.87 ミリ秒、ストック容量で約 2.25 ミリ秒に横ばいになりました。
ioDrive2 Duo SLC がバースト状態から持続状態および定常状態に移行すると、ピーク レイテンシは 8k 70/30 テストと同様に増加し始めましたが、それほど高くはありませんでした。全体的に、すべてのモードで ioDrive20 Duo からの最大遅延が 200 ミリ秒から 2 ミリ秒の範囲で測定されましたが、最も優れていたのは Linux HP モードでした。 Windows の高性能モードでも、ioDrive1,000 Duo から 2 ミリ秒をわずかに超えるスパイクが 320 つ確認されました。対照的に、Micron P20h は、Windows と Linux の両方でピーク遅延を XNUMX ミリ秒未満に維持しました。
前回のテストでは、ioDrive2 Duo のピーク レイテンシのフラッターがさらに多くなっていることがわかりましたが、そのレイテンシの標準偏差を見ると、Micron P320h と Virident FlashMAX II の中間で動作しました。全体として、Linux はストック構成と高性能構成の両方でより優れた一貫性を提供し、後者の方がより安定性がありました。
ファイル サーバーのプレコンディショニング プロセスが 16T/16Q の一定の負荷で完了した後、2T/2Q と 16T/16Q の間の設定レベルでパフォーマンスを測定するメイン テストに移りました。当社のメイン ファイル サーバー ワークロードでは、ioDrive2 Duo SLC が最高のピーク パフォーマンスを提供し、132T/135,000Q で 16 ~ 16 IOPS を測定し、P320h では 125,500 IOPS を測定しました。また、ioDrive2 Duo は、320、2、4 スレッドのワークロードで Micron P8h よりもキュー深度の強度が低く、高パフォーマンス モードでわずかに優れていることも示しました。キューの深さが増加するにつれて、Micron P320h は各ステージで最高のパフォーマンスを提供し、最高のパフォーマンスがさらに向上しました。
ファイル サーバー ワークロードにおけるクラス トップの各 PCIe アプリケーション アクセラレータ間の平均レイテンシを比較すると、ioDrive2 Duo SLC のレイテンシはグループ内で最も低く、ハイパフォーマンス モードの 0.14T/2Q で Linux と Windows の両方で 2 ミリ秒を測定しました。ワークロードが増加しても、Micron P320h は 16T/16Q まで強力なリードを維持し、ピーク負荷時の平均レイテンシは ioDrive2 Duo SLC が最も低くなりました。
メインのファイル サーバー テストでピーク応答時間を確認したところ、Fusion ioDrive2 Duo SLC の最大レイテンシが高く、有効キューの深さが 128 以上のワークロードで増加し始めました。QD128 未満では、ioDrive2 Duo の最大レイテンシは 11 でした。 -100ms、高パフォーマンス モードでのパフォーマンスが向上します。
ファイル サーバー テストでピーク応答時間からレイテンシの一貫性に視点を切り替えたところ、ioDrive2 Duo SLC はハイパフォーマンス モードで Micron P320h に続き、ストック構成の Virident FlashMAX II と比較してレイテンシの標準偏差でわずかに優れていました。
Web サーバー プロファイルをカバーする最後の合成ワークロードでは、従来は 100% 読み取りテストでしたが、メイン テストの前に 100% 書き込みアクティビティを適用して各ドライブを完全に事前調整しました。このストレスの多いプレコンディショニング テストの下で、ioDrive2 Duo SLC は、標準構成と高性能構成の両方で Micron P320h および Virident FlashMAX II を大きくリードしました。このテストでは、バースト速度は 145,000 IOPS を超えましたが、Micron P320h はハイパフォーマンス モードで 67,000 IOPS でピークに達し、Virident FlashMAX II は 32,000 IOPS で始まりました。
Web サーバーの事前調整テストで 100T/16Q という重い 16% 書き込みワークロードを使用した場合、ioDrive2 は、高性能構成で約 3.5 ~ 3.8 ミリ秒、標準構成で 6.4 ~ 7.2 ミリ秒の平均応答時間を維持しました。
Web サーバーのプレコンディショニング テストで最大レイテンシを比較すると、ioDrive2 Duo SLC は、ストック モードとハイパフォーマンス モードの両方で Linux で 25 ~ 70 ミリ秒を測定しました。Windows のピーク レイテンシは 25 ~ 380 ミリ秒で急上昇し、1,000 ミリ秒を超えるスパイクがいくつかありました。
負荷のかかる Web サーバーのプリコンディショニング実行におけるレイテンシの一貫性を比較すると、Micron P320h がトップとなり、ioDrive2 Duo SLC が中間となりました。高パフォーマンス モードで構成すると、Windows と Linux の両方で標準構成よりも優れたパフォーマンスが得られました。
100% 読み取りプロファイルを使用した Web サーバー テストのメイン セグメントに切り替えると、ioDrive2 Duo SLC のパフォーマンス スケーリングは 23.9T/25.5Q で 2 ~ 2k IOPS で、141T/147Q ではピークの 16 ~ 16k IOPS に増加しました。 Micron P320h と比較すると、ioDrive2 Duo はキュー深度が低くても高くてもパフォーマンスに匹敵することができず、QD32 未満の実効キュー深度では Virident FlashMAX II の後を追いましたが、そのレベルを超えるとすぐに追い越してしまいました。
Fusion ioDrive2 Duo SLC からの平均レイテンシは、0.153T/0.163Q で 2 ~ 2ms の範囲でしたが、1.737T/1.803Q でピークの 16 ~ 16ms まで増加しました。全体的に見て、Micron P320h の遅延は最も低く、Virident FlashMAX II は QD32 以下で優位性を持っていましたが、ioDrive2 Duo SLC はより高い有効キュー深さでそれを上回ることができました。
100% 読み取りの Web サーバー プロファイルでは、ioDrive2 Duo SLC からのレイテンシのスパイクが 130 ミリ秒にも達しましたが、そのほとんどは有効なキューの深さが 20 未満で 256 ミリ秒未満でした。 最高負荷の 16T/16Q では、ioDrive2 Duo SLC のレイテンシのスパイクが発生しました。最大値は標準構成の Windows で測定されたものです。
100% 読み取り Web サーバー テストでのレイテンシー標準偏差を比較すると、Micron P320h がグループ内で強力なリードを示し、ioDrive2 Duo SLC が低有効キュー深度から高有効キュー深度まで Virident FlashMAX II に続くか同等でした。
まとめ:
Fusion-io は、ioDrive2 Duo SLC アプリケーション アクセラレータを使用して、単なる増分変更以上の開発能力を発揮しています。アダプティブ フラッシュバック NAND 障害保護などの内部動作から、NAND を独自のドーター ボードに移動する強化されたボード設計に至るまで、Fusion-io はいくつかのハードウェア変更を加えて、ioDrive2 を前世代よりも優れたものにしました。開発チームは、ドライブの遅延を軽減するために積極的に取り組んできました。 4K 100% および 8K 70/30 テストでは、ioDrive2 SLC がピーク負荷下で最高のレイテンシーとスループット スコアを記録し、その利点が確認されました。また、キュー深度が低い場合でも最も強力なパフォーマンスを発揮し、QD320 での 8、70、および 30 スレッドのワークロードに対する 2k 2/4 テストでは、Micron P8h および FlashMAX II を大幅に上回りました。これにより、大幅に高いパフォーマンスを実現するためにそれほど多くの未処理の I/O を必要としないため、平均レイテンシーが最小になるというもう 2 つの利点が得られました。管理面では、ioDriveXNUMX には、利用可能な最も包括的なドライブ管理ソフトウェアである ioSphere が付属しています。現在市場に出ているアプリケーション アクセラレータと組み合わせたバンドル ソフトウェアと比較すると、機能とインターフェイスのデザインの点で圧倒的に優れています。
他のほとんどのアプリケーション アクセラレータでは、通常、ある OS でのパフォーマンスが他の OS よりも優れていることが確認されています。もちろん、それが、ドライブの長所と短所を見極めるために、Windows と Linux の両方でドライブをテストする理由です。以前の Fusion-io ドライブで見てきたように、ioDrive2 Duo は Linux 環境では非常にうまく機能しますが、Windows ではもう少し不安定になります。グラフで見るとより明らかですが、Windows の全体的なパフォーマンスはそれほど低下していませんが、改善の余地があることは確かです。 16T/16Q のピーク負荷下では、ioDrive2 Duo からのピーク遅延のブリップに気づきました。ただし、レイテンシの一貫性を比較すると、全体として、これらの数値に大きな影響はありませんでした。レイテンシーの数値の一部は Fusion-io が望むものではありませんが、その設計では非常に低レベルの更新が可能であり、時間の経過とともにこれらのレイテンシーの問題の一部を解決できるはずです。互換性のトピックに関しては、Fusion-io がオペレーティング システムのより堅牢なリストの XNUMX つをサポートしているため、ドライブをさまざまな使用例に簡単に導入できることも注目に値します。
Fusion-io カードの設計は、ホストの CPU と RAM を使用して NAND 管理作業のほとんどを実行するため、競合他社から批判を受けることがよくあります。ただし、これまで見てきたように、これは Virident でも採用されている効率的な設計であり、ますます強力になっている CPU を活用することで優れたパフォーマンスと遅延を提供します。 Micron の P320h は、非常に優れたオンボード コントローラを活用した代替アプローチの輝かしい例ですが、同社のカードの最大容量は 700 GB の SLC ストレージであり、ストレージ ベンダーが妥協しなければならないことを示しています。 Fusion-io に対する業界の新たな攻撃は、いくぶん興味深いもので、これはフォームファクタに関するものです。 ioDrive2 Duo は FHHL 設計を使用していますが、他のほとんどの製品では HHHL が使用されており、サーバー適合性の観点からは、よりユニバーサルな設計となっています。私たちの研究室にある HP、Dell、Lenovo、SuperMicro のサーバーはすべて FHHL および HHHL 形式をサポートしていますが、この点で Fusion-io の設計がやや外れ値であることに注意してください。設計の観点から見ると、モジュール式 NAND セグメントを可能にするために、より多くのスペースを使用することは許容されるようです。これにより、NAND の変化に伴う製品ラインの長い寿命にわたる設計コストが制限されますが、競合他社は特殊な使用例におけるその限界にすぐに気づきます。
メリット
- 100% 4K、8k 70/30、およびファイル サーバーのワークロードで最高のピーク パフォーマンスを提供します。
- ioSphere 管理スイートはクラス最高の機能セットを提供します
- 8k 70/30 および低いキュー深度でのファイル サーバー ワークロードでの最高のスループットと最低のレイテンシ
- 信頼性を高めるアダプティブ フラッシュバックなどの機能を備えた実証済みのアーキテクチャ
デメリット
- Windows と Linux の両方での最大遅延の問題
- 有効キュー深さの最低と最高の間で Micron P320h に劣る
ボトムライン
Fusion-io ioDrive2 Duo SLC アプリケーション アクセラレータは、いくつかのワークロードで 1.2 TB の最速の利用可能なストレージを提供すると同時に、前世代の製品に比べて多くの設計と機能のアップグレードを提供します。そのようなアップグレードの 2 つが Adaptive FlashBack で、複数の NAND ダイ障害が発生した後でもデータを保存し、ドライブの動作を維持します。業界最高の管理ソフトウェアと、新しいコントローラーを必要とせずにドライブを継続的に改善できる機能を組み合わせた ioDriveXNUMX Duo SLC は、優れたストレージ パフォーマンスを活用できる最も重要なアプリケーションに長期的に使用できるでしょう。