インテルが発売したのは、 Optane DC 永続メモリ モジュール 揮発性 DRAM と高性能 SSD の間のギャップを埋める方法として、2019 年の春に発表されました。 200 年余り後、Intel は Intel Optane Persistent Memory 200 シリーズ (略して Optane PMem XNUMX) のプラットフォームを構築しました。新しいモジュールは新しいものに合わせて最適化されています。 第 3 世代インテル Xeon スケーラブル プロセッサーIntel SSD との組み合わせは、非常にプラットフォーム的な役割を果たします。 PMem 200 は、Gen32 よりも 1% 多いメモリ帯域幅を実現するといわれています。これは素晴らしい向上であり、このレビューでテストすることになります。
インテルが発売したのは、 Optane DC 永続メモリ モジュール 揮発性 DRAM と高性能 SSD の間のギャップを埋める方法として、2019 年の春に発表されました。 200 年余り後、Intel は Intel Optane Persistent Memory 200 シリーズ (略して Optane PMem XNUMX) のプラットフォームを構築しました。新しいモジュールは新しいものに合わせて最適化されています。 第 3 世代インテル Xeon スケーラブル プロセッサーIntel SSD との組み合わせは、非常にプラットフォーム的な役割を果たします。 PMem 200 は、Gen32 よりも 1% 多いメモリ帯域幅を実現するといわれています。これは素晴らしい向上であり、このレビューでテストすることになります。
背景として、私たちは PMem について事前に広範な取材を行ってきました。この反復は最初の反復とそれほど変わっていないため、以前の作業のほとんどは、アーキテクチャーや利点などの点で現在でも非常に重要です。 PMem を使いこなす必要がある場合は、次の点を参考にしてください。
- ポッドキャスト #60: クリスティ・マン、Intel Persistent Memory
- Intel OptaneDC永続メモリ NoSQL パフォーマンスのレビュー
- Supermicro スーパーサーバーと Intel Optane DC 永続メモリのファーストルックレビュー
- インテルが説明する PMem 200 と DAOS の利点
このレビューでは、テクノロジーの優れた組み合わせをまとめました。ハードウェア面では、PMem 200 モジュールと最新の Xeon スケーラブル CPU を十分に装備したインテル OEM ボックスがあります。私たちは、永続メモリ モジュールを最大限に活用するための専用ソフトウェアである MemVerge メモリ マシン v1.2 を最上位に重ねました。
インテル Optane パーシステント メモリー 200 シリーズの新機能
200 シリーズの利点のほとんどは、第 3 世代インテル Xeon スケーラブル プロセッサーの向上に関連しています。明らかにメモリ帯域幅のスループットが最大の違いであり、PMem 200 は 3,200 MT/s のサポートを獲得しています。ただし、絶対的なパフォーマンスに関連した利点が他にもいくつかあります。
以前のバージョンのコア数は 8 ~ 28 コアでしたが、200 シリーズでは 16 コアから始まり、最大 40 コアになります。最初の PMem では、ユーザーは 3 TB の PMem を追加して、ソケットあたりの合計メモリが 4.5 TB になりました。合計はソケットあたり 6TB で、4TB の PMem 200 が追加されます。最大熱設計電力は 18W から 15W に低下しました。最新の永続メモリには、拡張非同期 DRAM リフレッシュである eADR が付属しています。
PMem 100 と 200 のパフォーマンスの違い (512GB)
PMem | インテル・オプタン | インテル Optane 200 |
耐久性 100% 書き込み 15W 256B | 300PBW | 410PBW |
耐久性 100% 書き込み 15W 64B | 75PBW | 103PBW |
帯域幅 100% 読み取り 15W 256B | 5.3GB /秒 | 7.45GB /秒 |
帯域幅 100% 書き込み 15W 256B | 1.89GB /秒 | 2.60GB /秒 |
帯域幅 100% 読み取り 15W 64B | 1.4GB /秒 | 1.86GB /秒 |
帯域幅 100% 書き込み 15W 64B | 0.47GB /秒 | 0.65GB /秒 |
インテル Optane パーシステント メモリー 200 シリーズの仕様
互換性のあるプロセッサー | 3 ソケット プラットフォーム上の第 4 世代 Intel Xeon スケーラブル プロセッサ | |||||
フォームファクター | 永続メモリモジュール | |||||
SKU | 128 GB | 256 GB | 512 GB | |||
ユーザー容量 | 126.7 GB | 253.7 GB | 507.7 GB | |||
MOQ | 4 | 50 | 4 | 50 | 4 | 50 |
テクノロジー | Intel Optane Technology | |||||
限定保証 | 5年 | |||||
AFR | ≤0.44 | |||||
耐久性 100% 書き込み 15W 256B | 292PBW | 497PBW | 410PBW | |||
耐久性 67% 読み取り; 33% 書き込み 15W256B |
224PBW | 297PBW | 242PBW | |||
耐久性 100% 書き込み 15W64B |
73PBW | 125PBW | 103PBW | |||
耐久性 67% 読み取り; 33% 書き込み 15W64B |
56PBW | 74PBW | 60PBW | |||
帯域幅 100% 読み取り 15W256B |
7.45 GB / sの | 8.10 GB / sの | 7.45 GB / sの | |||
帯域幅 67% 読み取り。 33% 書き込み 15W256B |
4.25 GB / sの | 5.65 GB / sの | 4.60 GB / sの | |||
帯域幅 100% 書き込み 15W256B |
2.25 GB / sの | 3.15 GB / sの | 2.60 GB / sの | |||
帯域幅 100% 読み取り 15W64B |
1.86 GB / sの | 2.03 GB / sの | 1.86 GB / sの | |||
帯域幅 67% 読み取り。 33% 書き込み 15W64B |
1.06 GB / sの | 1.41 GB / sの | 1.15 GB / sの | |||
帯域幅 100% 書き込み 15W64B |
0.56 GB / sの | 0.79 GB / sの | 0.65 GB / sの | |||
DDR周波数 | 3200 MT / s | |||||
最大TDP | 15W | 18W | ||||
温度(最高) | 媒体温度 ≤ 83°C (シャットダウン時 85°C、デフォルト 83°C) | |||||
温度 (周囲温度) | 48°C @ 2.4m/s (12W) | |||||
温度 (周囲温度) | 43°C @ 2.7m/s (15W) | |||||
メムバージ管理
MemVerge Memory Machine v1.2 は引き続き活用します 元のレビューで見たのと同じ GUI。 Global Dashboard は、ほとんどの GUI が CPU、メモリ、ストレージ、ネットワークなどに注目するのに対し、DRAM と PMem に重点を置くことで他と区別しています。 IO 集中型のアプリケーションの場合、複数のシステムにわたるストレージの使用状況を示すダッシュボードが役立つ場合があります。メモリ中心のアプリケーションの場合、Memory Machine Global Dashboard は、複数のサーバーにわたるメモリ使用量、ノード ステータス、イベント、アラートを視覚化する独自の機能を提供します。
これに重点を置いているため、テスト中やほとんどのユーザーがこのテクノロジーを活用しているときに、DRAM と PMem の帯域幅を監視できます。 DRAM および PMEM の使用状況データは、システム管理者がパフォーマンスのチューニングとデバッグに必要なワークロードの動作を理解するのに役立ち、サイジングを決定するためのガイドとなります。たとえば、管理者は、ワークロードがメモリ使用量のピークに達したとき、またはメモリの割り当てと割り当て解除が定期的に行われている場合に、一定のメモリ使用量を確認できます。これは、OOM が原因でアプリケーションがクラッシュした場合に特に重要です。管理者はメモリ使用量データを確認して、メモリ使用量がいつ発生したかを正確に特定できます。
[インスタンス] タブの下に、Redis インスタンスとその概要が表示されます。
MemVerge Memory Machine 管理インターフェイスは、さまざまな使用例を通じて管理者を支援します。
クラッシュ リカバリ – スナップショット GUI は、データベースを迅速に復元したり、原因をトラブルシューティングしたりするために使用されます。データベース ログとメモリ マシン ダッシュボード データによってクラッシュ時刻が特定されるため、管理者はクラッシュ時刻に最も近いスナップショットを選択して復元できます。開発者は、復元されたインスタンスをデバッグに使用できます。
メモリ DVR によるアニメーションと VFX の高速化 – アーティストは、Maya のベース シーンでさまざまなオプションを検討したいと考えています。ベース シーンをロードし、変更を適用して、別のプロジェクトとして保存します。多くの個別のシーンを保存できますが、これらのオプションを表示するには、繰り返しリロードする必要があり、時間がかかります。 Memory DVR 機能を使用すると、ベース シーンを 1 回ロードし、基本スナップショットとしてスナップショットを取得し、変更を適用して別のスナップショットを取得できます。別の効果を適用するには、スナップショットを復元し、編集して、別のスナップショットを作成するだけです。メモリ内のスナップショットの復元速度は数秒ですが、ストレージからシーンを再ロードする場合は数分かかります。
メモリ DVR によるゲノム分析の加速 – 科学者は、さまざまなパラメーター設定を使用して機械学習アルゴリズムを実験したいと考えています。データをロードし、パラメータを設定し、アルゴリズムを実行して、結果をチェックアウトします。結果が良くない場合は、データが再ロードされ、別のパラメータのセットが適用され、アルゴリズムが再度実行されます。 Memory DVR 機能を使用すると、データを一度ロードしてスナップショットを撮ることができます。その時点から、結果が良くない場合は、ベース データを復元し、新しいパラメータを使用した別の実行が数秒で完了します。
インテル Optane パーシステント メモリ 200 シリーズ 性能
PMem はブロック ストレージとしてテストできます (これまでにもテストしました)。PMem の本当の利点は、適切なソフトウェアを使用してバイト レベルで活用できることに現れます。多くの場合、SAP などのアプリケーション開発者は、PMem を利用できるようにアプリケーションを調整します。一部のアプリケーションではこれで機能しますが、別のオプションもあります。 PMem 200 が提供するパフォーマンスと永続性の利点をすべて企業が活用できるように、ゼロから構築されたソフトウェア デファインド ソリューションを活用します。この最新世代の PMem をテストするために、それがまさに私たちが行ったことです。
MemVerge は、永続メモリの活用に関して最も包括的な製品の 1 つを提供します。を見てみましょう MemVerge メモリ マシン 今年の初めに。 MemVerge は、新しい Xeon CPU、PMem 200、およびインテルがリリースしたすべての新しいストレージを活用するためのソフトウェアのアップデートをリリースしました。 MemVerge メモリー マシンは v1.2 になり、いくつかの新しい利点が追加されました。最初の 200 つは、第 XNUMX 世代インテル Xeon スケーラブル プロセッサーのサポートとインテル Optane パーシステント メモリー XNUMX シリーズのサポートです。
Memory Machine v1.2 は Linux 上の Microsoft SQL Server のサポートを提供しており、同じメモリコストで OLTP のパフォーマンスを 1.2 倍にできるとのことです。また、VM ごとの DRAM:PMEM 比率を動的に調整することで、KVM ハイパーバイザーもサポートされるようになりました。 Redis や Hazlecast などのインメモリ データベース クラスターには、調整されたインメモリ スナップショットを備えた HA が搭載されています。そして最後に、vXNUMX では、データセンター全体の DRAM と PMem のメモリ管理が集中化されました。
Ice Lake プラットフォーム – インテル OEM サーバー
- 2 x Intel Xeon Platinum 8380 @ 2.3GHz 40 コア
- 16×32GB DDR4 3200MHz
- 16 x 128GB Intel Persistent Memory 200 シリーズ
- ブートSSD: Intel 1TB SATA
- データベースSSD: インテル P5510 7.68TB
- OS:CentOS8.3.2011
カスケード レイク プラットフォーム – Supermicro SYS-2029U-TN24R4T
- 2 x Intel Xeon Platinum 8270 @ 2.70GHz 26 コア
- 12×16GB DDR4 192GB
- 12 x 128GB Intel Persistent Memory 100 シリーズ
- ブートSSD: 1TB SATA SSD
- OS CentOS 8.2.2004
Optane と MemVerge Memory Machine はどちらも、インメモリ アプリケーションでより適切に活用されます。当社のベンチマークは通常、IT 運用中に実際に見られるような、通常から高ストレスのワークロードとみなされます。代わりに、ここではいくつかの異なるテストを見ていき、特に DRAM 対 PMem 対 DRAM + PMem などのことと、それぞれがどのように影響を受けるかを見ていきます。このレビューでは、KDB パフォーマンスの一括挿入と読み取りテストの両方に加え、ZeroIO スナップショットを使用した Redis Quick Recovery と ZeroIO スナップショットを使用した Redis Clone を使用します。
KDB パフォーマンス テスト
Kx の kdb+ は、時系列のインメモリ データベースです。その速度と効率性で知られており、そのため金融サービス業界で非常に人気があります。 kdb の大きな制約の 10 つは、DRAM 容量の制限です。 MemVerge メモリ マシンはここに完全に適合するため、kdb は PMem を最大限に活用して、DRAM と同様のパフォーマンスでメモリ領域を拡張できます。バルク挿入テストでは、単一のインサート、100、1000、および XNUMX 個のインサートを調べ、XNUMX 秒あたり数百万件のバルク挿入を測定しました。ここでは、DRAM と DRAM 階層化を備えたメモリ マシンのみを見ていきます。
KX kdb+ バルクでは、Cascade Lake と Ice Lake の両方を検討しています。結果はミリオンレコード/秒 (MR/s) で記録されます。 Cascade Lake から始めて、あるバッチでは 142 つすべてがほぼ同じでした。上昇し始めると、DRAM は約 1000 MR/s のピークに達するまで前進しました。 DRAM 階層化を備えた MM は XNUMX バッチ マークに追いつきました。
Ice Lake での同じテストは、ほぼ同じように始まります。10 つのバッチでは両方がほぼ同等であることがわかり、100 バッチでは DRAM と DRAM 階層化を使用した MM は同じですが、DRAM 階層化を使用した 333 MM では、今回は 500 MR/ で優位に立っています。 s.この 1000 つは、3.5 バッチで XNUMX MR/s に戻ります。これは、カスケード湖の頂上の XNUMX 倍以上です。
次に、読み取りテストで kdb+ を調べました。ここでのテスト設定は少し異なります。読み取りテストは全体で同じですが、今回は DRAM のみを調べ、次にいずれかの 40GB DRAM 階層化を備えたメモリ マシンを調べました。 Xeon Gen 2 では、DRAM のみが 4.22GB/s に達することができましたが、40G DRAM 階層化を備えた MM は 4.83GB/s に達しました。
新しいプロセッサーで同じテストを行ったところ、DRAM では 5.13GB/s、9.77G DRAM 階層化を備えた MM ではなんと 40GB/s という結果が得られました。
まとめ
新しいプロセッサーには、新しい PMem、インテル Optane パーシステント メモリー 200 シリーズが付属しています。同社は既存の製品を採用し、最も効果的な部分に改良を加えました。同社は、最大 32 個のコアと 40MT/s のサポートにより、オリジナルと比べてパフォーマンスが 3200% 向上すると主張しています。モジュールの容量は前バージョンと同じ 128GB、256GB、512GB ですが、Intel はユーザーがソケットごとにモジュールを追加して、合計 RAM フットプリントを 6TB にできるようにしました。新しい PMem をテストするために、私たちは MemVerge と新しくリリースされた Memory Machine v1.2 と協力しました。
MemVerge Memory Machine v3 を活用した新しい Intel Xeon Gen1.2 プラットフォームのアプリケーション テストでは、前世代の Intel Xeon プラットフォームと比べて大きな向上が見られました。単一、10、100、または 1000 バッチの一括挿入の速度を測定する Kdb+ 書き込みテストでは、トップスペックに近い Gen3 プラットフォームと比較して、Gen2 Xeon プラットフォーム全体からの大幅な向上が測定されました。ピーク時の 1000 バッチ挿入では、Xeon Gen142 では約 2 億 500 万レコード/秒 (MR/秒) と、Xeon Gen3 では 3.5 MR/秒という、40 倍もの大きな差が見られました。 Kdb+ 読み取りテストでは、メモリ マシン + Pmem + 4.83GB DRAM 階層化を比較し、Xeon Gen2 では 3GB/s を測定しましたが、Xeon Gen9.77 では XNUMXGB/s という驚異的な数字にスケールアップしました。
MemVerge でのテストでわかったように、全体として、新しい Intel Xeon Gen3 リリースと Intel Optane Persistent Memory 200 シリーズには気に入った点がたくさんあります。インテル プラットフォームへの最大の変更には、より高速なプロセッサー、より高速な DRAM、および Gen4 PCIe サポートが含まれますが、適切なアプリケーションを備えたインテルの PMem 200 は、多くのミッションクリティカルなユースケースの方程式を実際に変えることができます。 PMem とネイティブに対話する SAP HANA のようなアプリケーションは、これらすべてのインテル テクノロジーに喜んでアクセスできるようになります。 PMem 200 を活用したいと考えている他のすべての人のために、MemVerge は簡単な導入の道を提供します。
StorageReview と連携する
ニュースレター | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSSフィード