EC2 (Elastic Compute Cloud) Web サービスを通じて提供されるさまざまなクラウド サービスに関しては、Amazon がリーダーであることにほとんど疑いの余地はありません。比較的シンプルなプロビジョニング プロセスと、インスタンスとストレージのニーズを簡単に増減できる機能を備えた EC2 は、コスト効率の高い価格帯でクラウドのすべての機能を提供することを目指しています。ただし、一部の人にとって、クラウドは柔軟性と導入の容易さだけを意味するものではありません。それはパフォーマンスに関するものです。分析などの重要なアプリケーションのために強力な環境を稼働または稼働停止できることによるビジネス上のメリットは、多くの場合、長期的な設備投資ではなく、運用コストを通じてそうするコストを大幅に上回る可能性があります。この目的を達成するために、Amazon は 3 月に、基盤となるサーバーの CPU およびメモリ リソースへの直接アクセスを提供する iXNUMX ベアメタル インスタンス ファミリを一般提供しました。
EC2 (Elastic Compute Cloud) Web サービスを通じて提供されるさまざまなクラウド サービスに関しては、Amazon がリーダーであることにほとんど疑いの余地はありません。比較的シンプルなプロビジョニング プロセスと、インスタンスとストレージのニーズを簡単に増減できる機能を備えた EC2 は、コスト効率の高い価格帯でクラウドのすべての約束を提供することを目指しています。ただし、一部の人にとって、クラウドは柔軟性と導入の容易さだけを意味するものではありません。それはパフォーマンスに関するものです。分析などの重要なアプリケーション用に強力な環境を稼働または稼働停止できることによるビジネス上のメリットは、多くの場合、長期にわたる CAPEX 投資ではなく、OPEX を通じてそうするコストを大幅に上回る可能性があります。この目的を達成するために、Amazon は 3 月に、基盤となるサーバーの CPU およびメモリ リソースへの直接アクセスを提供する iXNUMX ベアメタル インスタンス ファミリーを一般提供しました。
i3.metal インスタンスは、AWS が構築したハードウェア オフロードおよびサーバー保護コンポーネントのコレクションである Nitro システム上に構築されており、「高性能のネットワーキングとストレージ リソースを EC2 インスタンスに安全に提供します」。 i3.metal インスタンスは、このレビューの一環として活用した Elastic Block Store (EBS) など、AWS クラウドが提供する他のサービスもすべて利用します。これらのインスタンスには、最大 15.2 TB の NVMe SSD ベースのインスタンス ストレージのほか、2.3 のハイパースレッド コア(36 論理プロセッサ)と 72 GiB のメモリを提供する 512 GHz Intel Xeon プロセッサも備えています。ファブリック側では、i3.metal インスタンスは最大 25 Gbps の総ネットワーク帯域幅を提供し、Elastic Network Adaptor(ENA)ベースの拡張ネットワーキングを介して高いネットワーク スループットと低いレイテンシを実現します。
EC2 内には、多数のインスタンス タイプがあります。 i3 インスタンスは「ストレージ最適化」カテゴリに分類され、i3.metal インスタンスがそのグループの中で最高のパフォーマンスを発揮します。以下の表は、インスタンス タイプのファミリーと構成を示しています。
モデル | vCPU | メモリ(GiB) | ネットワーキングパフォーマンス | ストレージ (TB) |
i3.large | 2 | 15.25 | 最大10ギガビット | 1×0.475 NVMe SSD |
i3.xlarge | 4 | 30.5 | 最大10ギガビット | 1×0.95 NVMe SSD |
i3.2xlarge | 8 | 61 | 最大10ギガビット | 1×1.9 NVMe SSD |
i3.4xlarge | 16 | 122 | 最大10ギガビット | 2×1.9 NVMe SSD |
i3.8xlarge | 32 | 244 | 10ギガビット | 4×1.9 NVMe SSD |
i3.16xlarge | 64 | 488 | 25ギガビット | 8×1.9 NVMe SSD |
i3.メタル | 72 | 512 | 25ギガビット | 8×1.9 NVMe SSD |
i3.metal インスタンスは、AWS 米国東部 (バージニア北部)、米国東部 (オハイオ)、米国西部 (オレゴン)、欧州 (フランクフルト)、および欧州 (アイルランド) リージョンで利用でき、オンデマンド インスタンスとして購入できます。リザーブド インスタンス (3 年間、1 年間、およびコンバーチブル)、またはスポット インスタンスとして。このレビューの目的で、ノースバージニア地域でテストしました。 NVMe ストレージと EBS ブロック ボリュームの両方でテストしました。
パフォーマンス
VDBench ワークロード分析
EC2 i3.metal インスタンスのパフォーマンスを評価するために、ローカルにインストールされた VDBench を利用して、EBS (30x1TB) と NVMe (8x1.7TB) ストレージの両方をテストしました。どちらのストレージ タイプでも、各デバイスの 12% を割り当て、それらをまとめてグループ化し、適度な量のデータの局所性を備えたピークのシステム パフォーマンスを調べました。
これらのワークロードは、「4 コーナー」テスト、一般的なデータベース転送サイズ テスト、さまざまな VDI 環境からのトレース キャプチャに至るまで、さまざまなテスト プロファイルを提供します。これらのテストはすべて、スクリプト エンジンを備えた共通の vdBench ワークロード ジェネレーターを利用して、大規模なコンピューティング テスト クラスターの結果を自動化して取得します。これにより、フラッシュ アレイや個々のストレージ デバイスを含む幅広いストレージ デバイスにわたって同じワークロードを繰り返すことができます。
プロフィール:
- 4K ランダム読み取り: 100% 読み取り、128 スレッド、0 ~ 120% の読み取り
- 4K ランダム書き込み: 100% 書き込み、64 スレッド、0 ~ 120% の書き込み
- 64K シーケンシャル読み取り: 100% 読み取り、16 スレッド、0 ~ 120% の iorate
- 64K シーケンシャル書き込み: 100% 書き込み、8 スレッド、0 ~ 120% iorate
- 合成データベース: SQL および Oracle
- VDI リンク クローン トレース
このレビューでは、EBS と NVMe の両方について検討します。パフォーマンスに劇的な違いがあるため、結果を 2 つのグラフに分けました(レイテンシが離れすぎているため、グラフを読むのが非常に困難になります)。
最初のテストでは 4K ランダム読み取りを調べます。ここで、EBS インスタンスは最後までミリ秒未満のレイテンシ パフォーマンスを示しました。ちょうど約 64 IOPS の時点で、レイテンシーが 59.46 ミリ秒まで急上昇し、パフォーマンスは 64,047 IOPS になりました。
NVMe 4K ピークのランダム読み取りを見ると、インスタンスのパフォーマンスが大幅に向上していることがわかります。インスタンスのピークは 2,802,904 IOPS、レイテンシーは 348μs でした。
EBS を使用した 4K ランダム書き込みでは、EBS を使用した 4K 読み取りとほぼ同じ結果が得られました。インスタンスは少し早く 1 ミリ秒、約 60 IOPS を突破し、レイテンシ 64,003 ミリ秒で 29.97 IOPS に達しました。
NVMe バージョンのインスタンスの場合、レイテンシが少し急上昇しましたが、それでも 1 ミリ秒未満でした。インスタンスのピークは 920,975 IOPS、レイテンシは 545 μs でした。
順次テストに切り替えると、EBS 64K のピーク読み取りパフォーマンスでは、インスタンスは約 70K IOPS (約 450MB/s) まではミリ秒未満のレイテンシーでしたが、17,360ms のレイテンシーで 1.08 IOPS (27.65GB/s) でピークに達しました。
NVMe を使用した 64K シーケンシャル読み取りでは、レイテンシ 244,037μs で 15.25 IOPS または 514GB/s のピーク パフォーマンスが得られました。
EBS を使用した 64K 書き込みでは、インスタンスは 1ms を超えて開始され、レイテンシー 17,359ms で 1.08 IOPS または 13.8GB/s でピークに達しました。
64K シーケンシャル書き込みは、NVMe インスタンスが 1 ミリ秒を超えた初めての例です。インスタンスのピークは 58,572 IOPS または 3.66GB/秒で、レイテンシは 1.08 ミリ秒でした。
SQL ワークロードに切り替えると、EBS インスタンスは約 55 IOPS まではミリ秒未満のレイテンシ パフォーマンスを示し、レイテンシ 64,036 ミリ秒で 14.93 IOPS に達しました。
NVMe バージョンのインスタンスでは、SQL テストで 834,231μs のレイテンシで 302 IOPS のピーク パフォーマンスが確認されました。
EBS を使用した SQL 90-10 の場合、インスタンスは 1 IOPS 付近で 55 ミリ秒のレイテンシを再び突破し、64,036 ミリ秒のレイテンシで 14.99 IOPS でピークに達しました。
SQL 90-10 のインスタンスの NVMe バージョンのピーク パフォーマンスは 605,150 IOPS、レイテンシは 415μs でした。
EBS を使用した SQL 80-20 もほぼ同じ数値を示し、ミリ秒未満のレイテンシーは約 55 IOPS で終わり、ピークでは 64,036 IOPS で 14.93 ミリ秒のレイテンシーでした。
NVMe を搭載した SQL 80-20 のインスタンス ヒット数は 511,840 IOPS、レイテンシは 493μs でした。
Oracle の EBS テストでは、ほぼ同じ数値の奇数のピーク パフォーマンスが示されました。 Oracle の場合、インスタンスは 64,036 IOPS に達し、レイテンシーは 13.6 ミリ秒でした。このインスタンスは、約 55 IOPS まで、ミリ秒未満のレイテンシ パフォーマンスを実現しました。
NVMe を使用したインスタンスは、Oracle テストで 457,372μs のレイテンシーで 613 IOPS に達しました。
Oracle 90-10 では、EBS インスタンスのピークは 64,035 IOPS、遅延は 10.3 ミリ秒でした。インスタンスは約 1 IOPS で 55 ミリ秒を中断しました。
Oracle 90-10 のインスタンスの NVMe バージョンは、レイテンシ 520,448μs で 333 IOPS に達することができました。
Oracle 80-20 では、EBS は 1 IOPS 付近で 55 ミリ秒を超え、64,036 IOPS でピークに達し、遅延は 10.3 ミリ秒でした。
NVMe を使用したインスタンスのピーク パフォーマンスは 435,265 IOPS、レイテンシは 400 μs でした。
次に、VDI リンク クローン (LC) テストを見ていきます。ブート以降、インスタンスの EBS バージョンのレイテンシーは約 35 IOPS まではミリ秒未満で、ピークに達したときは 42,893 IOPS、レイテンシーは 11.2 ミリ秒でした。
VDI LC ブート テストでは、インスタンスの NVMe バージョンは 349,799 IOPS と 363μs のレイテンシでピークに達することができました。
VDI LC の初期ログインでは、EBS インスタンスは、1K IOPS 付近で低下するまで、しばらく 31 ミリ秒のラインをまたいでいました。インスタンスのピークは 34,486 IOPS、遅延は 6.95 ミリ秒でした。
VDI LC 初期ログインでは、NVMe インスタンスは 93,405μs のレイテンシーで 677 IOPS に達しました。
VDI LC Monday Login では、EBS インスタンスはしばらく 1ms を維持していましたが、25 IOPS 付近で急激に変化し、レイテンシ 34,643ms で 13.85 IOPS のピークに達しました。
最後に、NVMe を使用した VDI LC 月曜日のログインでは、インスタンスのピークは 119,615 IOPS、遅延は 1.1 ミリ秒でした。
まとめ:
Amazon のクラウド サービスは一般に、最も多用途であると考えられています。コンピューティングとストレージは確かに多様ですが、Amazon にはパフォーマンスのオプションもあります。 Amazon は、i2 ベアメタル インスタンスを含む、EC3 Web サービスで多数のパフォーマンス オプションを提供しています。これらのインスタンスは、専用のハードウェアとソフトウェアの AWS Nitro システムを活用します。 i3.metal インスタンスは、CPU とメモリへの直接アクセスによってパフォーマンスを向上させながら、AWS EBS 接続ストレージやローカル NVMe ストレージなどの他の機能をユーザーに利用できるようにします。
パフォーマンスに関しては、ブロック ストレージ (EBS) と NVMe の両方をテストしました。これは、読者にオプションの観点から何が期待できるかを示し、一方が他方よりも優れているという考えを提供することを目的としています(通常、NVMe ストレージはパフォーマンスが高く、レイテンシがはるかに低いため、グラフが 1 セットあるのです)。 EBS を見ると、インスタンスが 64 ミリ秒を超え、その後すぐにレイテンシが増加して終了するパターンが見られました。テスト全体を通して、EBS は EBS に許容される最大値である約 4K IOPS でピークに達しました。これには、64K テストと XNUMX つの SQL テストと Oracle テストすべてが含まれます。 VDI テストではインスタンスが少し遅くなりました。 Amazon は、規定の XNUMXK を超える IOPS を達成するために設定を調整することが可能であることを示していますが、そこに到達するためのプロセスは、ほとんどの顧客が経験するものではないため、この方法を追求しませんでした。
NVMe テストでは、通常のベンチマークとより一致した結果が得られました。ここでのハイライトには、4 つのテストすべてで 2.8 万 IOPS のランダム 4K 読み取りパフォーマンス、920K IOPS の 64K 書き込み、15.25GB/秒の 500K 読み取り、および 834K IOPS を超える SQL パフォーマンスが含まれます (SQL テストは約 435K IOPS)。 Oracle のテストでも NVMe で優れた結果が得られ、結果は 520 IOPS ~ 350 IOPS でした。 VDI リンク クローンは、約 3K IOPS という強力なブート パフォーマンスを示しました。ここで唯一残念なのは、顧客が iXNUMX.metal インスタンスでよりローカルな NVMe を選択できないことです。
全体として、i3.metal インスタンスは、Amazon が約束したものを正確に提供してくれました。これは、約束されたサービス レベルが受けられるか知りたい顧客にとっては安心できるものです。もちろん、これにはコストがかかります。どのようなクラウド展開でも同様です。懸念されるのは、クラウド、他のクラウド プロバイダー、オンプレミスにおける使いやすさとその結果です。とはいえ、低い IOPS レベルでも対応できるワークロードを抱えているお客様は、かなりの費用を節約できます。ただし、実際には、特定のインスタンスに対する最終的な要件が何であるかによって決まります。そのため、i3.metal インスタンスは、i3.metal が提供するパフォーマンス制限を超えない、または超えることができず、オンプレミスのオールフラッシュ アレイが提供する IOPS を必要としないメインストリーム アプリケーションに最適です。実例。また、すでに Amazon ファミリーに属している場合は、ベアメタルへの移行はよく知られており、複数の AWS プログラムを一括して使用することでコスト面でのメリットが得られる可能性があります。
StorageReview ニュースレターにサインアップする