Home Enterprise Comino Grando レビュー – 水冷 GPU のパワーハウス

Comino Grando レビュー – 水冷 GPU のパワーハウス

by ライル・スミス

Comino Grando 液冷システムの強力なパワーにより、全負荷時でも GPU パフォーマンスが損なわれないことが保証されます。

Comino について詳しくない方のために説明すると、Comino は水冷サーバーの分野でニッチ市場を開拓し、多用途で効率的なワークステーションとサーバーを開発した会社です。このレビューでは、Comino Grando の主力システムである Comino Grando サーバーとワークステーションを検討します。これらのシステムは、19 インチのラックマウント可能なユニットとしても、スタンドアロンのデスクトップとしても機能するように設計されており、ハイパフォーマンス コンピューティングの幅広いニーズに応えます。データ分析、グラフィック デザイン、ゲーム、その他の要求の厳しいタスクのいずれであっても、これらのサーバーはパフォーマンス、信頼性、冷却効率を実現するように構築されています。

Comino Grando 6x NVIDIA 4090 システム

Comino Grando 6x NVIDIA 4090 システム

これらの Grando システムの「クールな要素」を誇張することはできません。パワーとパフォーマンスを発揮し、最先端の液体冷却テクノロジーをシームレスに統合して最適な温度を維持します。これにより、激しいワークロード下でも最高のパフォーマンスが保証され、涼しさが文字通りかつ比喩的な属性となります。冷却プラットフォーム設計により、液体冷却なしでは不可能な GPU 密度も実現します。たとえば、Grando サーバーでは、Comino は 4090 つの NVIDIA XNUMX GPU を並べて取り付けることができますが、これは空冷では不可能です。水冷設計は XNUMX スロット幅ですが、純正の空冷部分は XNUMX 倍の幅です。

サーバーおよびワークステーション モデルは高度にカスタマイズ可能で、強力なマルチコア プロセッサ (AMD Threadripper PRO)、最大 1TB のメモリ構成、大容量ストレージなど、さまざまな選択肢をユーザーに提供します。ユーザーは、NVIDIA RTX A6000 (48GB)、NVIDIA RTX 6000 ADA (46GB)、NVIDIA H100 (80GB)、NVIDIA A100 (80GB)、NVIDIA L40s (48GB) を含む、最大 4090 つの最上位プロフェッショナル GPU を追加するオプションもあります。 NVIDIA RTX 24 (XNUMXGB)。このため、Comino Grando は、パワーと信頼性を約束する堅牢なコンピューティング ソリューションを探している専門家や企業にとって、確かな選択肢となります。

Comino の水冷システム 4090 つをテストする機会がありました。 Grando Server から始めて、私たちの構成には 5995 台の NVIDIA RTX 64 が装備されています。また、AMD の Threadripper PRO XNUMXWX CPU (内部で確認した XNUMX コア プロセッサ) も搭載されています。 Lenovo ThinkStation P620)、512GB DDR5 DRAM、2TB NVMe SSD、および電源障害に対する信頼性を高める冗長性のための 1600 つの XNUMXW PSU を備えています。

Comino から受け取った 100 番目のシステムであるワークステーション イテレーションは、3975 つの NVIDIA A36 プロフェッショナル GPU、Threadripper Pro 64WX プロセッサ (4.2 コア、512 スレッド、ターボ速度最大 5 GHz)、2GB DDRXNUMX DRAM、および XNUMXTB NVMe SSD を特徴としています。これは、ほぼ無音で動作するように設計されています。内部の GPU を考えると衝撃的です。

Comino Grando 水冷 GPU システム

Comino Grando 水冷 GPU システム

上で示したように、5995 つのモデルの主な違いは GPU と CPU の機能にあり、これは対象となるアプリケーション シナリオも異なることを意味します。サーバー モデルの XNUMXWX CPU はコア数が多く、並列処理タスクに適しています。複数のタスクを同時に処理することが重要なサーバー環境のパフォーマンスが大幅に向上します。

対照的に、ワークステーションの 3975WX は依然として強力ですが、コア数が少なく、さまざまなアプリケーション間でバランスのとれたパフォーマンスが必要なワークステーションの使用に合わせています。 GPU の選択により、この 4090 つがさらに区別されます。 RTX 100 はグラフィック レンダリングにおいて最先端であり、激しいグラフィック計算を必要とするタスクに最適です。一方、NVIDIA A40 (それぞれ XNUMX GB のメモリを搭載しており、ディープ ラーニングと科学技術コンピューティング用に調整されています)。

Comino Grando のコンポーネントとビルド

最初の配送事故 (配送トラックからサーバーが落下するという事故がありましたが、私たちのせいではないと断言します!) にもかかわらず、Comino の徹底した梱包により、システムの完全性が損なわれないことが保証されました。この復元力の一部は、そのコンパクトな水冷設計によるもので、本質的に輸送中の損傷のリスクを軽減します。このシステムはコンベンションで披露され、全米の技術専門家によって分析されているため、旅行による消耗は珍しくありません。

Comino Grando 液冷 GPU システムの蓋を取り外した

Comino Grando 6x 4090 (左) と 4x A100 (右)

Grando Server モデルを開梱すると、電源ケーブル、レール、およびメンテナンス用のツールやリソースを含む充填済み冷却システムに関する通知が完備された、よく整理された内部を発見しました。サーバーの前面には 4090 基の RTX XNUMX の印象的なラインナップがあり、ウォーター ブロックによって洗練された効率的なデザインが実現され、それぞれがシングル スロットのフォーム ファクターにまで縮小されています。これらのコンパクトなユニットが持つパワーを考えると、このセットアップは確かに興味深いものです。

Comino Grando サーバー背面

Comino Grando サーバー背面

どちらのモデルもほぼ同じケースを使用しています。内部的には、冷却構成を除けば実質的に同じに見えます。特に明記されていない限り、レイアウト部分のサーバーの反復に焦点を当てます。フロント パネルの接続には、サウンド システムを直接統合するためのオーディオ入出力ジャック、周辺機器接続用の複数の USB ポート、さまざまなデバイスへの接続を可能にするネットワーク ポートなどの追加の I/O オプションが含まれています。どちらのモデルも、メンテナンスとユーザー インタラクションのための簡単なアクセスを重視しており、高性能コンピューティング ハードウェアに対する Comino の設計哲学と一致しています。

サーバーのフロント パネルの左端には LED ディスプレイがあり、ポンプ、気温、冷却剤の温度、ファン速度などの情報を含む、さまざまな有用なテレメトリ データが表示されます。メニューの操作は、冷却モジュールの点灯ボタンによって簡単に行え、短く (2 秒未満) 押すと情報がスクロールします。 PB2 を長押し (2 秒以上) すると、コマンド、サービス (設定)、イベント ログなどの追加のメニュー ブランチにアクセスでき、設定やシステム診断をさらに制御できます。全体的にインターフェースは直感的で、簡単にナビゲートできるメニューがバックライト付きボタンで強化されており、操作が簡単です。

Comino Grando 水冷 GPU システム ディスプレイ

Comino Grando 水冷 GPU システム テレメトリ ディスプレイ

トップパネルを開けると、まず目に飛び込んでくるのはやはり洗練された統一感のある液体チューブです。また、シャーシ内の GPU と SSD を収容する領域にまたがるサポート バーにも惹かれました。これにより、輸送中の敏感なコンポーネントの動きが大幅に軽減され、良好な状態で到着することが保証されます。

Comino Grando 6x 4090 システムの内部

Comino Grando 6x 4090 システムの内部

システムの中心には大きな配水ブロックがあり、冷たい液体と戻り経路の両方を提供します。これらはすべて液滴のないクイックディスコネクトカップリングで接続されており、コミノの高い技術力がにじみ出ています。

Comino Grando 6x 4090 マニホールド

Comino Grando 6x 4090 マニホールド

Grando サーバー内の 4090 基の NVIDIA RTX 100 GPU は、独自の Comino コールド プレートに収められており、各ユニットを効果的に冷却しながらサーバー内のスペースを最大限に活用できるように非常にコンパクトに配置されています。ワークステーション モデルは、XNUMX つの NVIDIA AXNUMX GPU を利用します。

Comino Grando 4x A100 マニホールド

Comino Grando 4x A100 マニホールド

どちらも、保持ブレースを使用してサーバー内に垂直に固定されています。これにより、GPU が安定して調整され、移動中の構造的完全性が維持されます。

Comino Grando GPU コールド プレート

Comino Grando GPU コールド プレート

外観をよくするために GPU を取り外してみると、それぞれは Comino のカスタム コールド プレート設計を備えた既製のギガバイト NVIDIA RTX 4090 です。カードの重量はかなりの量になりますが、その理由の XNUMX つは、GPU に挟まれた巨大なヒートシンク アセンブリであることは間違いありません。

配水ブロックに戻る各カードの取り付け部分は無滴接続であるため、どこにでも液体が漏れることなく、サービスのためにカードを取り外すことができます。嵌合面には最小限の残留物がありますが、システムから取り外した後はそれだけです。

同じフィッティングが配電ブロックにもあります。

CPU と電圧レギュレータには、冷却ホースに直接接続されたコールド プレートがあり、冷却を保ち、激しいワークロード時のボトルネックを回避します。 CPU の両側には、合計 512GB の DRAM スロットがフル装備されています。

Comino Grando CPU コールド プレート

Comino Grando CPU コールド プレート

どちらのシステムも熱を逃がすために背面に巨大なラジエーターを備えていますが、2 つのプラットフォームの最大の違いはファンの構成と全体的な騒音です。どちらのシステムも非常に静かですが、ワークステーション構成の方が静かで、ファンのセットアップもそれほど激しくありません。

コミノ グランド ワークステーションのインテリア

Comino Grando 4x A100 ワークステーションのインテリア

デザインに関して言えば、唯一の不満は、I/O ポートが前面に、電源入力が背面に配置されていることです。ラックマウント型データセンター環境では、この設計は課題を引き起こします。既製のマザーボードを使用することで、Comino には非常に多くのオプションしかありません。最終的な結果は、非常によく考えられた設計ではあるものの、多少の煩わしさだけです。

Comino Grando リモート管理

Grafana は Comino Grando サーバーの管理に利用され、ダッシュボードを通じてリアルタイムのデータ視覚化を提供する強力なオープンソース分析および監視ソリューションとして機能します。さまざまなデータ ソースと統合され、アラート、マルチテナント サポート、API アクセスなどの機能を提供するため、システム パフォーマンスの追跡と診断に実用的になります。

一般情報ダッシュボードを見ると、Grafana は熱管理のための冷却液流量、周囲湿度レベル、システム管理 (STM)、電圧レギュレーター モジュール (VRM)、プリント基板 (PCB)。

また、エネルギー消費を監視し、CPU や GPU の消費電力などの個々のコンポーネントの使用状況を表示します。これは、この規模のサーバーを管理するために不可欠です。このインターフェイスは、これらすべての重要な情報を効率的に統合し、簡単に利用できる方法で表示します。これにより、サーバーのパフォーマンスと信頼性が最適なレベルに維持されると同時に、潜在的な問題に先制的に対処するための実用的な洞察が管理者に提供されます。

コミノグランドのスペック

グランドサーバー グランド ワークステーション
CPU スレッドリッパー プロ W5995WX スレッドリッパー プロ 3975WX
ラム RAM 512GB RAM 512GB
GPU 6X NVIDIA RTX 4090 4X A100
PSU 4x 1600w PSU 3x 1000 SFX-L PSU
Storage 2TB NVMe 2TB NVMe

コミノ グランド パフォーマンス

Comino Grando システムの 4.0 つの構成 (サーバーとワークステーション) 間のパフォーマンスを比較するために、レンダリング、計算、データ処理機能など​​、コンピューティング パフォーマンスのさまざまな側面を評価するさまざまなベンチマークを利用しました。ベンチマークには、Blender 7、Luxmark、OctaneBench、Blackmagic RAW Speed Test、XNUMX-zip Compression、および Y-Cruncher が含まれており、それぞれがさまざまなコンピューティング環境におけるこれらのシステムの特定の強みを評価する際の関連性を考慮して選択されています。

ブレンダー4.0

Blender は、モデリング、アニメーション、シミュレーション、レンダリング プロジェクトのための包括的なオープンソース 3D 作成スイートです。 Blender ベンチマークは、複雑なシーンのレンダリングにおけるシステムのパフォーマンスを評価します。これは、視覚効果、アニメーション、ゲーム開発の専門家にとって重要な側面です。このベンチマークは、ハイエンドのグラフィックス処理および計算タスク用に設計されたサーバーおよびワークステーションに関連する CPU および GPU のレンダリング能力を測定します。

Blender 4.0 (XNUMX 分あたりのサンプル数、高いほど優れています) Grando サーバー (TR W5995WX、512GB、6x 4090) Grando ワークステーション (TR 3975WX、512GB、4x A100)
モンスター(CPU) 568.02 334.40
ジャンクショップ (CPU) 386.53 231.90
教室(CPU) 293.91 174.21
Blender 4.0 GPU テスト
モンスター(GPU) 5,880.71 1,656.34
ジャンクショップ(GPU) 2,809.36 1,137.73
教室 (GPU) 2,895.54 953.46

この結果は、Grando Server のレンダリングにおける堅牢なパフォーマンスを強調しています。これは、高性能 CPU と優れた GPU セットアップによるものと考えられます。 Grando ワークステーションも、特に詳細な 3D モデリングとレンダリングを必要とするプロフェッショナルな設定で優れたパフォーマンスを発揮しますが、サーバーの構成はさらに要求の厳しいグラフィックス処理タスク向けに設計されています。パフォーマンスの違いは、サーバーがハイエンドのレンダリング ジョブに対応していることを反映しており、期限が厳しいプロジェクトや複雑なレンダリング ニーズがあるプロジェクトに貴重なツールを提供します。

ラックスマーク

Luxmark は、オープンソースのレイ トレーシング レンダラーである LuxRender を使用して、非常に詳細な 3D シーンを処理する際のシステムのパフォーマンスを評価する GPU ベンチマークです。このベンチマークは、サーバーやワークステーションのグラフィック レンダリング能力を評価するのに適しています。特に、正確な光のシミュレーションが重要な視覚効果や建築視覚化アプリケーションに適しています。

ラックスマーク(高いほど良い) Grando サーバー (TR W5995WX、512GB、6x 4090) Grando ワークステーション (TR 3975WX、512GB、4x A100)
ホールベンチ 240,303 92,156
食物 98,459 27,194

Grando Server のパフォーマンスは、高度な 6x RTX 4090 GPU セットアップのおかげで、その卓越したレイ トレーシング機能を実証しています。 Grando ワークステーションは、詳細なアーキテクチャの視覚化を必要とするタスクに特に有益な実質的な機能を実証しますが、サーバー モデルは、より集中的なレンダリング タスクに向けて設計されています。この違いにより、レイ トレーシングのパフォーマンスを最大化することが不可欠なプロジェクトに対するサーバーの適合性が強調され、レンダリングされたシーンの効率とリアリズムが保証されます。

オクタンベンチ

OctaneBench は、強力で人気のある GPU アクセラレーション レイ トレーシング レンダラーである OctaneRender を使用して、GPU のレンダリング パフォーマンスを評価します。このベンチマークは、レンダリング速度が生産性やプロジェクトのタイムラインに直接影響を与えるコンテンツ作成、アーキテクチャの視覚化、視覚効果におけるサーバーとワークステーションの能力を評価するために重要です。

オクタンベンチ カーネル Grando サーバー (TR W5995WX、512GB、6x 4090) Grando ワークステーション (TR 3975WX、512GB、4x A100)
インテリア 情報チャンネル 275.25 68.05
インテリア 直接照明 826.70 244.65
インテリア パストレース 1,065.47 297.89
アイデア 情報チャンネル 156.00 36.22
アイデア 直接照明 642.48 191.03
アイデア パストレース 785.45 232.82
ATV 情報チャンネル 431.21 73.74
ATV 直接照明 896.54 220.35
ATV パストレース 1,130.18 273.55
ボックス 情報チャンネル 222.37 51.48
ボックス 直接照明 789.55 224.08
ボックス パストレース 885.74 254.17
総得点 8,106.94 2,168.02

Grando Server は OctaneBench テストで優秀であり、GPU アクセラレーションの恩恵を受ける要求の厳しいレンダリング ワークフローに対する優れた適合性を示しています。 Grando ワークステーションは、優れたレンダリング機能を提供しながら、プロフェッショナルな環境でパフォーマンスと多用途性のバランスをとるように最適化されています。このパフォーマンスの違いは、比類のないレンダリング速度を必要とする特殊なタスク向けのサーバーの設計を強調し、より効率的なプロジェクトの完了をサポートします。

Blackmagic RAW スピードテスト

Blackmagic RAW Speed Testは、ビデオ制作および編集におけるサーバーおよびワークステーションにとって重要な要素である、高品質ビデオフォーマットの処理速度を測定します。システムが RAW ビデオ ファイルをどのように管理し、メディア制作環境におけるワークフローの効率と生産性に影響を与えるかを評価します。

Blackmagic RAW スピードテスト Grando サーバー (TR W5995WX、512GB、6x 4090) Grando ワークステーション (TR 3975WX、512GB、4x A100)
8K CPU 132のFPS 135のFPS
8K CUDA 345のFPS 309のFPS

Grando サーバーとワークステーションは、Blackmagic RAW スピード テストで確かなパフォーマンスを示し、CUDA アクセラレーション タスクではサーバーがわずかに上回りました。これは、サーバー モデルのほうが、負荷の高いビデオ編集や処理を伴うワークフロー (特に GPU アクセラレーションの恩恵を受けるワークフロー) でわずかに優れたパフォーマンスを提供することを意味します。ただし、ワークステーションは依然としてビデオ処理タスク用の実質的な機能を提供しており、メディア制作向けにバランスの取れた構築が示されています。

7-zip圧縮

7-zip 圧縮ベンチマークは、大規模なデータセットの管理とストレージの最適化に重要な、データの圧縮と解凍の処理におけるシステムの効率をテストします。このベンチマークは、データ操作の速度と効率が重要となる、データ集約型の操作におけるサーバーとワークステーションのパフォーマンスを反映しています。

7-Zip 圧縮ベンチマーク (高いほど優れています) Grando サーバー (TR W5995WX、512GB、6x 4090) Grando ワークステーション (TR 3975WX、512GB、4x A100)
現在の CPU 使用率 3,379% 3,439%
電流定格/使用法 7.630GIPS 7.094GIPS
定格電流 257.832GIPS 243.994GIPS
結果として生じる CPU 使用率 3,362% 3,406%
結果として得られる評価/使用法 7.697GIPS 7.264GIPS
結果として得られる評価 258.756GIPS 247.396GIPS
解凍中
現在の CPU 使用率 6,015% 6,286%
電流定格/使用法 5.585GIPS 5.434GIPS
定格電流 335.958GIPS 341.599GIPS
結果として生じる CPU 使用率 6,053% 6,269%
結果として得られる評価/使用法 5.603GIPS 5.468GIPS
結果として得られる評価 339.171GIPS 342.766GIPS
総合評価
合計 CPU 使用率 4,708% 4,837%
合計評価/使用状況 6.650GIPS 6.366GIPS
総合評価 298.963GIPS 295.081GIPS

7-zip 圧縮ベンチマークの結果は、Grando サーバーとワークステーションがデータ圧縮および解凍タスクの処理において有能なパフォーマンスを発揮することを示しています。それらのパフォーマンスは、システムが大量のデータを効率的に管理できることを示していますが、それぞれの CPU 構成を反映したわずかな違いがあります。これらの機能は、重要なデータ管理タスクに対するシステムの適合性を強調し、効率的な保管および取得プロセスを保証します。

Yクランチャー

Y-Cruncher は、複雑な数学的演算を処理するシステムの能力をテストし、Pi を数兆桁まで正確に計算する計算ベンチマークです。このベンチマークは、特に集中的な数値計算を必要とする科学研究やシミュレーションで使用されるサーバーとワークステーションの計算能力を示します。

Y-Cruncher (総計算時間) Grando サーバー (TR W5995WX、512GB、6x 4090) Grando ワークステーション (TR 3975WX、512GB、4x A100)
1億桁 11.023秒数 11.759秒数
2.5億桁 28.693秒数 32.073秒数
5億桁 61.786秒数 69.869秒数
10億桁 130.547秒数 151.820秒数
25億桁 353.858秒数 425.824秒数
50億桁 788.912秒数 971.086秒数

Y-Cruncher ベンチマークは、要求の高いタスクに合わせて調整された、Grando Server のわずかに優れた計算能力を明らかにします。 Grando ワークステーションは、幅広い科学および分析アプリケーションに適した十分な計算能力を提供しますが、サーバーは最大の計算パフォーマンスを必要とするシナリオ向けに明示的に最適化されています。これは、複雑なシミュレーションと分析をサポートし、計算タスクのより高速かつ効率的な処理を促進するというサーバーの役割を強調します。

Geekbench 6

Geekbench 6 は、シングルコアとマルチコアの機能およびグラフィック処理能力にわたる CPU と GPU の計算パフォーマンスを測定します。このベンチマークは、シミュレーション、データ分析、グラフィックス レンダリングなどのさまざまなタスクにわたるサーバーとワークステーションの全体的なコンピューティング効率を評価するために不可欠です。

Geekbench 6 (高いほど良い) Grando サーバー (TR W5995WX、512GB、6x 4090) Grando ワークステーション (TR 3975WX、512GB、4x A100)
CPUシングルコア 2,127 2,131
CPUマルチコア 21,621 20,411
GPU 294,894 193,447

Geekbench 6 の結果は、Grando Server と Workstation のイテレーション間の CPU シングルコア パフォーマンスがほぼ同等であることを示しており、シングル スレッド処理に依存するタスクでも同等の効率であることを示しています。ただし、Grando Server は、より複雑な並列処理タスクやより集中的なグラフィック計算を処理できる能力を反映して、マルチコア、特に GPU テストで優れたパフォーマンスを示します。これは、サーバーが堅牢なマルチスレッド アプリケーションとハイエンド グラフィックス処理を必要とする環境に適していることを示しており、コンピューティングとグラフィックスを多用するワークフローの生産性が向上します。

Cinebench R23

Cinebench R23 は、シングルコアとマルチコアのパフォーマンスに焦点を当てて、CPU のレンダリング能力を測定します。これは、コンテンツ作成、3D レンダリング、その他の CPU を大量に使用するタスクにおいてサーバーまたはワークステーションがどの程度パフォーマンスを発揮できるかを評価するための重要なベンチマークです。 MP 比率 (マルチコア パフォーマンス比) は、システムが複数のコアをどの程度効果的に利用しているかについての洞察をさらに提供します。

Cinebench R23 (高いほど良い) Grando サーバー (TR W5995WX、512GB、6x 4090) Grando ワークステーション (TR 3975WX、512GB、4x A100)
CPUマルチコア 73,556 49,534
CPUシングルコア 1,484 1,468
MP比 49.56x 33.75x

ここでは、Grando Server がマルチコア テストで Workstation よりも優れたパフォーマンスを示し、並列処理の恩恵を受ける要求の厳しいレンダリング タスクを処理する優れた機能を示しています。シングルコアの結果のわずかな違いは、複数のコアを必要としないタスクでも同様の効率を示しています。サーバー モデルの MP 比率が高いことは、マルチコアの利用に習熟していることを示しており、レンダリング プロジェクトやシミュレーション プロジェクトにおける複雑なマルチスレッド アプリケーションの処理に熟達しています。

Cinebench 2024

Cinebench 2024 は、従来の CPU ベンチマークとともに GPU パフォーマンスを組み込むことで、2023 年の対応範囲を拡張します。この包括的な戦略は、現在の 3D コンテンツの作成およびレンダリング活動の厳しい要求を管理するシステムの習熟度を評価するために不可欠です。計算およびグラフィック レンダリング機能に関する包括的な視点を提供します。

Cinebench 2024 (高いほど良い) Grando サーバー (TR W5995WX、512GB、6x 4090) Grando ワークステーション (TR 3975WX、512GB、4x A100)
GPU 140,842 52,829
CPUマルチコア 4,430 2,817
CPUシングルコア 90 89
MP比 49.49x 31.73x

Grando Server は、GPU および CPU のマルチコア ベンチマークで優れたパフォーマンスを示し、大量のリソースを使用する複雑なレンダリング タスクの処理に優れていることを示しています。逆に、Grando ワークステーションは、特にサーバー モデルと比較したアーキテクチャと構成を考慮すると、賞賛に値する効率性を示しています。 49.49 つのシステム間の CPU シングルコア スコアが近いことは、マルチコア処理に大きく依存しないタスクの効率が同等であることを示唆しています。最後に、XNUMX 倍の MP 比率スコアは、サーバー モデルがマルチコア構成を最大限に活用できることを強調しており、最適なパフォーマンスと速度を達成するために高い CPU と GPU スループットを必要とする要求の厳しいプロジェクトに最適です。

仮想化デスクトップのパフォーマンス

システム全体のパフォーマンスを調べるベンチマークに加えて、Grando Server システムを仮想化して、それぞれに専用の 4090 GPU を搭載した 2022 つの仮想デスクトップを共有したいと考えました。 Windows Server XNUMX Standard を展開し、各 GPU に XNUMX つずつ、合計 XNUMX つの仮想マシン (VM) をセットアップして、タスクを効率的に分散し、システムの真の機能をテストできるようにしました。

RTX 4090 GPU ごとに VM をセットアップすることで、専用のワークステーションを模倣した分離された環境を作成し、各 GPU のパフォーマンスを集中的に評価できるようになります。以下はPowerShellのパススルー処理です。

この設定は、共有リソースからの干渉なしに各カードのパフォーマンスを個別に評価できるため、マルチ GPU システムの長所と潜在的なボトルネックを特定するのにも便利です。

ラックスマーク

LuxMark ベンチマークの結果は、ホールベンチで 38,599 ~ 40,797 の安定した範囲のスコアを示しています。これは、動作の変動や VM 固有の構成による可能性のあるわずかな変動はあるものの、パフォーマンスに顕著な一貫性があることを示しています。最高スコア (VM1 および VM4) は、食品カテゴリと同様に、要求の厳しいレイ トレーシング タスクに対する RTX 4090 GPU のピーク パフォーマンス能力を示しています。

全体として、これらの結果は、単一の GPU を使用してハイエンド コンピューティング タスクに対する Comino サーバーの機能があり、複数の同時ワークロードにわたってパワーと精度の両方を提供することを示しています。集計スコアをスタンドアロン クライアント システムのパフォーマンスと比較すると、6 つの個別のシステムは非常に優れたパフォーマンスを示しました。単独の結果であるそれぞれ 241,183 および 103,399 に対して、ホールベンチでは 240,303、食品では 92,156 を合計で測定しました。

Grando サーバー (TR W5995WX、512GB、6x NVIDIA RTX 4090) ホールベンチ 食物
集計 241,183 103,399
VM1 40,797 17,370
VM2 38,599 17,415
VM3 40,363 16,898
VM4 40,651 17,129
VM5 40,138 17,111
VM6 40,635 17,476

Cinebench 2024

Cinebench 2024 ベンチマークでは、仮想化環境下で各 GPU が複雑なレンダリング タスクをどのように処理するかを評価できます。利用可能なホスト CPU リソースを各 VM に完全にプロビジョニングしていないため、このワークロードで実際に焦点を当てているのは GPU です。ここでは、クライアント システムの合計 GPU スコアが 183,348 ポイントであるのに対し、合計 GPU スコアは 140,842 ポイントと測定されました。

Grando サーバー (TR W5995WX、512GB、6x NVIDIA RTX 4090)
GPU CPU(マルチコア) CPU(シングルコア) MP比
集計 183,348 pts 2,333 pts 487 pts 4.78x
VM1 31,178 pts 394 pts 82 pts 4.83x
VM2 30,925 pts 392 pts 81 pts 4.81x
VM3 29,406 pts 384 pts 81 pts 4.74x
VM4 30,816 pts 391 pts 81 pts 4.81x
VM5 30,440 pts 386 pts 81 pts 4.76x
VM6 30,583 pts 386 pts 81 pts 4.75x

GPU スコアの範囲は 29,406 ~ 31,178 ポイントであり、高度なパフォーマンスの一貫性が示されています。 CPU マルチコア スコアは 384 ~ 394 ポイントの間で厳密にグループ化されており、対応するシングルコア スコアは 81 ~ 82 ポイントであり、すべての VM にわたって集中的なタスクを効果的に処理するサーバーの能力を示しています。

マルチコアとシングルコアのパフォーマンス比 (MP 比) は 4.74 倍から 4.83 倍までわずかに異なり、マルチスレッド レンダリング タスクにメリットをもたらす処理能力のバランスのとれた配分を反映しています。スコア自体に関しては、全体として、これらの結果は仮想化環境における Comino Grando Server の確かなパフォーマンスを示しており、効率と速度が最優先される要求の厳しい 3D レンダリングや計算タスクに適しています。

ブレンダー4.0

Blender ベンチマーク中、各 VM は、Monster、Junkshop、Classroom の 6 つの異なるシーンにわたって一貫したパフォーマンスを実証しました。 VM5,949 は、Monster シーンで 5 という最高スコアで際立っており、おそらく VM リソースの割り当てやワークロード処理のわずかな違いが原因で、パフォーマンスにわずかな差異があることを示しています。 Junkshop シーンのスコアは比較的近く、VM2,656 が 2 で最も低いスコアを示しています。教室シーンの結果はさらに多様で、VM2,868 が XNUMX という最高スコアを達成しており、ジオメトリが豊富なシーンの処理における違いを示しています。

これらの結果を、Blender でワークロードを拡張できなかった非仮想化サーバーと比較すると、パフォーマンスと使用率がはるかに優れていることがわかります。クライアント システムの最高値は、Monster で 5,881、Junkshop で 2,809、Classroom で 2,896 でしたが、Windows HyperV 導入では合計で、Monster で 34,729、Junkshop で 16,270、Classroom で 16,836 と測定されました。

Blender 4.0 – Grando サーバー (TR W5995WX、512GB、6x NVIDIA RTX 4090)
モンスター ジャンクショップ 教室
集計 34,726 16,270 16,836
VM1 5,773 2,764 2,791
VM2 5,766 2,748 2,868
VM3 5,741 2,716 2,750
VM4 5,828 2,683 2,810
VM5 5,669 2,656 2,837
VM6 5,949 2,703 2,780

まとめ

Comino Grando サーバーおよびワークステーションは、GPU 駆動のパフォーマンス システムを適切に実行し、データ分析、AI 研究、グラフィックを多用するタスクといった需要の高い領域に対応する代表的な例です。 4090 台の NVIDIA RTX 5995 で構成されたサーバー モデルは、AMD の Threadripper PRO 512WX CPU と 5GB の DDRXNUMX メモリによって補完され、大量の計算作業向けに設計された強力な機能です。この構成は、並列処理と高速データ操作を必要とするサーバー環境に最適です。

対照的に、ワークステーション モデルはコアの量がわずかに少ないものの、100 つの NVIDIA A3 GPU によってバランスが取れており、詳細な XNUMXD モデリングとディープ ラーニング タスクにおける優れた能力を実証しています。このシステム設計は少し異なり、より静かな動作を可能にします。ただし、公平を期すために言うと、私たちの研究室では、空冷サーバーと比較してどちらも非常に静かです。

パフォーマンスの面では、ベンチマークの結果が明確に示しています。Grando Server は、OctaneBench や Blender 4.0 などの GPU を集中的に使用するテストで優れており、ハイエンドのレンダリング ジョブを簡単に実行できる機能を強調しています。ワークステーション バージョンは、CPU と GPU のバランスが調整されているため、さまざまなプロフェッショナル アプリケーションに多用途性を提供します。 7-zip Compression と Y-Cruncher のベンチマークで証明されているように、大規模なデータセットを管理する際の両方のシステムの速度と効率は、データ集約型の操作を処理する能力を強調しており、今日のデータ駆動型環境では重要な利点です。

6x 4090 システムを VDI ボックスに変えたときに、システムの柔軟性がさらに強調されました。そこでも一貫したパフォーマンスが確認されました。これは、組織がこれらのシステムを効果的に分割して、専用の GPU アクセスを備えた複数のリモート デスクトップをサポートできることを意味します。このユースケースは液体冷却プレートによって完全に実現されており、これがこの種の GPU 密度を XNUMX つのボックスに収める唯一の方法です。

これらの Comino Grando システムは、全体として、私たちがこれまでに見た中で最も印象的なものの 2024 つです。確かに、水冷式のエンタープライズ サーバーの代替品はたくさんありますが、それがここでの目標ではありません。これらの Comino システムは、構成 (クライアントおよびエンタープライズ GPU オプション) とラック密度/効率における極めて高い柔軟性を重視しています。これらの面での全体的な実行は非常に印象的であり、Comino Grando システムは Best of XNUMX 賞を受賞したシステムの XNUMX つとなっています。

コミノグランドシステムズ

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード