NVIDIA HPC イノベーションの新たな波が発表

NVIDIA は SC22 を利用して、画期的な科学的発見を可能にする HPC イノベーションの新たな波を強調する発表を行いました。 NVIDIA は、Quantum-2、Omniverse、エッジの HPC、およびデジタルツインシミュレーションを強調しました。 NVIDIA のコンパイルは次のとおりです。

まず第一に、次世代の製品が広く採用されているという発表です。 H100 Tensor Core GPUs と Quantum-2 インフィニバンドこれには、科学的発見を加速するための Microsoft Azure クラウド上の新しいサービスや 50 を超える新しいパートナーシステムが含まれます。

NVIDIA HGX-H100

NVIDIA は、cuQuantum、CUDA、BlueField DOCA アクセラレーションライブラリの重要なアップデートをリリースし、NVIDIA A100 および H100 搭載システムでの Omniverse シミュレーションプラットフォームのサポートを発表しました。 H100、Quantum-2、およびライブラリのアップデートはすべて、NVIDIA の HPC プラットフォームの一部です。 HPC プラットフォームには、CPU、GPU、DPU、システム、ネットワーキング、幅広い AI および HPC ソフトウェアを含む完全なテクノロジースタックが含まれており、研究者は強力なシステム、オンプレミス、またはクラウドでの作業を効率的に加速できます。

Azure が HPC ワークロード向けに NVIDIA Quantum-2 を提供

Microsoft Azure による Quantum-2 InfiniBand ネットワーキングプラットフォームの採用は、2 月の GTC で発表された NVIDIA Quantum-XNUMX の一般提供に続きました。

H100、NVIDIA AI でターボチャージャーされた新しいサーバー

ASUS、Atos、Dell、HPE、Lenovo、Supermicro は、H100 搭載サーバーを発表する NVIDIA パートナーのほんの一部です。すべての H100 PCIe GPU には、NVIDIA AI Enterprise の 100 年間のライセンスが含まれています。これにより、組織は、医療画像から気象モデル、安全警報システムなどに至るまで、HXNUMX で高速化された AI ソリューションの構築に必要な AI フレームワークとツールに確実にアクセスできるようになります。

新しいシステムの波の中には、同じく SC9680 中に発表された Dell PowerEdge XE22 があり、最も要求の厳しい AI および高性能ワークロードに取り組みます。これは、シミュレーション、データ分析、AI の統合を目的として構築された、NVIDIA HGX プラットフォームに基づくデル初の XNUMX ウェイシステムです。

PowerEdge XE8640 は、100 つの Hopper GPU を備えたデルの新しい HGX H4 システムであり、企業が AI および機械学習モデルを開発、トレーニング、展開できるようにします。 8640U ラックシステムである XE5 は、最大 XNUMX つの PCIe GenXNUMX スロット、NVIDIA マルチインスタンス GPU (MIG) テクノロジー、および NVIDIA GPUダイレクトストレージサポート。

アクセラレーションライブラリの大幅なアップデート

科学的発見を促進するために、NVIDIA は CUDA、cuQuantum、および DOCA アクセラレーションライブラリに対する次のような重要なアップデートをリリースしました。

NVIDIA CUDA ライブラリには、マルチノード、マルチ GPU のアイゲンソルバーが含まれており、第一原理量子力学計算用のパッケージである VASP などの主要な HPC アプリケーションで前例のないスケールとパフォーマンスを実現します。
量子コンピューティングのワークフローを高速化するための NVIDIA cuQuantum ソフトウェア開発キットは、近似テンソルネットワーク手法をサポートするようになりました。これにより、研究者は数万量子ビットをシミュレーションできるようになり、cuQuantum アプライアンスを使用して比類のないパフォーマンスで量子シミュレーションのマルチノード、マルチ GPU サポートを自動的に有効にすることができます。
NVIDIA DOCA は、NVIDIA BlueField DPU 用のオープンクラウド SDK およびアクセラレーションフレームワークであり、新しいストレージのユースケースをサポートするための高度なプログラマビリティ、セキュリティ、および機能が含まれています。

これらのライブラリを使用すると、研究者は複数のサーバーにまたがって拡張し、科学的発見を促進するためにパフォーマンスを向上させることができます。 NVIDIA HPC アクセラレーションライブラリは、主要なクラウドプラットフォーム AWS、Google Cloud、Microsoft Azure、Oracle Cloud Infrastructure で利用できます。

科学者向けのオムニバースオープンポータル

次に、NVIDIA は、NVIDIA Omniverse が最先端の科学計算視覚化ソフトウェアに接続し、NVIDIA A100 および H100 Tensor コア GPU を搭載したシステム上で新しいバッチレンダリングワークロードをサポートするようになったと発表しました。

また、NVIDIA は、大規模な Omniverse デジタルツインを強化するために設計されたコンピューティングシステムである NVIDIA OVX と、ソフトウェアおよびインフラストラクチャとしての Omniverse Cloud によって実現される、ハイパフォーマンスコンピューティングコミュニティ向けのリアルタイムの科学および産業用デジタルツインを導入しました。 -サービスの提供。

Omniverse は、AI および HPC の研究者、科学者、エンジニアが既存の A100 または H100 システムで実行できるバッチワークロードをサポートするようになりました。

NVIDIA はまた、Kitware の視覚化アプリケーションである ParaView などの人気のある科学計算ツールとの接続も明らかにしました。ボリュームレンダリング用の NVIDIA IndeX。物理学 ML モデルを開発するための NVIDIA Modulus。大規模なスパースボリュームデータ表現には NeuraVDB が使用されます。

Omniverse とハイブリッドクラウドワークロードを使用することで、科学コンピューティングの顧客は、レガシーシミュレーションと視覚化パイプラインを接続して、モデルやデータセットとの分散型で完全にインタラクティブな真のリアルタイムインタラクションを実現できます。アルゴンヌ国立研究所、ロッキードマーティン、プリンストンプラズマ物理研究所などの NVIDIA の顧客は、HPC ワークロードに対する Omniverse の利点をすでに実感しています。

オムニバースは世界的な科学リーダーからのサポートを受けています。

アルゴンヌ国立研究所は、将来のデジタルツインの基盤を開発するための第一歩として、A100 を搭載した Polaris スーパーコンピューターで NVIDIA Omniverse を使用して、従来の視覚化ツールに接続しています。

米国エネルギー省のプラズマ物理学と核融合科学の国立研究所であるプリンストンプラズマ物理研究所 (PPPL) は、Omniverse を使用して、最先端の合成リアルタイム HPC シミュレーターを接続し、加速して核融合装置のモデル化と制御を行っています。システムを構築し、最終的には商業的に実行可能な新しいクリーンエネルギー源に向けて実験の運用を改善します。

気候研究を加速する NVIDIA の Earth-2 イニシアチブと連携して、航空宇宙業界のリーダーであるロッキードマーティンは最近、NVIDIA Omniverse の使用を開始して、米国海洋大気庁 (NOAA) に地球環境と状況のより良い認識を提供し、インタラクティブな気候研究パイプラインを開発しました。

利用状況

これらの新機能は NVIDIA Omniverse でサポートされ、開発者や企業が利用できるようになりました。

NVIDIA プラットフォームはエッジでの HPC の問題を解決します

長距離で仕事を共有する大学や企業には、顕微鏡やセンサーからサーバーやキャンパスネットワークに至るまで、あらゆるデバイスが送信されたデータを見て理解できるようにするための共通言語と安全なパイプラインが必要です。保存、送信、分析する必要があるデータの量が増加すると、課題はさらに複雑になります。

NVIDIA は、エッジコンピューティングと AI を組み合わせたハイパフォーマンスコンピューティングプラットフォームを導入して、科学エッジ機器からのストリーミングデータをキャプチャして統合し、デバイスが長距離で相互に通信できるようにすることで、この問題に取り組んでいます。

このプラットフォームは、NVIDIA Holoscan、MetroX-3、および NVIDIA BlueField-3 DPU の 3 つの主要コンポーネントで構成されています。 NVIDIA Holoscan は、データサイエンティストやドメイン専門家が、データをストリーミングするセンサー用の GPU 高速化パイプラインを構築するために使用できるソフトウェア開発キットです。 MetroX-2 は、NVIDIA Quantum-3 InfiniBand プラットフォームの接続を拡張する新しい長距離システムです。また、NVIDIA BlueField-XNUMX DPU は、安全でインテリジェントなデータ移行を提供します。

研究者は、HPC エッジコンピューティング用の新しい NVIDIA プラットフォームを使用して、安全に通信して問題解決に協力し、異種のデバイスとアルゴリズムを統合して 1 つの大型スーパーコンピューターとして動作させることができます。

エッジの HPC 向け Holoscan

NVIDIA IGX、HGX、DGX システムを含む GPU コンピューティングプラットフォームによって加速される NVIDIA Holoscan は、世界中の科学機器によって生成される大量のデータストリームの処理に必要な極めて高いパフォーマンスを提供します。

NVIDIA Holoscan for HPC には、C++ および Python 用の新しい API が含まれており、HPC 研究者はこれらの API を使用して、非画像形式に十分な柔軟性と、生データをリアルタイムの洞察に変換するのに十分なスケーラビリティを備えたセンサーデータ処理ワークフローを構築できます。

Holoscan はメモリ割り当ても管理してゼロコピーのデータ交換を保証するため、開発者はファイルとメモリ I/O の管理を気にせずにワークフローロジックに集中できます。

Holoscan の新機能は、来月すべての HPC 開発者が利用できるようになります。

MetroX-3 がさらに遠くへ

来月発売される NVIDIA MetroX-3 長距離システムは、NVIDIA Quantum-2 InfiniBand プラットフォームの最新のクラウドネイティブ機能をエッジから HPC データセンターコアまで拡張します。これにより、サイト間の GPU が最大 25 マイル (40 km) 離れた InfiniBand ネットワーク経由でデータを安全に共有できるようになります。

ネイティブのリモートダイレクトメモリアクセスを利用して、ユーザーは、InfiniBand に接続された 1 つのミニクラスターからメインデータセンターにデータと計算ジョブを簡単に移行したり、地理的に分散した計算クラスターを組み合わせて全体的なパフォーマンスとスケーラビリティを向上させることができます。

データセンターオペレータは、NVIDIA ユニファイドファブリックマネージャーを使用して MetroX-3 システムを管理することで、InfiniBand に接続されたすべてのデータセンターネットワーク全体でプロビジョニング、監視、運用を行うことができます。

BlueField による安全で効率的な HPC

NVIDIA BlueField DPU は、高度なネットワーキング、ストレージ、セキュリティサービスをオフロード、高速化、分離して、最新の HPC のパフォーマンスと効率を向上させます。

NVIDIA が HPC データセンターオペレーターにデジタルツインシミュレーションを提供

シミュレーションとデジタルツインは、データセンターの設計者、建設者、オペレーターが非常に効率的でパフォーマンスの高い施設を構築するのに役立ちます。 NVIDIA Omniverse シミュレーションプラットフォームは、共同仮想設計のプロセスを合理化するのに役立ちます。

Omniverse により、データセンターオペレーターは、コアとなるサードパーティのコンピューター支援設計、シミュレーション、監視アプリケーションからのリアルタイム入力を集約できるようになり、完全なデータセットをリアルタイムで表示して操作できるようになります。

SC22 Omniverse のデモでは、ユーザーが Omniverse によってアクセラレーションコンピューティング、シミュレーション、およびリアルタイムモニタリングと AI に接続された運用デジタルツインの力をどのように活用できるかを示します。これにより、チームは施設設計を合理化し、建設と展開を加速し、継続的な運用を最適化することができます。

このデモでは、Omniverse と連携してネットワークをシミュレートするように設計されたデータセンターシミュレーションプラットフォームである NVIDIA Air も紹介されました。 NVIDIA Air を使用すると、チームはネットワークスタック全体をモデル化できるため、ネットワークハードウェアとソフトウェアを立ち上げ前に自動化および検証できます。

デジタルツインを作成して設計とシミュレーションを向上させる

NVIDIA の最新 AI スーパーコンピューターの 1 つを計画および構築する際に、Autodesk Revit、PTC Creo、Trimble SketchUp などのサードパーティ業界ツールから複数のエンジニアリング CAD データセットが収集されました。これにより、デザイナーとエンジニアは、ユニバーサルシーン記述ベースのモデルを完全に忠実に表示し、リアルタイムで共同でデザインを反復できるようになりました。

PATCH MANAGER は、ネットワークドメイン内のケーブル配線、資産、および物理層のポイントツーポイント接続を計画するためのエンタープライズソフトウェアアプリケーションです。 PATCH MANAGER を Omniverse に接続すると、ポート間の接続、ラックとノードのレイアウト、およびケーブル配線の複雑なトポロジをライブモデルに直接統合できます。これにより、データセンターのエンジニアはモデルとその依存関係の全体像を確認できるようになります。

空気の流れと熱伝達を予測するために、エンジニアは数値流体力学用のソフトウェアである Cadence 6SigmaDCX を使用しました。エンジニアは、NVIDIA Modulus でトレーニングされた AI サロゲートを使用して、ほぼリアルタイムで「what-if」分析を行うこともできます。これにより、チームは複雑な熱と冷却の変化をシミュレーションでき、結果を即座に確認できます。

また、NVIDIA Air を使用すると、プロトコル、監視、自動化を含む正確なネットワークトポロジをシミュレーションして事前検証できます。

データセンターを構築すると、そのセンサー、制御システム、テレメトリをオムニバース内のデジタルツインに接続できるようになり、リアルタイムで運用を監視できるようになります。

エンジニアは、完全に同期されたデジタルツインを使用して、電力ピーキングや冷却システムの故障などの一般的な危険をシミュレートできます。通信事業者は、エネルギー効率の向上や二酸化炭素排出量の削減などの重要な優先事項を最適化する、AI が推奨する変更の恩恵を受けることができます。デジタルツインを使用すると、物理データセンターに展開する前にソフトウェアとコンポーネントのアップグレードをテストおよび検証することもできます。

StorageReview と連携する

NVIDIA HPC イノベーションの新たな波が発表

Azure が HPC ワークロード向けに NVIDIA Quantum-2 を提供

H100、NVIDIA AI でターボチャージャーされた新しいサーバー

アクセラレーション ライブラリの大幅なアップデート

科学者向けのオムニバースオープンポータル

オムニバースは世界的な科学リーダーからのサポートを受けています。

NVIDIA プラットフォームはエッジでの HPC の問題を解決します

エッジの HPC 向け Holoscan

MetroX-3 がさらに遠くへ

BlueField による安全で効率的な HPC

NVIDIA が HPC データセンター オペレーターにデジタル ツイン シミュレーションを提供

デジタル ツインを作成して設計とシミュレーションを向上させる

ハロルド・フリッツ

Synology DiskStation DS923+ が発売になりました

Dell PowerProtect アプライアンスがゼロトラストでアップデートされ、マルチクラウドが強化されました

信頼できるベンダー

アクセラレーションライブラリの大幅なアップデート

NVIDIA が HPC データセンターオペレーターにデジタルツインシミュレーションを提供

デジタルツインを作成して設計とシミュレーションを向上させる