NVIDIA は SC22 を利用して、画期的な科学的発見を可能にする HPC イノベーションの新たな波を強調する発表を行いました。 NVIDIA は、Quantum-2、Omniverse、エッジの HPC、およびデジタル ツイン シミュレーションを強調しました。 NVIDIA のコンパイルは次のとおりです。
NVIDIA は SC22 を利用して、画期的な科学的発見を可能にする HPC イノベーションの新たな波を強調する発表を行いました。 NVIDIA は、Quantum-2、Omniverse、エッジの HPC、およびデジタル ツイン シミュレーションを強調しました。 NVIDIA のコンパイルは次のとおりです。
まず第一に、次世代の製品が広く採用されているという発表です。 H100 Tensor Core GPUs と Quantum-2 インフィニバンドこれには、科学的発見を加速するための Microsoft Azure クラウド上の新しいサービスや 50 を超える新しいパートナー システムが含まれます。
NVIDIA は、cuQuantum、CUDA、BlueField DOCA アクセラレーション ライブラリの重要なアップデートをリリースし、NVIDIA A100 および H100 搭載システムでの Omniverse シミュレーション プラットフォームのサポートを発表しました。 H100、Quantum-2、およびライブラリのアップデートはすべて、NVIDIA の HPC プラットフォームの一部です。 HPC プラットフォームには、CPU、GPU、DPU、システム、ネットワーキング、幅広い AI および HPC ソフトウェアを含む完全なテクノロジー スタックが含まれており、研究者は強力なシステム、オンプレミス、またはクラウドでの作業を効率的に加速できます。
Azure が HPC ワークロード向けに NVIDIA Quantum-2 を提供
Microsoft Azure による Quantum-2 InfiniBand ネットワーキング プラットフォームの採用は、2 月の GTC で発表された NVIDIA Quantum-XNUMX の一般提供に続きました。
H100、NVIDIA AI でターボチャージャーされた新しいサーバー
ASUS、Atos、Dell、HPE、Lenovo、Supermicro は、H100 搭載サーバーを発表する NVIDIA パートナーのほんの一部です。すべての H100 PCIe GPU には、NVIDIA AI Enterprise の 100 年間のライセンスが含まれています。これにより、組織は、医療画像から気象モデル、安全警報システムなどに至るまで、HXNUMX で高速化された AI ソリューションの構築に必要な AI フレームワークとツールに確実にアクセスできるようになります。
新しいシステムの波の中には、同じく SC9680 中に発表された Dell PowerEdge XE22 があり、最も要求の厳しい AI および高性能ワークロードに取り組みます。これは、シミュレーション、データ分析、AI の統合を目的として構築された、NVIDIA HGX プラットフォームに基づくデル初の XNUMX ウェイ システムです。
PowerEdge XE8640 は、100 つの Hopper GPU を備えたデルの新しい HGX H4 システムであり、企業が AI および機械学習モデルを開発、トレーニング、展開できるようにします。 8640U ラック システムである XE5 は、最大 XNUMX つの PCIe GenXNUMX スロット、NVIDIA マルチインスタンス GPU (MIG) テクノロジー、および NVIDIA GPUダイレクト ストレージ サポート。
アクセラレーション ライブラリの大幅なアップデート
科学的発見を促進するために、NVIDIA は CUDA、cuQuantum、および DOCA アクセラレーション ライブラリに対する次のような重要なアップデートをリリースしました。
- NVIDIA CUDA ライブラリには、マルチノード、マルチ GPU のアイゲンソルバーが含まれており、第一原理量子力学計算用のパッケージである VASP などの主要な HPC アプリケーションで前例のないスケールとパフォーマンスを実現します。
- 量子コンピューティングのワークフローを高速化するための NVIDIA cuQuantum ソフトウェア開発キットは、近似テンソル ネットワーク手法をサポートするようになりました。これにより、研究者は数万量子ビットをシミュレーションできるようになり、cuQuantum アプライアンスを使用して比類のないパフォーマンスで量子シミュレーションのマルチノード、マルチ GPU サポートを自動的に有効にすることができます。
- NVIDIA DOCA は、NVIDIA BlueField DPU 用のオープン クラウド SDK およびアクセラレーション フレームワークであり、新しいストレージのユースケースをサポートするための高度なプログラマビリティ、セキュリティ、および機能が含まれています。
これらのライブラリを使用すると、研究者は複数のサーバーにまたがって拡張し、科学的発見を促進するためにパフォーマンスを向上させることができます。 NVIDIA HPC アクセラレーション ライブラリは、主要なクラウド プラットフォーム AWS、Google Cloud、Microsoft Azure、Oracle Cloud Infrastructure で利用できます。
科学者向けのオムニバースオープンポータル
次に、NVIDIA は、NVIDIA Omniverse が最先端の科学計算視覚化ソフトウェアに接続し、NVIDIA A100 および H100 Tensor コア GPU を搭載したシステム上で新しいバッチ レンダリング ワークロードをサポートするようになったと発表しました。
また、NVIDIA は、大規模な Omniverse デジタル ツインを強化するために設計されたコンピューティング システムである NVIDIA OVX と、ソフトウェアおよびインフラストラクチャとしての Omniverse Cloud によって実現される、ハイ パフォーマンス コンピューティング コミュニティ向けのリアルタイムの科学および産業用デジタル ツインを導入しました。 -サービスの提供。
Omniverse は、AI および HPC の研究者、科学者、エンジニアが既存の A100 または H100 システムで実行できるバッチ ワークロードをサポートするようになりました。
NVIDIA はまた、Kitware の視覚化アプリケーションである ParaView などの人気のある科学計算ツールとの接続も明らかにしました。ボリューム レンダリング用の NVIDIA IndeX。物理学 ML モデルを開発するための NVIDIA Modulus。大規模なスパースボリュームデータ表現には NeuraVDB が使用されます。
Omniverse とハイブリッド クラウド ワークロードを使用することで、科学コンピューティングの顧客は、レガシー シミュレーションと視覚化パイプラインを接続して、モデルやデータセットとの分散型で完全にインタラクティブな真のリアルタイム インタラクションを実現できます。アルゴンヌ国立研究所、ロッキード マーティン、プリンストン プラズマ物理研究所などの NVIDIA の顧客は、HPC ワークロードに対する Omniverse の利点をすでに実感しています。
オムニバースは世界的な科学リーダーからのサポートを受けています。
アルゴンヌ国立研究所は、将来のデジタル ツインの基盤を開発するための第一歩として、A100 を搭載した Polaris スーパーコンピューターで NVIDIA Omniverse を使用して、従来の視覚化ツールに接続しています。
米国エネルギー省のプラズマ物理学と核融合科学の国立研究所であるプリンストン プラズマ物理研究所 (PPPL) は、Omniverse を使用して、最先端の合成リアルタイム HPC シミュレーターを接続し、加速して核融合装置のモデル化と制御を行っています。システムを構築し、最終的には商業的に実行可能な新しいクリーン エネルギー源に向けて実験の運用を改善します。
気候研究を加速する NVIDIA の Earth-2 イニシアチブと連携して、航空宇宙業界のリーダーであるロッキード マーティンは最近、NVIDIA Omniverse の使用を開始して、米国海洋大気庁 (NOAA) に地球環境と状況のより良い認識を提供し、インタラクティブな気候研究パイプラインを開発しました。
利用状況
これらの新機能は NVIDIA Omniverse でサポートされ、開発者や企業が利用できるようになりました。
NVIDIA プラットフォームはエッジでの HPC の問題を解決します
長距離で仕事を共有する大学や企業には、顕微鏡やセンサーからサーバーやキャンパスネットワークに至るまで、あらゆるデバイスが送信されたデータを見て理解できるようにするための共通言語と安全なパイプラインが必要です。保存、送信、分析する必要があるデータの量が増加すると、課題はさらに複雑になります。
NVIDIA は、エッジ コンピューティングと AI を組み合わせたハイパフォーマンス コンピューティング プラットフォームを導入して、科学エッジ機器からのストリーミング データをキャプチャして統合し、デバイスが長距離で相互に通信できるようにすることで、この問題に取り組んでいます。
このプラットフォームは、NVIDIA Holoscan、MetroX-3、および NVIDIA BlueField-3 DPU の 3 つの主要コンポーネントで構成されています。 NVIDIA Holoscan は、データ サイエンティストやドメイン専門家が、データをストリーミングするセンサー用の GPU 高速化パイプラインを構築するために使用できるソフトウェア開発キットです。 MetroX-2 は、NVIDIA Quantum-3 InfiniBand プラットフォームの接続を拡張する新しい長距離システムです。また、NVIDIA BlueField-XNUMX DPU は、安全でインテリジェントなデータ移行を提供します。
研究者は、HPC エッジ コンピューティング用の新しい NVIDIA プラットフォームを使用して、安全に通信して問題解決に協力し、異種のデバイスとアルゴリズムを統合して 1 つの大型スーパーコンピューターとして動作させることができます。
エッジの HPC 向け Holoscan
NVIDIA IGX、HGX、DGX システムを含む GPU コンピューティング プラットフォームによって加速される NVIDIA Holoscan は、世界中の科学機器によって生成される大量のデータ ストリームの処理に必要な極めて高いパフォーマンスを提供します。
NVIDIA Holoscan for HPC には、C++ および Python 用の新しい API が含まれており、HPC 研究者はこれらの API を使用して、非画像形式に十分な柔軟性と、生データをリアルタイムの洞察に変換するのに十分なスケーラビリティを備えたセンサー データ処理ワークフローを構築できます。
Holoscan はメモリ割り当ても管理してゼロコピーのデータ交換を保証するため、開発者はファイルとメモリ I/O の管理を気にせずにワークフロー ロジックに集中できます。
Holoscan の新機能は、来月すべての HPC 開発者が利用できるようになります。
MetroX-3 がさらに遠くへ
来月発売される NVIDIA MetroX-3 長距離システムは、NVIDIA Quantum-2 InfiniBand プラットフォームの最新のクラウドネイティブ機能をエッジから HPC データセンター コアまで拡張します。これにより、サイト間の GPU が最大 25 マイル (40 km) 離れた InfiniBand ネットワーク経由でデータを安全に共有できるようになります。
ネイティブのリモート ダイレクト メモリ アクセスを利用して、ユーザーは、InfiniBand に接続された 1 つのミニ クラスターからメイン データ センターにデータと計算ジョブを簡単に移行したり、地理的に分散した計算クラスターを組み合わせて全体的なパフォーマンスとスケーラビリティを向上させることができます。
データ センター オペレータは、NVIDIA ユニファイド ファブリック マネージャーを使用して MetroX-3 システムを管理することで、InfiniBand に接続されたすべてのデータ センター ネットワーク全体でプロビジョニング、監視、運用を行うことができます。
BlueField による安全で効率的な HPC
NVIDIA BlueField DPU は、高度なネットワーキング、ストレージ、セキュリティ サービスをオフロード、高速化、分離して、最新の HPC のパフォーマンスと効率を向上させます。
NVIDIA が HPC データセンター オペレーターにデジタル ツイン シミュレーションを提供
シミュレーションとデジタル ツインは、データ センターの設計者、建設者、オペレーターが非常に効率的でパフォーマンスの高い施設を構築するのに役立ちます。 NVIDIA Omniverse シミュレーション プラットフォームは、共同仮想設計のプロセスを合理化するのに役立ちます。
Omniverse により、データ センター オペレーターは、コアとなるサードパーティのコンピューター支援設計、シミュレーション、監視アプリケーションからのリアルタイム入力を集約できるようになり、完全なデータセットをリアルタイムで表示して操作できるようになります。
SC22 Omniverse のデモでは、ユーザーが Omniverse によってアクセラレーション コンピューティング、シミュレーション、およびリアルタイム モニタリングと AI に接続された運用デジタル ツインの力をどのように活用できるかを示します。これにより、チームは施設設計を合理化し、建設と展開を加速し、継続的な運用を最適化することができます。
このデモでは、Omniverse と連携してネットワークをシミュレートするように設計されたデータセンター シミュレーション プラットフォームである NVIDIA Air も紹介されました。 NVIDIA Air を使用すると、チームはネットワーク スタック全体をモデル化できるため、ネットワーク ハードウェアとソフトウェアを立ち上げ前に自動化および検証できます。
デジタル ツインを作成して設計とシミュレーションを向上させる
NVIDIA の最新 AI スーパーコンピューターの 1 つを計画および構築する際に、Autodesk Revit、PTC Creo、Trimble SketchUp などのサードパーティ業界ツールから複数のエンジニアリング CAD データセットが収集されました。これにより、デザイナーとエンジニアは、ユニバーサル シーン記述ベースのモデルを完全に忠実に表示し、リアルタイムで共同でデザインを反復できるようになりました。
PATCH MANAGER は、ネットワーク ドメイン内のケーブル配線、資産、および物理層のポイントツーポイント接続を計画するためのエンタープライズ ソフトウェア アプリケーションです。 PATCH MANAGER を Omniverse に接続すると、ポート間の接続、ラックとノードのレイアウト、およびケーブル配線の複雑なトポロジをライブ モデルに直接統合できます。これにより、データセンターのエンジニアはモデルとその依存関係の全体像を確認できるようになります。
空気の流れと熱伝達を予測するために、エンジニアは数値流体力学用のソフトウェアである Cadence 6SigmaDCX を使用しました。エンジニアは、NVIDIA Modulus でトレーニングされた AI サロゲートを使用して、ほぼリアルタイムで「what-if」分析を行うこともできます。これにより、チームは複雑な熱と冷却の変化をシミュレーションでき、結果を即座に確認できます。
また、NVIDIA Air を使用すると、プロトコル、監視、自動化を含む正確なネットワーク トポロジをシミュレーションして事前検証できます。
データセンターを構築すると、そのセンサー、制御システム、テレメトリをオムニバース内のデジタルツインに接続できるようになり、リアルタイムで運用を監視できるようになります。
エンジニアは、完全に同期されたデジタル ツインを使用して、電力ピーキングや冷却システムの故障などの一般的な危険をシミュレートできます。通信事業者は、エネルギー効率の向上や二酸化炭素排出量の削減などの重要な優先事項を最適化する、AI が推奨する変更の恩恵を受けることができます。デジタル ツインを使用すると、物理データセンターに展開する前にソフトウェアとコンポーネントのアップグレードをテストおよび検証することもできます。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード