首頁 Enterprise NVIDIA 宣佈在 Microsoft Azure 雲中推出可擴展的 GPU 加速超級計算機

NVIDIA 宣佈在 Microsoft Azure 雲中推出可擴展的 GPU 加速超級計算機

by 萊爾·史密斯

NVIDIA 宣佈在 Microsoft Azure 上推出一款新的基於雲的 GPU 加速超級計算機。 NVIDIA 表示,與傳統的基於 CPU 的計算相比,他們的新產品旨在處理要求苛刻的 AI、機器學習和高性能計算應用程序,它們將提供顯著的性能和成本優勢。 例如,AI 研究人員將能夠在數小時內啟動多個 NDv2 實例並訓練複雜的對話式 AI 模型,該公司表示。


NVIDIA 宣佈在 Microsoft Azure 上推出一款新的基於雲的 GPU 加速超級計算機。 NVIDIA 表示,與傳統的基於 CPU 的計算相比,他們的新產品旨在處理要求苛刻的 AI、機器學習和高性能計算應用程序,它們將提供顯著的性能和成本優勢。 例如,AI 研究人員將能夠在數小時內啟動多個 NDv2 實例並訓練複雜的對話式 AI 模型,該公司表示。

為了構建這種新的可擴展 GPU 加速超級計算機,Microsoft 和 NVIDIA 工程師在集群的預發布版本上使用 64 個 NDv2 實例在大約三個小時內訓練了 BERT。 這是可能的,因為 NCCL、NVIDIA CUDA X 庫和高速 Mellanox 互連提供了多 GPU 優化。

NVIDIA 補充說,那些使用多個 NDv2 實例的人在運行複雜的 HPC 工作負載時也會注意到一系列好處。 對於特定類型的應用程序(如深度學習),與沒有 GPU 加速的傳統 HPC 節點相比,即使是單個 NDv2 實例也能提供更快的結果。 這種性能還可以線性擴展到一百個實例以進行大規模模擬。

NVIDIA 還聲稱,所有 NDv2 實例都將受益於 NVIDIA NGC 容器註冊表和 Azure Marketplace 的 GPU 優化 HPC 應用程序、機器學習軟件和深度學習框架。

可用性

NDv2 現已提供預覽版。

NVIDIA

討論這個故事

註冊 StorageReview 時事通訊