今天,NVIDIA 宣布了其新的 vComputeServer 軟件。 通過與 VMware 的合作,這些新技術據說可以將 GPU 虛擬化引入人工智能、深度學習和數據科學。 客戶將能夠在客戶數據中心和 VMware Cloud on AWS 之間無縫遷移 GPU 上的 AI 工作負載。 今天發布的公告不僅支持 VMware vSphere,還支持基於 KVM 的管理程序,包括 Red Hat 和 Nutanix。
今天,NVIDIA 宣布了其新的 vComputeServer 軟件。 通過與 VMware 的合作,這些新技術據說可以將 GPU 虛擬化引入人工智能、深度學習和數據科學。 客戶將能夠在客戶數據中心和 VMware Cloud on AWS 之間無縫遷移 GPU 上的 AI 工作負載。 今天發布的公告不僅支持 VMware vSphere,還支持基於 KVM 的管理程序,包括 Red Hat 和 Nutanix。
人工智能、深度學習和數據科學是計算密集型服務器工作負載。 到目前為止,這些工作負載僅限於 CPU。 現在,借助 vComputeServer 軟件和 NVIDIA NGC,AI 工作負載可以輕鬆部署在 VMware vSphere 等虛擬化環境中。 這是通過允許管理員在虛擬化環境中的 GPU 服務器上運行 AI 工作負載來實現的。 NVIDIA 表示這將提高安全性、利用率和可管理性。 利用具有四個 NVIDIA V100 GPU 的 vComputeServer 可以比僅使用 CPU 的服務器加速深度學習 50 倍。
vComputeServer 的發布擴展了 NVIDIA 的 vGPU 產品組合,包括對數據分析、機器學習、AI、深度學習、HPC 和其他服務器工作負載的支持。 新軟件還提供了多項功能,例如 GPU 共享,多個虛擬機可以由單個 GPU 提供支持,以及 GPU 聚合,因此一個或多個 GPU 可以為虛擬機提供支持。 這允許最大限度地利用,同時以具有成本效益的方式利用現有技術。
vComputeServer 的特性包括:
- GPU 性能:深度學習訓練比僅使用 CPU 快 50 倍,與在裸機上運行 GPU 的性能相似。
- 高級計算:糾錯代碼和動態頁面退役可防止高精度工作負載的數據損壞。
- 實時遷移:支持 GPU 的虛擬機可以在中斷或停機時間最少的情況下進行遷移。
- 提高安全性:企業可以將服務器虛擬化的安全優勢擴展到 GPU 集群。
- 多租戶隔離:可以隔離工作負載以在單個基礎設施上安全地支持多個用戶。
- 管理和監控:管理員可以使用相同的管理程序虛擬化工具來管理 GPU 服務器,在主機、虛擬機和應用程序級別具有可見性。
- 廣泛支持的 GPU:vComputeServer 受 NVIDIA T4 或 V100 GPU、Quadro RTX 8000 和 6000 GPU 以及前幾代 Pascal 架構 P40、P100 和 P60 GPU 的支持。
庫存情況
NVIDIA vComputeServer 預計將於本月上市。