在 VMware Explore 2023 活動中,VMware 推出了新的私有 AI 產品,旨在促進企業內生成式 AI 的採用並利用可信數據的潛力。 VMware Private AI 以其架構方法為特點,平衡了 AI 的優勢與組織的實際隱私和合規性要求。
在 VMware Explore 2023 活動中,VMware 推出了新的私有 AI 產品,旨在促進企業內生成式 AI 的採用並利用可信數據的潛力。 VMware Private AI 以其架構方法為特點,平衡了 AI 的優勢與組織的實際隱私和合規性要求。
VMware Private AI Foundation 與 NVIDIA 合作將使企業能夠自定義模型並運行生成式 AI 應用程序,包括智能聊天機器人、助手、搜索和摘要。 該平台將是一個完全集成的解決方案,具有 NVIDIA 的生成式 AI 軟件和加速計算, 建立在 VMware 雲基礎 並針對人工智能進行了優化。
基於雙方的戰略合作夥伴關係,VMware Private AI Foundation 與 NVIDIA 產品為企業提供在 VMware 雲基礎設施上進行部署的工具,以應對生成式 AI 時代日益增長的興趣。 此擴展將 VMware 的私有 AI 架構與 NVIDIA AI Enterprise 軟件和加速計算相集成,為跨數據中心、公共雲和邊緣部署生成式 AI 應用程序提供交鑰匙解決方案。
為了更快地實現商業利益,企業尋求簡化生成式人工智能應用程序的開發、測試和部署。 VMware Private AI Foundation 與NVIDIA 合作將使企業能夠利用這一功能,定制大型語言模型,為其內部使用生成更安全和私有的模型,並向用戶提供生成式AI 即服務,大規模安全地運行推理工作負載。
該平台預計將包括集成的人工智能工具,使企業能夠經濟高效地運行在其私人數據上訓練的經過驗證的模型。 客戶通過 VMware Private AI Reference Architecture for Open Source 利用頂級開源軟件技術獲得所需的 AI 成果,滿足當前和未來的需求。
該平台預計將基於 VMware Cloud Foundation 和 NVIDIA AI Enterprise 軟件構建,具有眾多優勢。 從隱私角度來看,客戶可以在數據所在位置附近運行人工智能服務,並採用通過安全訪問保護數據隱私的架構。
企業將有多種選擇來構建和運行其模型,從 NVIDIA NeMo 到 Llama 2。它包括 OEM 硬件配置,以及未來的公共雲和服務提供商產品。
在 NVIDIA 加速基礎設施上運行的平台,預期性能應等於或超過裸機。 虛擬化環境中的 GPU 擴展優化將使 AI 工作負載能夠在單個虛擬機和多個節點中擴展至 16 個 vGOU/GPU,以加快生成式 AI 模型的微調和部署。
最大限度地利用 GPU、DPU 和 CPU 上的所有計算資源意味著總體成本預計會更低,同時創建跨團隊共享的池化資源環境。 VMware vSAN Express存儲架構(ESA)將提供性能優化的NVMe存儲,支持基於RDMA的GPUDirect存儲,提供從存儲到GPU的直接I/O傳輸,而無需CPU的參與。
vSphere 和 NVIDIA NVSwitch 之間的深度集成將使多 GPU 模型能夠在沒有 GPU 間瓶頸的情況下執行,從而提供加速網絡。
如果部署和實現價值的時間太長,那麼所有這些好處都將毫無意義。 借助 vSphere Deep Learning 虛擬機映像和映像存儲庫,快速原型設計功能可提供穩定的統包解決方案映像,其中包括預安裝的框架和性能優化的庫。
NVIDIA NeMo 是 NVIDIA AI Enterprise 中包含的適用於 NVIDIA AI 平台的端到端雲原生框架和操作系統,是一項平台功能。 NeMo 允許企業幾乎在任何地方構建、定制和部署生成式 AI 模型,結合定制框架、護欄工具包、數據管理工具和預訓練模型,為企業提供簡單、經濟高效且高效的生成式 AI 採用途徑。
NeMo 在生產中部署生成式 AI,使用 TensorRT 進行大型語言模型 (TRT-LLM),加速和優化 NVIDIA GPU 上最新 LLM 的推理性能。 借助 NeMo,VMware Private AI Foundation 與 NVIDIA 使企業能夠提取數據,在 VMware 的混合雲基礎架構上構建和運行自定義生成式 AI 模型。
VMware Private AI Foundation 將 AI 功能和模型擴展到企業數據生成、處理和使用的位置,無論數據是在公共雲、企業數據中心還是邊緣。 通過推出這些新產品,VMware 旨在幫助客戶將靈活性和控制力融為一體,推動新一代人工智能應用程序的發展。 這些應用程序有可能顯著提高工人的生產力,引發關鍵業務職能的轉型,並產生巨大的經濟影響——麥肯錫的一份報告預計,生成式人工智能每年將為全球經濟貢獻高達 4.4 萬億美元。
這一演變成功的關鍵是多雲環境的建立,因為它為私有但廣泛分佈的數據利用鋪平了道路。 VMware 的多雲戰略使企業能夠更加靈活地使用私有數據構建、自定義和部署 AI 模型,同時確保跨不同環境的安全性和彈性。
VMware 首席執行官拉古·拉古拉姆 (Raghu Raghuram) 強調,生成式人工智能的可行性取決於維護數據隱私和最大限度地降低知識產權風險。 VMware Private AI 解決了這些問題,使組織能夠利用其可信數據在多雲環境中高效構建和執行 AI 模型。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱