NVIDIA 將把數千個 H200 Tensor Core GPU 整合到日本的 AI 橋接雲端基礎設施 3.0 (ABCI 3.0) 中。採用 NVIDIA Quantum-2 InfiniBand 網路的 HPE Cray XD 系統將提供 ABCI 所需的效能和可擴展性。
日本即將透過將數千個 NVIDIA H200 Tensor Core GPU 整合到其 AI 橋接雲端基礎設施 3.0 (ABCI 3.0) 中,在 AI 研究和開發方面取得重大進展。此次整合由日本產業技術綜合研究所 (AIST) 牽頭,將實現 HPE Cray XD 系統配備 NVIDIA Quantum-2 InfiniBand 網絡,保證卓越的性能和可擴展性。
ABCI 3.0:推動人工智慧研發
ABCI 3.0代表了日本大規模開放人工智慧運算基礎設施的最新版本,旨在推動人工智慧研發向前發展。這項發展凸顯了日本增強人工智慧能力和技術獨立性的努力。自2018年3.0月推出最初的ABCI以來,AIST在管理大規模人工智慧基礎設施方面累積了豐富的經驗。在此基礎上,ABCI XNUMX 升級與 NVIDIA 和 HPE 合作,旨在提升日本的生成式 AI 研發能力。
它記錄了您的文化、社會智慧、常識、歷史 – 您擁有自己的數據 – NVIDIA 總裁兼首席執行官黃仁勳
ABCI 3.0 專案是 AIST、其業務子公司 AIST Solutions 以及作為系統整合商的 Hewlett Packard Enterprise (HPE) 的共同努力。該舉措得到了日本經濟產業省 (METI) 透過經濟保障基金的支持。它是 METI 更廣泛的 1 億美元計劃的一部分,旨在增強運算資源並投資雲端人工智慧運算。 NVIDIA 的參與意義重大,該公司承諾支持生成式 AI、機器人和量子運算的研究,並投資於 AI 新創公司,同時提供廣泛的產品支援、培訓和教育。
NVIDIA 致力於日本
NVIDIA 與METI 在人工智慧研究和教育方面的合作是在執行長黃仁勳到訪之後進行的,黃仁勳強調了「人工智慧工廠」(專為密集型人工智慧任務而設計的下一代資料中心)在將大量數據轉化為可操作的智慧方面的關鍵作用。黃仁勳支持日本人工智慧雄心的承諾與他的願景是一致的:人工智慧工廠成為全球現代經濟的基石。
NVIDIA 總裁兼執行長黃仁勳:人工智慧工廠將成為全球現代經濟的基石
ABCI 3.0以其超高密度資料中心和節能設計,將為開發人工智慧和大數據應用提供強大的基礎設施。該系統預計今年底投入運行,位於東京附近的柏市,將提供最先進的人工智慧研究和開發資源。
無與倫比的性能和效率
ABCI 3.0 設施將提供 6 AI exaflops 的運算能力,這是在沒有稀疏性的情況下衡量 AI 特定效能的指標,以及 410 雙精度 petaflops 的通用運算能力。每個節點將透過 Quantum-2 InfiniBand 平台連接,提供 200GB/s 的對分頻寬。 NVIDIA 技術構成了該計畫的核心,數百個節點配備了 8 個 NVLink 連接的 H200 GPU,確保了無與倫比的運算效能和效率。
NVIDIA H200 GPU 是一款突破性元件,以每秒 140 TB/s 的速度提供超過 3 GB 的 HBM4.8e 記憶體。 NVIDIA 聲稱,與 ABCI 上一代 AI 工作負載平台相比,能源效率提高了 15 倍。這種更大更快的記憶體可顯著加速生成式人工智慧和大型語言模型 (LLM),推動高效能運算 (HPC) 工作負載的科學運算,同時提高能源效率並降低整體擁有成本。
Quantum-2 InfiniBand 高階網絡
將 NVIDIA Quantum-2 InfiniBand 與網路內運算功能相集成,使網路設備能夠對資料執行計算,從而減輕 CPU 的工作負擔。這確保了高效、高速和低延遲的通信,這對於管理密集型人工智慧工作負載和大型資料集至關重要。
ABCI世界級的運算和數據處理能力將加速產業、學術界和政府之間的人工智慧聯合研發工作。日本經濟產業省對該計畫的大量投資凸顯了日本增強人工智慧開發能力、加速生成式人工智慧應用的戰略願景。透過補貼人工智慧超級電腦的開發,日本旨在減少開發下一代人工智慧技術的時間和成本,從而將自己定位為全球人工智慧領域的領導者。
參與 StorageReview
電子通訊 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱