今天在丹佛舉行的 SC19 上,AMD 發布了一系列關於 HPC 的公告。 該公司宣布使用 AWS 推出新的 EC2 實例。 而且,正如我們之前介紹的那樣, 技嘉宣布五款新服務器 利用第二代 AMD EPYC(霄龍),使其總數達到 2 台服務器。
今天在丹佛舉行的 SC19 上,AMD 發布了一系列關於 HPC 的公告。 該公司宣布使用 AWS 推出新的 EC2 實例。 而且,正如我們之前介紹的那樣, 技嘉宣布五款新服務器 利用第二代 AMD EPYC(霄龍),使其總數達到 2 台服務器。
自 AMD EPYC Rome CPU 發布以來,業界已經看到了相當不錯的採用率。 新的 CPU 面世並打破了世界紀錄,並且可以在單插槽中提供比競爭對手的雙插槽設置更好的性能。 AMD EPYC Rome 的一大優勢是它允許服務器利用 PCIe 4.0 設備。 在越來越多地利用 GPU 的世界中,這是在競爭中的巨大優勢。 憑藉這些優勢,AMD 正在進軍 HPC/超級計算市場,上述優勢將得到快速利用。 現在可以利用的 PCIe 4.0 設備包括:
- 用於 200 GB 以太網的 Broadcom Thor NIC。
- Mellanox ConnectX-6 NIC 顯示約 400 GB/s 的 InfiniBand 性能。
- Samsung Gen4 PM1733 NVME SSD – IOPS 是 Samsung Gen2 SSD 的 3 倍。
- 賽靈思 Alveo U50、U280 FPGA。
AMD 正在通過新的 AWS EC2 計算優化實例 C5a 和 C5ad 擴大其在雲中的足跡。 在 EPYC Rome CPU 的支持下,C5a 和 C5ad 將提供 8 種虛擬化大小和多達 96 個 vCPU,這將提供更多選擇以幫助客戶優化各種計算密集型工作負載的成本和性能,包括批處理、分佈式分析、和網絡應用程序。 C5a 和 C5ad 都將以裸機變體 c5an.metal 和 c5adn.metal 的形式提供,它們將提供兩倍的內存和兩倍的 vCPU 數量。 新實例將很快在多個 AWS 區域推出。
更多雲消息,Microsoft Azure 正在預覽用於高性能計算的 Azure HBv2 虛擬機。 這些虛擬機利用 AMD EPYC 7742 處理器。 Azure 和 AMD 表示,這些 VM 可以為客戶提供超級計算機性能,支持 200Gbps HDR InfiniBand,以及針對單個作業的多達 80,000 個內核。
AMD 發布了其 ROCm 開放軟件平台的 3.0 版。 新功能包括:
- 引入具有支持 HIP-clang 的新創新的 ROCm 3.0——一個基於 LLVM 構建的編譯器,通過 hipify-clang 改進了 CUDA 轉換能力,同時針對 HPC 和 ML 進行了庫優化。
- ROCm 上游集成到領先的 TensorFlow 和 PyTorch 機器學習框架中,用於強化學習、自動駕駛以及圖像和視頻檢測等應用。
- 擴展了對 HPC 編程模型和應用程序(如 OpenMP 編程、LAMMPS 和 NAMD)的加速支持。
- 對 Kubernetes、Singularity、SLURM、TAU 等系統和工作負載部署工具的新支持。