今天在丹佛举行的 SC19 上,AMD 发布了一系列关于 HPC 的公告。 该公司宣布使用 AWS 推出新的 EC2 实例。 而且,正如我们之前介绍的那样, 技嘉宣布五款新服务器 利用第二代 AMD EPYC(霄龙),使其总数达到 2 台服务器。
今天在丹佛举行的 SC19 上,AMD 发布了一系列关于 HPC 的公告。 该公司宣布使用 AWS 推出新的 EC2 实例。 而且,正如我们之前介绍的那样, 技嘉宣布五款新服务器 利用第二代 AMD EPYC(霄龙),使其总数达到 2 台服务器。
自 AMD EPYC Rome CPU 发布以来,业界已经看到了相当不错的采用率。 新的 CPU 面世并打破了世界纪录,并且可以在单插槽中提供比竞争对手的双插槽设置更好的性能。 AMD EPYC Rome 的一大优势是它允许服务器利用 PCIe 4.0 设备。 在越来越多地利用 GPU 的世界中,这是在竞争中的巨大优势。 凭借这些优势,AMD 正在进军 HPC/超级计算市场,上述优势将得到快速利用。 现在可以利用的 PCIe 4.0 设备包括:
- 用于 200 GB 以太网的 Broadcom Thor NIC。
- Mellanox ConnectX-6 NIC 显示约 400 GB/s 的 InfiniBand 性能。
- Samsung Gen4 PM1733 NVME SSD – IOPS 是 Samsung Gen2 SSD 的 3 倍。
- 赛灵思 Alveo U50、U280 FPGA。
AMD 正在通过新的 AWS EC2 计算优化实例 C5a 和 C5ad 扩大其在云中的足迹。 在 EPYC Rome CPU 的支持下,C5a 和 C5ad 将提供 8 种虚拟化大小和多达 96 个 vCPU,这将提供更多选择以帮助客户优化各种计算密集型工作负载的成本和性能,包括批处理、分布式分析、和网络应用程序。 C5a 和 C5ad 都将以裸机变体 c5an.metal 和 c5adn.metal 的形式提供,它们将提供两倍的内存和两倍的 vCPU 数量。 新实例将很快在多个 AWS 区域推出。
更多云消息,Microsoft Azure 正在预览用于高性能计算的 Azure HBv2 虚拟机。 这些虚拟机利用 AMD EPYC 7742 处理器。 Azure 和 AMD 表示,这些 VM 可以为客户提供超级计算机性能,支持 200Gbps HDR InfiniBand,以及针对单个作业的多达 80,000 个内核。
AMD 发布了其 ROCm 开放软件平台的 3.0 版。 新功能包括:
- 引入具有支持 HIP-clang 的新创新的 ROCm 3.0——一个基于 LLVM 构建的编译器,使用 hipify-clang 改进了 CUDA 转换能力,同时对 HPC 和 ML 进行了库优化。
- ROCm 上游集成到领先的 TensorFlow 和 PyTorch 机器学习框架中,用于强化学习、自动驾驶以及图像和视频检测等应用。
- 扩展了对 HPC 编程模型和应用程序(如 OpenMP 编程、LAMMPS 和 NAMD)的加速支持。
- 对 Kubernetes、Singularity、SLURM、TAU 等系统和工作负载部署工具的新支持。