首页 企业 推出英特尔至强 CPU Max 系列和英特尔数据中心 GPU Max 系列

推出英特尔至强 CPU Max 系列和英特尔数据中心 GPU Max 系列

by 哈罗德弗里茨

英特尔通过推出专注于 HPC 和 AI 的英特尔 Max 系列产品系列击败了 SC 22 热潮。 英特尔至强 CPU Max 系列(代号 Sapphire Rapids HBM)和英特尔数据中心 GPU Max 系列(代号 Ponte Vecchio)将为阿贡国家实验室即将推出的 Aurora 超级计算机提供支持。

英特尔通过推出专注于 HPC 和 AI 的英特尔 Max 系列产品系列击败了 SC 22 热潮。 英特尔至强 CPU Max 系列(代号 Sapphire Rapids HBM)和英特尔数据中心 GPU Max 系列(代号 Ponte Vecchio)将为阿贡国家实验室即将推出的 Aurora 超级计算机提供支持。

据说新的 Intel Max 系列产品可提供比竞争对手和英特尔最高密度 GPU 快 4.8 倍的 CPU 内存带宽。 Xeon Max CPU 是唯一具有高带宽内存的基于 x86 的处理器,无需更改代码即可加速许多 HPC 工作负载。 Max 系列 GPU 是英特尔密度最高的处理器,将超过 100 亿个晶体管封装到一个 47 块封装中,具有高达 128 GB 的高带宽内存。

新产品系列由英特尔的 oneAPI 提供支持,这是一个开放的软件生态系统,可为两个新处理器提供单一的编程环境。 英特尔的 2023 oneAPI 和人工智能工具将提供支持英特尔 Max 系列产品高级功能的功能。

英特尔公司副总裁兼超级计算事业部总经理 Jeff McVeigh 表示:

“为确保不遗漏任何 HPC 工作负载,我们需要一个能够最大化带宽、最大化
计算,最大限度地提高开发人员的生产力,并最终最大限度地提高影响力。 英特尔 Max 系列
产品系列将高带宽内存与 oneAPI 一起推向更广阔的市场,让
在 CPU 和 GPU 之间共享代码,更快地解决世界上最大的挑战。”

GPU 刀片到 Argonne,CPU 刀片到 Los Alamos

Max 系列产品计划于 2023 年 XNUMX 月推出,但已经将带有 Max 系列 GPU 的刀片运送到阿贡国家实验室,为 Aurora 超级计算机提供动力,并将向洛斯阿拉莫斯国家实验室、京都大学和其他超级计算站点提供 Xeon Max CPU。

Xeon Max CPU 提供多达 56 个性能内核,由四个区块构成,并使用 Intel 的嵌入式多芯片互连桥 (EMIB) 技术连接在一个 350 瓦的外壳中。 Xeon Max CPU 包含 64GB 高带宽封装内存和 PCI Express 5.0 和 CXL1.1。 Xeon Max CPU 将为每个内核提供超过 1GB 的高带宽内存 (HBM) 容量,足以满足大多数常见的 HPC 工作负载。 Max 系列 CPU 的其他优势包括:

  • 对于相同的 HCPG 性能,功耗比 AMD Milan-X 集群低 68%。
  • AMX 扩展可提升 AI 性能,并为具有 INT8 累加操作的 INT512 提供比 AVX-8 高 32 倍的峰值吞吐量。
  • 它提供了在不同 HBM 和 DDR 内存配置中运行的灵活性。
  • 工作负载基准:
    • 气候建模:仅使用 HBM 在 MPAS-A 上比 AMD Milan-X 快 2.4 倍。
    • 分子动力学:在 DeePMD 上,性能比竞争产品提高 2.8 倍
      带 DDR 内存的产品。

Max 系列 GPU 提供多达 128 个 Xe-HPC 内核,可满足要求最严苛的计算工作负载。 此外,Max 系列 GPU 还具有以下特点:

  • 408MB 二级缓存——业内最高——和 2MB 一级缓存以提高吞吐量
    和性能。
  • 唯一具有本机光线追踪加速功能的 HPC/AI GPU,旨在加速科学
    可视化和动画。
  • 工作负载基准:
    • 财务:在 Riskfuel 信用期权定价方面,NVIDIA A2.4 的性能提高了 100 倍。
    • 物理学:NekRS 虚拟反应堆模拟比 A1.5 提高 100 倍。

Max 系列 GPU 将以多种形式提供,以满足不同的客户需求:

  • Max Series 1100 GPU:300 瓦双宽 PCIe 卡,具有 56 个 Xe 内核和 48GB HBM2e 内存。 可以通过 Intel Xe Link 桥连接多张卡。
  • Max Series 1350 GPU:具有 450 个 Xe 内核和 112GB HBM 的 96 瓦 OAM 模块。
  • Max Series 1550 GPU:英特尔最高性能的 600 瓦 OAM 模块,具有 128 个 Xe 内核和 128GB HBM。

除了单独的卡和模块,英特尔还将提供带有 x4 GPU OAM 载板和英特尔 Xe Link 的英特尔数据中心 GPU Max 系列子系统,以在子系统内实现高性能多 GPU 通信。

目前正在阿贡国家实验室建设的 Aurora 超级计算机将成为第一台双精度计算性能峰值超过 2 exaflops 的超级计算机。 Aurora 还将率先在单个系统中展示配对的 Max 系列 GPU 和 CPU,该系统有 10,000 多个刀片,每个刀片包含六个 Max 系列 GPU 和两个至强 Max CPU。

阿贡和英特尔推出太阳黑子

在 SC22 之前的另一项公告中,Argonne 和英特尔推出了 Sunspot,这是 Aurora 的测试开发系统,由 128 个生产刀片组成。 Aurora 早期科学计划的研究人员将从 2022 年底开始访问该系统。

在 SC22 上还有更多值得一看的地方,英特尔及其客户将展示来自 40 家 OEM 使用 Max 系列产品的 12 多个即将推出的系统设计。 演示将展示 Max 系列产品在一系列 AI 和 HPC 应用中的性能和功能。 英特尔架构师、客户和最终用户将在 2428 号英特尔展台就英特尔平台解决方案的强大功能进行演示。

Max 系列还有更多内容

代号为 Rialto Bridge 的英特尔数据中心 Max 系列 GPU 是 Max 系列 GPU 的继任者,计划于 2024 年面世,性能得到提升并提供无缝升级途径。 英特尔随后计划发布下一个主要架构创新,以实现 HPC 的未来。 英特尔即将推出的代号为 Falcon Shores 的 XPU 将在一个封装中结合 Xe 和 x86 内核。 这种新架构还将具有集成来自英特尔和客户的新 IP 的灵活性。

英特尔高性能计算

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅