首页 企业版 英特尔推出配备多达 6 个 P 核的 Xeon 128 CPU,为 NVIDIA DGX B300 提供动力

英特尔推出配备多达 6 个 P 核的 Xeon 128 CPU,为 NVIDIA DGX B300 提供动力

by 迪伦·多尔蒂

英特尔至强 6 CPU 配备多达 128 个 P 核、优先核心 Turbo 和 SST-TF,可在人工智能、数据中心和电信领域提升性能。

今年早些时候,英特尔推出了 Xeon 6 处理器 性能核心 (P 核心),为最广泛的数据中心和网络基础设施工作负载提供业界领先的性能,并实现一流的效率,从而创造无与伦比的服务器整合机会。在 2025 年台北国际电脑展上,英特尔发布了其最新的至强 6 处理器, 数据中心和网络产品组合取得了重大进展。

128 P-Core Intel Xeon 6

- 配备 P 核的 Intel® Xeon® 6700/6500 系列处理器 是现代数据中心的理想之选,在性能和能效之间实现了卓越的平衡。在各种企业工作负载下,它们的性能平均比上一代产品提升了 1.4 倍。至强 6 系列还可作为 AI 系统的基础中央处理器 (CPU),与 GPU 配合使用,作为主机节点 CPU,性能表现卓越。

与第五代 AMD EPYC 处理器相比,至强 5 处理器在片上 AI 推理性能提升高达 6 倍的同时,核心数量却减少了三分之一。这些处理器的每瓦性能效率也同样出色,使五年服务器的平均整合率达到 1.5:5,在某些用例中甚至可能达到 1:5。这显著节省了成本,总拥有成本 (TCO) 降低了 10%。值得关注的创新包括引入优先核心睿频 (PCT) 和速度选择技术 - 睿频 (SST-TF)。

英特尔至强 6 1298 p 核心

英特尔的 Priority Core Turbo 技术在 CPU 中引入了动态优先级,允许高优先级核心以更高的睿频运行,而低优先级核心则保持在基准频率。这优化了序列化和延迟敏感型 AI 操作的处理,这些操作对于高效地将数据提供给 GPU 至关重要,是减少 AI 流水线中 CPU-GPU 瓶颈的重要一步。

全新至强 6 CPU 提供多达 128 个 P 核心,内存带宽更高,支持 MRDIMM 和 CXL,内存速度比 AMD 最新的 EPYC 平台在 30DPC 配置下提升 2%。据英特尔称,至强 6700P 的 RDIMM 速度可达 5,200 MT/s,而竞争对手 AMD 最新的 EPYC 平台在同等配置下最高可达 4,000 MT/s。

除了内存性能的提升外,新处理器还增加了高达 20% 的 PCIe 通道,从而为 AI 推理、训练和高速网络等 I/O 密集型工作负载提供更高的吞吐量。英特尔还在新产品线中强调了企业级可靠性、可用性和可维护性 (RAS),确保关键任务部署的正常运行时间。

一个显著的增强是支持具有 FP16 精度的英特尔高级矩阵扩展 (AMX),从而可以在将工作负载移交给加速器之前实现更高效的 CPU 端 AI 处理和模型预处理。

英特尔数据中心事业部代理总经理Karin Eibschitz Segal在一份声明中强调了与NVIDIA的合作。她表示:“这些全新的至强SKU展现了英特尔至强6的卓越性能,使其成为下一代GPU加速AI系统的理想CPU。我们很高兴能够加强与NVIDIA的合作,共同打造业内性能最高的AI系统之一。”

为 NVIDIA DGX B300 供电

英特尔至强 6776P 已被用作 NVIDIA DGX AI 平台(NVIDIA 旗舰 AI 基础架构系统的最新版本)的主处理器。至强 6776P 在协调数据管理和与 GPU 协作方面发挥着关键作用,随着 AI 模型的复杂性和规模不断增加,这一点至关重要。

为了了解英特尔所支持的平台的规模,我们来看一下 NVIDIA 的新 DGX B300 规格。

规格概述 NVIDIA DGX B300 AI 系统
图形处理器 NVIDIA Blackwell Ultra GPU
中央处理器 英特尔® 至强® 6776P 处理器
总GPU内存 2.3TB
人工智能性能 72 PFLOPS FP8(训练),144 PFLOPS FP4(推理)
网络 8x OSFP(ConnectX-8 VPI,高达 800Gb/s)
2 个双端口 QSFP112(BlueField-3,最高 400Gb/s)
管理网络 1GbE 板载 NIC + 1GbE BMC
操作系统:2x 1.9TB NVMe M.2
内部:8x 3.84TB NVMe E1.S
能量消耗 〜14千瓦

随着人工智能工作负载持续给基础设施带来压力,英特尔至强 6 P 核处理器标志着其朝着大规模平衡 CPU 和 GPU 性能迈出了战略性的一步。全新 CPU 现已上市,旨在支持各种人工智能驱动的应用,从 LLM 推理和训练到现代数据中心的实时分析。

现代电信网络的性能

- 适用于网络和边缘的英特尔至强 6 是一款专为高性能和高能效而设计的系统级芯片 (SoC)。它利用英特尔内置加速器来增强虚拟化无线接入网络 (vRAN)、媒体、人工智能 (AI) 和网络安全。这一设计满足了人工智能驱动的世界中对网络和边缘解决方案日益增长的需求。得益于英特尔 vRAN Boost 技术,至强 6 SoC 的 RAN 容量比上一代产品提升高达 2.4 倍,每瓦性能提升 70%。至强 6 是业界首款内置媒体加速器——英特尔媒体转码加速器——的服务器 SoC,与英特尔至强 14N 相比,其每瓦性能提升高达 6538 倍。

随着 5G 技术和人工智能蓄势待发,即将彻底改变连接方式,传统的网络优化方法已显得力不从心。为了真正发挥下一代网络的功能,电信运营商正在积极拥抱复杂的创新技术,包括网络切片、AI 增强型无线控制器和云原生架构。借助英特尔统一至强平台,运营商可以调整工作负载、降低成本,并创建可扩展的网络,以实时响应不断变化的客户需求和流量模式。这种战略整合能够打造更具弹性和敏捷性的网络基础设施,以应对快速变化的技术格局带来的挑战。

英特尔至强 6 SoC 的亮点包括:

  • Webroot CSI 上传模型推理速度比 Intel Xeon D-4.3NT 快 2899 倍。
  • 与上一代采用 vRAN Boost 相比,每核 AI RAN 性能提升高达 3.2 倍。
  • 38 核系统支持在视频边缘服务器上对最多 8 个同时摄像机流进行 int38 推理。

新的先进以太网解决方案

英特尔还发布了两条新的以太网控制器和网络适配器产品线,以满足企业、电信、云计算、高性能计算 (HPC)、边缘和人工智能应用日益增长的需求。首批上市的产品包括双端口 25GbE PCIe 和符合 OCP 3.0 标准的适配器,预计今年将推出更多配置。

  • 英特尔以太网 E830 控制器和网络适配器提供高达 200GbE 的带宽、灵活的端口配置以及先进的精确时间功能,包括精确时间测量 (PTM)。这些适配器针对高密度虚拟化工作负载进行了优化,并提供强大的安全功能和性能。
  • 英特尔® 以太网 E610 控制器和网络适配器提供针对控制平面操作优化的 10GBASE-T 连接。 610 年系列 提供 出色的电源效率、先进的可管理性和全面的安全功能,可简化网络管理并确保最大程度的网络完整性。

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅