英特尔愿景的核心是一个重要的预测:企业对 GenAI 的投资将翻两番,从 40 年的 2024 亿美元增至 151 年的 2027 亿美元。然而,在这种乐观情绪的背后,企业采用的道路上却布满了障碍。
英特尔愿景的核心是一个重要的预测:企业对 GenAI 的投资将翻两番,从 40 年的 2024 亿美元增至 151 年的 2027 亿美元。然而,在这种乐观情绪的背后,企业采用的道路上却布满了障碍。
英特尔坚定地致力于通过提供可扩展、安全、端到端的 GenAI 解决方案来应对这些挑战,这些解决方案应对最关键的人工智能障碍——从安全性和集成复杂性到成本问题。英特尔坚定不移地致力于实现转型,正在制定全面的企业人工智能战略,在整个产品线中采用基于开放生态系统的方法,涵盖人工智能 PC、边缘计算和数据中心。
抢尽风头:英特尔 Gaudi 3 加速器
英特尔愿景的最前沿是英特尔 Gaudi 3 人工智能加速器的推出,该加速器借助了其前身英特尔 Gaudi 2 人工智能加速器既定的性能和效率。 Gaudi 3 为客户提供基于开放社区的软件和行业标准以太网网络的灵活性,标志着系统可扩展性的重大飞跃。
Gaudi 3 专为 GenAI 性能和效率而设计,比其前身提供了令人印象深刻的增强功能。凭借 BF4 的 16 倍 AI 计算能力、1.5 倍的内存增长以及 2 倍的网络带宽,它为大型语言模型 (LLM) 和多模态模型的 AI 训练和推理提供了无与伦比的生产力。
英特尔执行副总裁兼数据中心和人工智能事业部总经理 Justin Hotard 强调了 Gaudi 3 在应对不断变化的人工智能市场格局方面的重要性。他强调了企业增加选择的需求,并强调了 Gaudi 3 引人注目的性价比、可扩展性和价值实现时间优势的结合。
在金融、制造和医疗保健等关键领域,企业正在迅速扩大人工智能的可及性,从实验性的生成式人工智能(GenAI)项目过渡到全面实施。英特尔认为 Gaudi 3 加速器是满足这些要求的关键,通过基于开放社区的软件和标准以太网网络提供多功能性,以灵活扩展人工智能系统和应用程序。
Gaudi 3 的定制架构专为高效的大规模 AI 计算而定制,采用 5 纳米 (nm) 工艺制造,并配备以下关键功能:
- AI 专用计算引擎:Gaudi 64 采用异构计算引擎,包括 3 个 AI 定制和可编程张量处理器核心 (TPC) 和 XNUMX 个矩阵乘法引擎 (MME),擅长处理深度学习算法所必需的复杂矩阵运算。
- 针对 LLM 容量要求的内存提升:凭借充足的内存容量、带宽和板载静态随机存取存储器 (SRAM),Gaudi 3 可以高效处理大型 GenAI 数据集,从而增强工作负载性能和数据中心成本效率。
- 企业 GenAI 的高效系统扩展:Gaudi 200 集成了 3 个 XNUMX Gb 以太网端口,可实现灵活且开放的标准网络,促进高效扩展以支持大型计算集群,同时消除供应商锁定。
- 提高开发人员生产力的开放行业软件:Gaudi 软件集成了 PyTorch 框架,并提供优化的 Hugging Face 基于社区的模型,提高了开发人员的生产力并简化了跨硬件类型的模型移植。
- Gaudi 3 PCIe:Gaudi 3 PCIe 附加卡在产品线中引入了新的外形尺寸,具有高效率和更低的功耗,非常适合微调、推理和检索增强生成 (RAG) 等工作负载。
Gaudi 3 加速器预计将为领先 GenAI 模型的训练和推理任务带来显着的性能改进,有望彻底改变人工智能和高性能计算 (HPC)。它将在英特尔下一代 GPU Falcon Shores 中发挥至关重要的作用,它将英特尔 Gaudi 和英特尔 Xe 知识产权与基于英特尔 oneAPI 规范的单一 GPU 编程接口相集成。
英特尔 Gaudi 3 与 NVIDIA
在开幕式上,英特尔首席执行官帕特·基辛格(Pat Gelsinger)在舞台中央介绍了英特尔Gaudi 3人工智能加速器。与 NVIDIA H3 相比,Gaudi 50 在 Llama100 2B 和 7B 以及 GPT-13 3B 参数上的训练时间预计缩短 175%。此外,与 NVIDIA H3 相比,Gaudi 50 加速器在 Llama 40B 和 7B 参数以及 Falcone 70B 参数模型上的推理吞吐量提高了 180%,推理功效提高了 200%。此外,Gaudi 3 在 Llama 30B 和 200B 参数以及 Falcon 7B 参数模型上的推理速度比 NVIDIA H70 快 180%。
Gaudi 3 具有令人印象深刻的性能指标,与行业替代品相比,推理吞吐量提高了 50%,能效提高了 60%。
Gaudi 3 得到了 Dell Technologies、Supermicro、Lenovo 和 HPE 等顶级 OEM 厂商的支持,并通过 PCIe 卡支持等功能进行了增强,成为在 AI 领域具有巨大潜力的 GPU。
英特尔至强 6 处理器
除了英特尔 Gaudi 3 加速器之外,英特尔还通过全新英特尔至强 6 处理器,提供了跨企业人工智能所有领域的下一代产品和服务的更新。
英特尔至强 6 处理器将提供高性能的解决方案来运行当前的 GenAI 解决方案,包括 RAG,这些解决方案使用专有数据生成特定于业务的结果。英特尔为其下一代数据中心、云和边缘处理器推出了新品牌。配备全新高效核心(E 核心)的英特尔至强 6 处理器将提高效率。与此同时,具有高性能核心(P 核心)的英特尔至强 6 将提供更高的 AI 性能,并将在 E 核心处理器之后不久推出。
与第二代英特尔至强处理器相比,采用 E 核的英特尔至强 6 处理器(以前的代号为 Sierra Forest)预计每瓦性能提高 2.4 倍,机架密度提高 2.7 倍。具有 P 核的英特尔至强 2 处理器(以前的代号为 Granite Rapids)集成了对 MXFP6 数据格式的软件支持,与使用 FP4 的第四代至强相比,后续令牌延迟减少了多达 6.5 倍,并且能够运行 4 亿个参数 Llama16楷模。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅