홈페이지 Enterprise 4세대 Intel Xeon 확장 가능 프로세서 출시

4세대 Intel Xeon 확장 가능 프로세서 출시

by 라일 스미스
hbm으로 확장 가능한 4세대 인텔 제온

인텔은 4세대 인텔 제온 확장 가능 프로세서(Sapphire Rapids), 인텔 제온 CPU Max 시리즈(Sapphire Rapids HBM) 및 인텔 데이터 센터 GPU Max 시리즈(Ponte Vecchio)를 출시했습니다. AI, 클라우드 컴퓨팅, 네트워크, 에지 컴퓨팅 및 슈퍼컴퓨터를 위한 데이터 센터 성능, 효율성, 보안 및 기능을 개선하기 위해 특별히 제작되었습니다. 인텔은 대규모 컴퓨팅 요구 사항을 충족하기 위해 신제품을 사용하여 맞춤형 솔루션 및 시스템을 제공하기 위해 고객과 협력하고 있습니다.

인텔은 4세대 인텔 제온 확장 가능 프로세서(Sapphire Rapids), 인텔 제온 CPU Max 시리즈(Sapphire Rapids HBM) 및 인텔 데이터 센터 GPU Max 시리즈(Ponte Vecchio)를 출시했습니다. AI, 클라우드 컴퓨팅, 네트워크, 에지 컴퓨팅 및 슈퍼컴퓨터를 위한 데이터 센터 성능, 효율성, 보안 및 기능을 개선하기 위해 특별히 제작되었습니다. 인텔은 대규모 컴퓨팅 요구 사항을 충족하기 위해 신제품을 사용하여 맞춤형 솔루션 및 시스템을 제공하기 위해 고객과 협력하고 있습니다.

현재 전 세계적으로 100억 개가 넘는 개별 Xeon 프로세서가 사용되고 있습니다. 왜 그렇게 인기가 있습니까? 다양한 구성으로 제공되며 확장 가능하도록 설계되어 광범위한 응용 프로그램 및 환경에서 사용할 수 있습니다. 또한 특정 워크로드 또는 애플리케이션에 맞게 사용자 정의할 수 있고, 맬웨어 및 데이터 침해와 같은 위협으로부터 보호하는 데 도움이 되는 다양한 보안 기능을 제공하며 에너지 효율성이 높습니다.

Intel 4세대 Xeon 프로세서 전면 및 후면4세대 Intel Xeon 확장 가능 CPU 모델

새로운 Xeon 모델은 Max 시리즈뿐만 아니라 Max 9400, Platinum 8000, Gold 6000, Gold 5000, Silver 4000 및 Bronze 3000을 포함한 XNUMX가지 범주로 제공됩니다. 각 시리즈에는 대상 사용 사례로 드릴다운할 수 있는 다양한 모델이 있습니다.

  • 성능 범용
  • 메인라인 범용
  • 액체 냉각 범용
  • 단일 소켓 범용("Q" 시리즈)
  • 장기 사용(IoT) 범용("T" 시리즈)
  • IMDB/분석/가상화 최적화("H" 시리즈)
  • 5G/네트워킹 최적화("N" 시리즈)
  • 클라우드에 최적화된 IaaS("P", "V" 및 "M" 시리즈)
  • 스토리지 및 하이퍼컨버지드 인프라 최적화("S" 시리즈)
  • HPC 최적화(즉, Intel Xeon CPU Max 시리즈)

4세대 Intel Xeon 확장 가능 실리콘

예를 들어, 강력한 플래티넘 8400 프로세서는 고급 데이터 분석, AI 및 하이브리드 클라우드 데이터 센터용으로 설계되어 고성능, 플랫폼 기능 및 워크로드 가속화는 물론 향상된 하드웨어 기반 보안 및 다중 소켓 처리를 제공합니다. 또한 이러한 프로세서는 프로세서당 최대 60개의 코어를 제공합니다(상위 프로세서에 비해 20개 코어 증가). 3세대 제온 모델), XNUMX개의 메모리 채널, Intel AMX를 통한 AI 가속.

hbm으로 확장 가능한 4세대 인텔 제온

인텔 제온 골드 6400골드 5400 프로세서는 데이터 센터 및 멀티 클라우드 워크로드에 최적화되어 있습니다. 향상된 메모리 속도, 용량, 보안 및 워크로드 가속화를 제공합니다. 인텔 제온 실버 4400 프로세서는 엔트리 레벨 데이터 센터 컴퓨팅, 네트워킹 및 스토리지를 위한 필수 성능, 향상된 메모리 속도 및 전력 효율성을 제공합니다.

다음은 각 Xeon CPU 및 대상 사용 사례에 대한 자세한 설명입니다.

기능 4세대 Intel Xeon 확장 가능 프로세서 인텔 제온 CPU Max 시리즈
익스트림 코어 카운트(XCC) 중간 코어 수(MCC) 고대역폭 메모리(HBM)
 

다이 건설

Intel Embedded Multi-die Interconnect Bridge(EMIB)를 통해 MDF를 사용하여 연결된 XNUMX개의 타일  

하나의 모놀리식 칩

Intel Embedded Multi-die Interconnect Bridge(EMIB)를 통해 MDF를 사용하여 연결된 XNUMX개의 타일
코어 카운트 최대 60개의 활성 코어 최대 32개의 활성 코어 최대 56개의 활성 코어
TDP 범위 225 ~ 350W 125 ~ 350W 350W
 

메모리

DDR5 @ 4800(1DPC), 4400(2DPC), 16Gb DRAM, 8채널

Intel Optane PMem 300(Crow Pass) @4400MT/s

DDR5 @ 4800(1DPC), 4400(2DPC), 8채널

최대 64GB/코어의 2GB HBM1.14e 메모리

인텔 UPI UPI 2.0 @ 16GT/s, 최대 4개의 Ultra Path Interconnect UPI 2.0 @ 16GT/s, 최대 3개의 Ultra Path Interconnect UPI 2.0 @ 16GT/s, 최대 4개의 Ultra Path Interconnect
확장성 1소켓, 2소켓, 4소켓, 8소켓 1소켓, 2소켓, 4소켓 1소켓, 2소켓
PCIe/컴퓨팅 익스프레스 링크 PCIe 5.0(80레인),

Compute Express Link(CXL) 4을 통해 최대 1.1개의 장치 지원

보안 인텔 SGX

최소 엔클레이브 페이지 캐시(EPC) 크기 256MB

Intel SGX(플랫 모드 전용)
통합 IP 가속기 Intel QAT, DLB, IAA, DSA(각각 최대 4개의 장치) Intel QAT, DLB(각 장치 최대 2개), Intel DSA, IAA(각 장치 1개) 인텔 DSA(장치 4개)

4세대 Intel Xeon Scalable 프로세서는 성능을 개선하고 AI, 분석, 네트워킹, 보안, 스토리지 및 고성능 컴퓨팅(HPC)과 관련된 다양한 컴퓨팅 문제를 해결하는 것을 목표로 합니다. 이 프로세서는 모든 CPU에서 가장 많은 가속기를 내장하고 있다는 점에서 주목할 만합니다.

Intel에 따르면 4세대 Intel Xeon Scalable 고객은 다음과 같은 평균 성능 향상을 기대할 수 있습니다.

  • 내장형 가속기를 사용할 때 와트당 효율이 9배 향상되었습니다.
  • 성능 손실을 최소화하면서 최적화된 전원 모드에서 CPU당 70와트 절전,
  • 이전 세대에 비해 총 소유 비용 및 전력 소비가 XNUMX% 감소했습니다.

4세대 Intel Xeon Scalable - 전력 효율성 향상

새로운 최적화된 전원 모드는 특정 워크로드에 대한 성능 영향이 20% 미만인 상태에서 최대 5%의 소켓 전력 절감 효과를 제공할 수 있습니다. 공기 및 액체 냉각의 혁신으로 전체 데이터 센터 에너지 소비를 더욱 줄일 수 있습니다.

4세대 Intel Xeon Scalable CPU에는 다수의 내장형 가속기가 장착되어 있어 플랫폼 수준에서 전력을 절약하고 추가 가속의 필요성을 줄일 수 있습니다. 이를 통해 고객은 지속 가능성 목표를 달성할 수 있습니다. 또한 새로 도입된 Optimized Power Mode는 특정 워크로드의 성능에 미치는 영향을 최소화하면서 최대 20%의 소켓 전력 절감 효과를 제공할 것으로 예상됩니다.

4세대 Intel Xeon 확장 가능한 지속 가능성

공기 및 액체 냉각의 혁신으로 전체 데이터 센터 에너지 소비를 더욱 줄일 수 있습니다. 4세대 Xeon 프로세서는 또한 고급 물 재생 시설을 갖춘 Intel 사이트에서 90% 이상의 재생 가능 전기를 사용하여 제조되었습니다.

AI 성능의 새로운 발전

이전 세대와 비교하여 4세대 Xeon 프로세서는 Intel AMX(Advanced Matrix Extension) 가속기를 사용하여 PyTorch 실시간 추론 및 교육 성능을 최대 10배까지 높일 수 있다고 합니다.

PyTorch는 신경망을 구축하고 훈련하기 위한 기계 학습 프레임워크입니다. 실시간 추론에는 훈련된 신경망 모델을 사용하여 새로운 입력 데이터를 기반으로 실시간 예측 또는 결정을 내리는 것이 포함됩니다. 더 높은 PyTorch 실시간 추론 및 교육 성능은 실시간 예측 또는 의사 결정과 관련된 머신 러닝 워크로드를 보다 효율적으로 실행할 수 있기 때문에 Intel 프로세서에 필수적입니다.

이는 신속하고 정확한 예측 또는 결정이 가장 중요한 애플리케이션에서 특히 유용합니다. 또한 머신 러닝 작업의 성능이 높아지면 모델 학습 속도가 빨라지고 예측이 정확해지며 더 크고 복잡한 모델을 사용할 수 있게 됩니다.

이와 같이 Intel은 새로운 4세대 Intel Xeon Scalable 프로세서가 대규모 언어 모델에서 최대 20배의 속도 향상을 주장하면서 자연어 처리를 위한 추가 기능을 제공할 수 있다고 말합니다.

다양한 산업과 애플리케이션에서 400개 이상의 기계 학습 및 딥 러닝 AI 모델로 테스트된 인텔의 AI 소프트웨어 제품군은 개발자가 선호하는 AI 도구와 함께 사용하여 생산성을 높이고 AI 개발을 가속화할 수 있습니다. 이 제품군은 휴대가 가능하도록 설계되어 워크스테이션에서 사용하고 에지 및 클라우드에 배포할 수 있습니다.

네트워킹 기능

4세대 Intel Xeon Scalable 프로세서는 또한 고성능, 저지연 네트워크 및 에지 워크로드를 위해 특별히 최적화된 모델을 제공합니다. 이러한 프로세서는 통신, 소매, 제조 및 스마트 도시와 같은 산업에서 보다 소프트웨어 정의된 미래를 주도하는 데 중요한 역할을 합니다. 5G 코어 워크로드의 경우 내장된 가속기는 처리량을 늘리고 대기 시간을 줄이는 데 도움이 될 수 있으며 전력 관리 개선은 플랫폼의 응답성과 효율성을 향상시킵니다.

또한 가상 무선 액세스 네트워크(vRAN) 용량을 3에 비해 두 배로 늘릴 수 있습니다.rd-gen Xeon 프로세서(더 많은 전력 소비 없이). 일반적으로 vRAN 용량이 더 높은 프로세서는 대기 시간 감소 및 전반적인 성능 향상과 같이 네트워크 데이터 트래픽을 보다 효율적이고 효과적으로 처리할 수 있습니다. 이는 실시간 통신이 필요한 애플리케이션에 특히 중요합니다.

인텔은 이를 통해 통신 서비스 제공업체가 와트당 성능을 두 배로 늘리고 성능 및 에너지 효율성 요구 사항을 충족할 수 있다고 밝혔습니다. vRAN의 증가는 또한 조직이 vRAN 워크로드의 수 변화에 따라 더 쉽게 확장 또는 축소할 수 있게 해 주므로 네트워크 리소스의 유연성이 향상됩니다(예: 추가 하드웨어, 전력 또는 인프라 필요 없음).

HPC

인텔 연구소의 4세대 인텔 제온 확장 가능 HPC 시스템

Intel HPC 연구소의 컴퓨팅 블레이드(개방형 섀시)

4세대 Intel Xeon Scalable 및 Intel Max 시리즈 제품은 HPC 및 AI의 까다로운 컴퓨팅 워크로드를 위해 CPU 및 GPU를 oneAPI의 개방형 소프트웨어 에코시스템과 결합하는 확장 가능하고 균형 잡힌 아키텍처를 제공합니다. Intel은 이 아키텍처가 오늘날 세계에서 가장 어려운 문제를 해결하기 위해 특별히 설계되었다고 주장합니다.

OneAPI 개방형 소프트웨어는 개발자가 단일 프로그래밍 인터페이스 세트를 사용하여 다양한 하드웨어 플랫폼(CPU, GPU 및 기타 특수 프로세서 포함)에서 실행할 수 있는 코드를 작성할 수 있는 도구 및 라이브러리 세트입니다. 이를 통해 다양한 컴퓨팅 환경을 위한 애플리케이션을 보다 쉽게 ​​개발하고 최적화할 수 있습니다.

Intel HPC 연구소의 컴퓨팅 블레이드

Intel HPC 연구소의 컴퓨팅 블레이드

Intel의 Jones Farm에서 StorageReview는 Borealis의 비하인드 스토리를 살펴보았습니다. Intel, HPE 및 Argonne National Laboratory는 오늘 발표된 새로운 4세대 Xeon 및 Datacenter GPU 플랫폼으로 구현될 Aurora 슈퍼컴퓨터를 제공하기 위해 노력하고 있습니다.

Borealis는 Aurora 시스템과 그 신기술을 검증하는 Oregon의 Jones Farm 연구소에 위치한 XNUMX랙 미니 시스템입니다. 이것은 Aurora와 동일한 아키텍처 및 디자인을 가지고 있으며 시스템이 Argonne National Laboratory에 대규모로 설치되기 전에 소프트웨어 및 액체 냉각 시스템의 모든 구성 요소를 검증하기 위해 테스트되고 있습니다.

수냉 시스템: Jones Farm HPC Lab의 연구실 관리자 – Borealis는 랙을 시원하게 유지하기 위한 수냉 시스템의 일부인 빨간색 및 파란색 튜브를 보여줍니다.

수냉 시스템: Jones Farm HPC Lab의 연구실 관리자 – Borealis는 랙을 시원하게 유지하기 위한 수냉 시스템의 일부인 빨간색 및 파란색 튜브를 보여줍니다.

Intel Xeon CPU / GPU Max 시리즈

Intel Xeon CPU Max 시리즈는 고대역폭 메모리를 탑재한 최초의 x86 프로세서로 코드 변경 없이 많은 HPC 워크로드를 가속화할 수 있습니다. 이 회사는 인텔 데이터 센터 GPU 맥스 시리즈를 자사의 최고 밀도 프로세서로 명명했으며, 이 프로세서는 다양한 고객 요구에 맞게 다양한 폼 팩터로 제공될 것입니다.

Xeon CPU Max 시리즈는 패키지에 64GB의 고대역폭 메모리를 제공하여 HPC 및 AI 워크로드의 데이터 처리량을 크게 증가시킵니다. 최고급 3세대 Intel Xeon Scalable 프로세서와 비교할 때 Xeon CPU Max 시리즈는 에너지 및 지구 시스템 모델링과 같은 다양한 실제 응용 프로그램에서 최대 3.7배 더 높은 성능을 제공합니다. CPU 대역폭은 HPC 및 AI 워크로드에 필수적입니다. CPU와 메모리 간에 대량의 데이터를 처리하고 이동해야 하는 경우가 많기 때문입니다. 그렇지 않으면 시스템 성능에 병목 현상이 발생하여 처리 시간이 길어질 수 있습니다.

100타일 패키지에 47억 개 이상의 트랜지스터를 탑재한 Data Center GPU Max 시리즈는 물리학, 금융 서비스 및 생명 과학과 관련된 워크로드에 향상된 처리량을 제공합니다. Xeon CPU Max 시리즈와 결합하면 플랫폼은 오픈 소스 코드 LAMMPS(Large-scale Atomic/Molecular Massively Parallel Simulator) 분자 역학 시뮬레이터를 실행할 때 이전 세대보다 최대 12.8배 더 높은 성능을 달성할 수 있습니다.

인텔 데이터 센터 GPU

인텔은 데이터 센터 GPU Flex 시리즈 2022년 16월에 최대 8개(GPU당 16개) X 코어, 16 TFLOPS 및 XNUMXGB 메모리 용량을 제공하는 Xe HPG 기반 카드입니다.

인텔 주문형

Intel On-Demand는 고객이 대부분의 4세대 Intel Xeon Scalable 프로세서에서 사용할 수 있는 가속기 및 하드웨어 강화 기능을 확장하거나 업그레이드할 수 있는 서비스입니다. 이 서비스는 인텔과 하드웨어 공급자가 관리하며 라이선스 주문을 위한 API와 라이선스 프로비저닝 및 활성화를 위한 소프트웨어 에이전트로 구성됩니다.

고객은 구매 시 또는 구매 후 업그레이드로 온디맨드 기능을 구매할 수 있으며 인텔은 필요에 따라 기능을 켜고 끌 수 있는 측정 채택 모델도 작업 중이며 결제는 다음을 기반으로 합니다. 용법. 4세대 Xeon 프로세서와 함께 활성화 모델을 도입함으로써 고객은 완전한 기능을 갖춘 프리미엄 SKU를 선택하거나 프로세서 수명 주기 동안 언제든지 기능을 추가할 수 있습니다.

온디맨드의 초기 공급업체에는 H3C, Inspur, Lenovo, Supermicro 및 Variscale이 포함되며 인텔은 추가 공급업체와 협력하여 지원 계획을 수립합니다.

칩 수준 DRM 또는 디지털 권한 관리는 특정 컴퓨터 칩 기능 또는 기능에 대한 액세스를 제어하는 ​​기술을 나타냅니다. Intel On-Demand의 맥락에서 칩 레벨 DRM은 On-Demand 서비스를 통해 구입하거나 활성화하지 않는 한 4세대 Intel Xeon Scalable 프로세서의 특정 기능에 대한 액세스를 제한하는 데 잠재적으로 사용될 수 있습니다. 이는 개인 또는 독립 수리점이 Intel On-Demand가 장착된 시스템의 특정 측면에 액세스하고 수리하는 것을 더 어렵게 만들 수 있으므로 수리 권한에 영향을 미칠 수 있습니다.

엔터프라이즈 CPU를 비롯한 기술 제품의 사용 및 폐기와 관련하여 환경적 지속 가능성은 중요한 고려 사항입니다. Intel On-Demand를 통해 고객은 프로세서의 기능을 확장하거나 업그레이드할 수 있지만 이 서비스가 제품의 환경적 지속 가능성에 어떤 영향을 미칠 수 있는지는 확실하지 않습니다. 패키지의 TDP는 활성화와 함께 변경되지 않으므로 사용하지 않는 기능의 에너지 소비와 업그레이드 또는 교체로 인한 전자 폐기물 증가 가능성을 고려해야 할 수 있습니다. 인텔과 같은 회사는 제품과 서비스가 환경에 미치는 영향을 고려하고 보다 지속 가능한 솔루션을 위해 노력하는 것이 중요합니다.

4세대 Intel Xeon 확장 가능한 성능 지원

4세대 Intel Xeon Scalable 프로세서의 효율성 개선에 대한 강조는 일부 초기 벤치마킹에서 빛을 발합니다. 이 새로운 프로세서는 개선된 제조 개선과 목표 작업 부하에서 내장 가속기를 사용하여 와트당 평균 성능이 53배 향상되어 3세대 Xeon Scalable 프로세서보다 효율성이 2.9%(범용 컴퓨팅의 경우) 증가한 것으로 광고됩니다.

이러한 개선 사항 외에도 차세대 미드티어 칩은 최신 최상위 모델만큼 강력하므로 데이터 센터 운영자에게 비용 효율적인 옵션이 됩니다. 이러한 미드티어 칩은 저렴한 가격으로 플래그십 모델과 유사한 성능을 제공함으로써 데이터 센터가 비용을 최적화하고 전반적인 효율성을 향상시키는 데 도움이 될 수 있습니다.

우리는 Sapphire Rapids의 성능을 테스트할 수 있는 몇 가지 옵션이 있었고 효율성 향상을 보여주기 위해 듀얼 4Y($8454) Xeon을 사용하여 중급 3,995세대 플랫폼을 테스트하고 이를 3세대 최고급 플랫폼과 비교했습니다. 듀얼 8380($9,400) CPU. 4세대의 새로운 개선 사항을 통해 미드레인지 시스템은 이전 세대의 주력 모델과 함께 벤치마크를 유지할 수 있었습니다.

씨네 벤치
2세대 4Y(8452GHz x 2.0) 36개 2 x 3세대 8380(2.3GHz x 40)
멀티 코어 60075 70540
싱글 코어 841 985
코어 멀티플라이어 SR 71.40x SR 71.63x
블렌더 CLI 렌더 벤치마크
2세대 4Y(8452GHz x 2.0) 36개 2 x 3세대 8380(2.3GHz x 40)
몬스터 652.526942 671.145395
정크샵 401.119468 407.141514
교실 308.802541 320.507039
금액 1362.448951 1398.793948

또한 내부 AI 모델 교육 테스트에서 약 5%의 성능 향상을 확인했으며 95세대 3의 경우 8380분, 90세대 4Y의 경우 8452분을 측정했습니다. 

전반적으로 4세대 Intel Xeon Scalable 프로세서가 제공하는 향상된 효율성은 전력 소비와 비용을 줄이려는 데이터 센터 운영자에게 매력적인 옵션입니다. 범용 프로세서는 성능과 효율성의 뛰어난 균형을 제공하므로 광범위한 워크로드에 대한 확실한 선택입니다. Data Storage Accelerator를 포함하여 데이터 센터 워크로드에서 특정 가속기를 테스트하게 되어 기쁩니다.

시장 영향

4세대 Intel Xeon Scalable 프로세서가 마침내 기업에 출하되고 클라우드 공급자는 한동안 이를 가지고 있었으며 전투는 계속되고 있습니다. AMD 제노아 CPU 데이터 센터에서. 높은 수준에서 Genoa의 대규모 PCI 레인 수를 보고 승자로 선언하는 것은 정말 쉽습니다. 그러나 오늘날 올바른 CPU를 선택하는 것은 그보다 훨씬 더 복잡합니다. 비용, 에너지, 성능 및 자격과 시스템의 추가 구성 요소 사이에는 미묘한 균형이 있습니다. 아, 그리고 올바른 CPU에 맞추기 위해 워크로드를 이해하는 것의 중요성을 무시하지 맙시다. 

그래서 오늘날 제노아와 사파이어 래피즈 중 누가 더 나은지에 대한 질문에 대한 쉬운 대답은 없습니다. Dell, HPE, Supermicro, Lenovo 등이 시스템을 시장에 출시함에 따라 시간이 걸릴 것입니다. 신제품 채택으로 SSD 폼 팩터 현재 서버에서 진행 중, Gen5 처리량 지원, 다음과 같은 새로운 고속 네트워킹 및 가속기 옵션 DPU, 게임이 시작됩니다. 그러나 이것은 사양 시트의 전투가 아닙니다. 애플리케이션 요구 사항을 적절하게 지원하는 시스템에 투자하고 있는지 확인하기 위해 가능한 한 부지런하고 정보를 제공해야 할 책임은 엔터프라이즈 IT 조직에 있습니다. 그리고 그것은 모두의 가장 큰 도전일 수 있습니다. 선택의 폭이 넓어짐에 따라 정교한 IT 파트너가 그 어느 때보다 중요해질 수 있습니다.

StorageReview에 참여

뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드