Inicio Empresa Lanzamiento de los procesadores escalables Intel Xeon de cuarta generación

Lanzamiento de los procesadores escalables Intel Xeon de cuarta generación

by lyle smith
Intel xeon de cuarta generación escalable con hbm

Intel ha lanzado sus procesadores escalables Intel Xeon de cuarta generación (Sapphire Rapids), Intel Xeon CPU Max Series (Sapphire Rapids HBM) y Intel Data Center GPU Max Series (Ponte Vecchio). Están diseñados específicamente para mejorar el rendimiento, la eficiencia, la seguridad y las capacidades del centro de datos para IA, computación en la nube, redes, computación perimetral y supercomputadoras. Intel se está asociando con los clientes para ofrecer soluciones y sistemas personalizados utilizando los nuevos productos para satisfacer las necesidades informáticas a escala.

Intel ha lanzado sus procesadores escalables Intel Xeon de cuarta generación (Sapphire Rapids), Intel Xeon CPU Max Series (Sapphire Rapids HBM) y Intel Data Center GPU Max Series (Ponte Vecchio). Están diseñados específicamente para mejorar el rendimiento, la eficiencia, la seguridad y las capacidades del centro de datos para IA, computación en la nube, redes, computación perimetral y supercomputadoras. Intel se está asociando con los clientes para ofrecer soluciones y sistemas personalizados utilizando los nuevos productos para satisfacer las necesidades informáticas a escala.

Actualmente hay más de 100 millones de procesadores Xeon individuales en uso en todo el mundo. ¿Por qué son tan populares? Bueno, están disponibles en varias configuraciones y están diseñados para ser escalables, lo que les permite usarse en una amplia gama de aplicaciones y entornos. También se pueden personalizar para cargas de trabajo o aplicaciones específicas, ofrecen una gama de características de seguridad para ayudar a proteger contra amenazas como malware y filtraciones de datos, y son muy eficientes energéticamente.

Procesador Intel 4.ª generación Xeon delante y detrásModelos de CPU escalables Intel Xeon de cuarta generación

Los nuevos modelos Xeon están disponibles en seis categorías, incluidos Max 9400, Platinum 8000, Gold 6000, Gold 5000, Silver 4000 y Bronze 3000, así como la serie Max. Cada serie tiene una gama de modelos diferentes que se pueden profundizar en su caso de uso objetivo:

  • Propósito general de rendimiento
  • Propósito general de la línea principal
  • Uso general de refrigeración líquida
  • Propósito general de enchufe único (serie “Q”)
  • Propósito general de uso de larga duración (IoT) (serie “T”)
  • IMDB/Analytics/virtualización optimizada (serie “H”)
  • 5G/redes optimizadas (serie “N”)
  • IaaS optimizado para la nube (series “P”, “V” y “M”)
  • Almacenamiento e infraestructura hiperconvergente optimizada (serie “S”)
  • Optimizado para HPC (es decir, la serie Intel Xeon CPU Max)

Silicio escalable Intel Xeon de cuarta generación

Por ejemplo, los poderosos Platinum 8400 Los procesadores están diseñados para análisis de datos avanzados, IA y centros de datos de nube híbrida, y ofrecen alto rendimiento, capacidades de plataforma y aceleración de cargas de trabajo, así como seguridad mejorada basada en hardware y procesamiento de múltiples sockets. Estos procesadores también ofrecen hasta 60 núcleos por procesador (un aumento de 20 núcleos en comparación con los mejores Modelo Xeon de tercera generación), ocho canales de memoria y aceleración de IA con Intel AMX.

Intel xeon de cuarta generación escalable con hbm

Intel Xeon Gold 6400 y Oro 5400 Los procesadores están optimizados para centros de datos y cargas de trabajo de varias nubes. Ofrecen mayor velocidad de memoria, capacidad, seguridad y aceleración de la carga de trabajo. Intel Xeon Silver 4400 Los procesadores brindan un rendimiento esencial, velocidad de memoria mejorada y eficiencia energética para la informática, las redes y el almacenamiento de centros de datos básicos.

Aquí hay un resumen detallado de cada CPU Xeon y su caso de uso específico:

Caracteristicas Procesadores escalables Intel Xeon de cuarta generación Serie máxima de CPU Intel Xeon
Recuento extremo de núcleos (XCC) Recuento medio de núcleos (MCC) Memoria de gran ancho de banda (HBM)
 

Construcción de matrices

Cuatro mosaicos conectados mediante MDF a través de Intel Embedded Multi-die Interconnect Bridge (EMIB)  

Un chip monolítico

Cuatro mosaicos conectados mediante MDF a través de Intel Embedded Multi-die Interconnect Bridge (EMIB)
Núcleo Hasta 60 núcleos activos Hasta 32 núcleos activos Hasta 56 núcleos activos
Rango de TDP 225 a 350 W 125 a 350 W 350W
 

Salud Cerebral

DDR5 @ 4800 (1 DPC), 4400 (2DPC), 16 Gb DRAM, 8 canales

Intel Optane PMem 300 (pase de cuervo) a 4400 MT/s

DDR5 @ 4800 (1 DPC), 4400 (2DPC), 8 canales

Memoria HBM64e de 2 GB con hasta 1.14 GB/núcleo

UPI de Intel UPI 2.0 a 16 GT/s, hasta 4 interconexiones Ultra Path UPI 2.0 a 16 GT/s, hasta 3 interconexiones Ultra Path UPI 2.0 a 16 GT/s, hasta 4 interconexiones Ultra Path
Escalabilidad 1 enchufe, 2 enchufes, 4 enchufes, 8 enchufes 1 enchufe, 2 enchufes, 4 enchufes 1 enchufe, 2 enchufes
Enlace PCIe/Compute Express PCIe 5.0 (80 carriles),

Hasta 4 dispositivos compatibles a través de Compute Express Link (CXL) 1.1

Seguridad Intel SGX

Tamaño mínimo de caché de página de Enclave (EPC) 256 MB

Intel SGX (solo modo plano)
Aceleradores IP integrados Intel QAT, DLB, IAA, DSA (hasta 4 dispositivos cada uno) Intel QAT, DLB (hasta 2 dispositivos cada uno), Intel DSA, IAA (1 dispositivo cada uno) Intel DSA (4 dispositivos)

Los procesadores escalables Intel Xeon de cuarta generación tienen como objetivo mejorar el rendimiento y abordar varios desafíos informáticos relacionados con la IA, el análisis, las redes, la seguridad, el almacenamiento y la informática de alto rendimiento (HPC). Estos procesadores se destacan por tener la mayor cantidad de aceleradores integrados de cualquier CPU.

Según Intel, los clientes de Intel Xeon Scalable de cuarta generación pueden esperar una mejora de rendimiento promedio en lo siguiente:

  • 9 veces la mejora en la eficiencia por vatio cuando se utilizan aceleradores integrados,
  • Ahorro de energía de 70 vatios por CPU en modo de energía optimizado con pérdida mínima de rendimiento,
  • Reducción del cincuenta y cinco por ciento en el costo total de propiedad y el consumo de energía en comparación con las generaciones anteriores.

Intel Xeon escalable de cuarta generación: eficiencia energética mejorada

El nuevo modo de energía optimizado puede proporcionar hasta un 20 por ciento de ahorro de energía en el socket con menos del 5 por ciento de impacto en el rendimiento para cargas de trabajo específicas. Las innovaciones en refrigeración por aire y líquido pueden reducir aún más el consumo total de energía del centro de datos.

Las CPU escalables Intel Xeon de cuarta generación están equipadas con una gran cantidad de aceleradores integrados, que pueden ayudar a ahorrar energía a nivel de plataforma y reducir la necesidad de aceleración adicional. Esto puede ayudar a sus clientes a alcanzar sus objetivos de sostenibilidad. Además, se espera que el Modo de energía optimizado recién introducido proporcione hasta un 4 por ciento de ahorro de energía del socket con un impacto mínimo en el rendimiento para cargas de trabajo específicas.

Sostenibilidad escalable Intel Xeon de cuarta generación

Las innovaciones en refrigeración por aire y líquido pueden reducir aún más el consumo total de energía del centro de datos. Los procesadores Xeon de cuarta generación también se fabricaron con un 4 % o más de electricidad renovable en sitios de Intel con instalaciones avanzadas de recuperación de agua.

Nuevos avances en el rendimiento de la IA

En comparación con la generación anterior, se dice que los procesadores Xeon de cuarta generación logran un rendimiento de entrenamiento e inferencia en tiempo real de PyTorch hasta 4 veces mayor con el uso de sus aceleradores Advanced Matrix Extension (Intel AMX),

PyTorch es un marco de aprendizaje automático para construir y entrenar redes neuronales. La inferencia en tiempo real implica el uso de un modelo de red neuronal entrenado para hacer predicciones o decisiones en tiempo real basadas en nuevos datos de entrada. Un mayor rendimiento de capacitación e inferencia en tiempo real de PyTorch es esencial para los procesadores Intel, ya que les permite ejecutar cargas de trabajo de aprendizaje automático que involucran predicciones en tiempo real o toma de decisiones de manera más eficiente.

Esto es especialmente útil en aplicaciones donde las predicciones o decisiones rápidas y precisas son primordiales. Además, un mayor rendimiento en las tareas de aprendizaje automático puede conducir a un entrenamiento más rápido de modelos y predicciones más precisas, así como a la capacidad de usar modelos más grandes y complejos.

Como tal, Intel dice que sus nuevos procesadores escalables Intel Xeon de cuarta generación pueden proporcionar aún más capacidades para el procesamiento de lenguaje natural, reclamando una velocidad de hasta 4 veces en modelos de lenguaje grande.

El paquete de software de IA de Intel, probado con más de 400 modelos de IA de aprendizaje automático y aprendizaje profundo en varias industrias y aplicaciones, se puede utilizar con la herramienta de IA preferida del desarrollador para aumentar la productividad y acelerar el desarrollo de la IA. La suite está diseñada para ser portátil, lo que permite su uso en la estación de trabajo y su implementación en el perímetro y en la nube.

Capacidades de red

Los procesadores escalables Intel Xeon de cuarta generación también ofrecen modelos específicamente optimizados para redes de alto rendimiento y baja latencia y cargas de trabajo perimetrales. Estos procesadores juegan un papel crucial en la conducción de un futuro más definido por software para industrias como las telecomunicaciones, el comercio minorista, la fabricación y las ciudades inteligentes. Para las cargas de trabajo principales de 4G, los aceleradores integrados pueden ayudar a aumentar el rendimiento y disminuir la latencia, mientras que las mejoras en la administración de energía mejoran la capacidad de respuesta y la eficiencia de la plataforma.

También pueden duplicar la capacidad de la red de acceso de radio virtualizada (vRAN) en comparación con 3rdProcesadores -gen Xeon (sin consumir más energía). En general, los procesadores con una mayor capacidad de vRAN pueden manejar de manera más eficiente y eficaz el tráfico de datos de la red, como reducir la latencia y mejorar el rendimiento general. Esto es particularmente importante para aplicaciones que requieren comunicación en tiempo real.

Intel indica que esto permitirá a los proveedores de servicios de comunicaciones duplicar su rendimiento por vatio y satisfacer sus necesidades de rendimiento y eficiencia energética. El aumento de vRAN también permitiría a las organizaciones escalar hacia arriba o hacia abajo más fácilmente a medida que cambia la cantidad de cargas de trabajo de vRAN, lo que significa una mayor flexibilidad en los recursos de la red (por ejemplo, sin necesidad de hardware, energía o infraestructura adicionales).

HPC

Sistema HPC escalable Intel Xeon de cuarta generación en el laboratorio de Intel

Compute blade (chasis abierto) en el laboratorio Intel HPC

Los productos Intel Xeon Scalable e Intel Max Series de cuarta generación ofrecen una arquitectura escalable y equilibrada que combina CPU y GPU con el ecosistema de software abierto de oneAPI para cargas de trabajo informáticas exigentes en HPC e IA. Intel afirma que esta arquitectura está diseñada específicamente para abordar los problemas más difíciles del mundo actual.

El software abierto OneAPI es un conjunto de herramientas y bibliotecas que permiten a los desarrolladores escribir código que puede ejecutarse en varias plataformas de hardware (incluidas CPU, GPU y otros procesadores especializados) utilizando un único conjunto de interfaces de programación. Esto puede facilitar el desarrollo y la optimización de aplicaciones para diversos entornos informáticos.

Compute blade en el laboratorio Intel HPC

Compute blade en el laboratorio Intel HPC

En Jones Farm de Intel, StorageReview obtuvo una mirada detrás de escena de Borealis. Intel, HPE y el Laboratorio Nacional de Argonne están trabajando para ofrecer la supercomputadora Aurora, que se implementará con las nuevas plataformas de GPU de centro de datos y Xeon de cuarta generación anunciadas hoy.

Borealis es un minisistema de dos estantes ubicado en el laboratorio de Jones Farm en Oregón que valida el sistema Aurora y sus nuevas tecnologías. Tiene la misma arquitectura y diseño que Aurora y se está probando para validar todos los componentes del software y los sistemas de refrigeración líquida antes de que el sistema se instale a gran escala en el Laboratorio Nacional de Argonne.

Sistema de enfriamiento por agua: gerente de laboratorio en Jones Farm HPC Lab: Borealis muestra los tubos rojos y azules que forman parte del sistema de enfriamiento por agua para mantener los estantes frescos.

Sistema de enfriamiento por agua: gerente de laboratorio en Jones Farm HPC Lab: Borealis muestra los tubos rojos y azules que forman parte del sistema de enfriamiento por agua para mantener los estantes frescos.

La serie Max de CPU/GPU Intel Xeon

La serie Intel Xeon CPU Max es el primer procesador x86 con memoria de alto ancho de banda que llega al mercado, lo que le permite acelerar muchas cargas de trabajo de HPC sin necesidad de cambios de código. La compañía denomina Intel Data Center GPU Max Series como su procesador de mayor densidad, que estará disponible en varios factores de forma para adaptarse a una variedad de necesidades de los clientes.

La serie Xeon CPU Max ofrece 64 GB de memoria de alto ancho de banda en el paquete, lo que aumenta significativamente el rendimiento de datos para las cargas de trabajo de HPC e IA. En comparación con los procesadores escalables Intel Xeon de 3.ª generación de gama alta, la serie Xeon CPU Max proporciona hasta 3.7 veces más rendimiento en varias aplicaciones del mundo real, como el modelado de sistemas energéticos y terrestres. El ancho de banda de la CPU es esencial para las cargas de trabajo de HPC e IA, ya que a menudo requieren que se procese una gran cantidad de datos y se muevan entre la CPU y la memoria. De lo contrario, puede obstaculizar el rendimiento del sistema y generar tiempos de procesamiento más prolongados.

La serie GPU Max para centros de datos, que cuenta con más de 100 47 millones de transistores en un paquete de 12.8 mosaicos, brinda un mayor rendimiento a las cargas de trabajo que involucran física, servicios financieros y ciencias de la vida. Cuando se combina con la serie Xeon CPU Max, la plataforma puede lograr un rendimiento hasta XNUMX veces mayor que la generación anterior cuando se ejecuta el simulador de dinámica molecular de código abierto LAMMPS (Large-scale Atomic/Molecular Massively Parallel Simulator).

GPU Intel para centros de datos

Intel lanzó el Serie GPU Flex para centros de datos en agosto de 2022, una tarjeta basada en Xe HPG que cuenta con hasta 16 (8 por GPU) núcleos X, 16 TFLOPS y 16 GB de capacidad de memoria.

Intel bajo demanda

Intel On-Demand es un servicio que permite a los clientes ampliar o actualizar los aceleradores y las funciones mejoradas de hardware disponibles en la mayoría de los procesadores escalables Intel Xeon de cuarta generación. El servicio es administrado por Intel y proveedores de hardware y consta de una API para el pedido de licencias y un agente de software para el aprovisionamiento y la activación de licencias.

Los clientes pueden optar por comprar funciones bajo demanda en el momento de la compra o como una actualización posterior a la compra, e Intel también está trabajando en un modelo de adopción de medición en el que las funciones se pueden activar y desactivar según sea necesario, y el pago se basa en uso. La introducción del modelo de activación con los procesadores Xeon de cuarta generación permite a los clientes elegir SKU premium con todas las funciones o agregar funciones en cualquier momento durante el ciclo de vida del procesador.

Los proveedores iniciales de On-Demand incluyen H3C, Inspur, Lenovo, Supermicro y Variscale, con Intel trabajando con proveedores adicionales en sus planes de habilitación.

DRM a nivel de chip, o administración de derechos digitales, se refiere a la tecnología que controla el acceso a ciertas características o capacidades del chip de la computadora. En el contexto de Intel On-Demand, DRM a nivel de chip podría usarse potencialmente para restringir el acceso a ciertas funciones o capacidades de los procesadores escalables Intel Xeon de 4.ª generación, a menos que se compren o activen a través del servicio On-Demand. Esto podría afectar el derecho a la reparación, ya que puede dificultar que las personas o los talleres de reparación independientes accedan y reparen ciertos aspectos de los sistemas equipados con Intel On-Demand.

La sostenibilidad ambiental es una consideración importante cuando se trata del uso y la eliminación de productos tecnológicos, incluidas las CPU empresariales. Si bien Intel On-Demand puede permitir que los clientes amplíen o actualicen las capacidades de sus procesadores, no está claro cómo este servicio puede afectar la sustentabilidad ambiental de los productos. Dado que el TDP del paquete no cambia con la activación, es posible que deba tenerse en cuenta el consumo de energía de las funciones no utilizadas y el potencial de mayor desperdicio electrónico debido a actualizaciones o reemplazos. Es crucial que empresas como Intel consideren los impactos ambientales de sus productos y servicios y trabajen para lograr soluciones más sustentables.

Rendimiento escalable Intel Xeon de cuarta generación Pruebas

El énfasis del procesador escalable Intel Xeon de cuarta generación en mejorar la eficiencia brilla en algunas de nuestras primeras evaluaciones comparativas. Se anuncia que estos nuevos procesadores lograron un aumento del 4 % (para cómputo de uso general) en la eficiencia con respecto a los procesadores escalables Xeon de tercera generación a través de refinamientos de fabricación mejorados y en cargas de trabajo específicas, una mejora de la eficiencia del rendimiento promedio por vatio de 53 veces utilizando aceleradores integrados.

Además de estas mejoras, los chips de nivel medio de nueva generación son tan potentes como los modelos de nivel superior de última generación, lo que los convierte en una opción rentable para los operadores de centros de datos. Estos chips de nivel medio pueden ayudar a los centros de datos a optimizar sus costos y lograr una mejor eficiencia general al ofrecer un rendimiento similar al de los modelos insignia a un precio más bajo.

Tuvimos algunas opciones para probar el rendimiento de Sapphire Rapids y, para mostrar las mejoras de eficiencia, probamos una plataforma de 4.ª generación de gama media con dos Xeon 8454Y ($3,995) y la comparamos con una plataforma de primera línea de 3.ª generación con CPU dual 8380 ($ 9,400). Con las nuevas mejoras de la cuarta generación, nuestro sistema de rango medio pudo mantenerse al día en los puntos de referencia con el modelo insignia de la generación anterior.

Cinebench
2 x 4.ª generación 8452Y (2.0 GHz x 36) 2 x 3.ª generación 8380 (2.3 GHz x 40)
Multi-Core 60075 70540
Unipolares 841 985
Multiplicador de núcleo 71.40x 71.63x
Benchmark de renderizado CLI de Blender
2 x 4.ª generación 8452Y (2.0 GHz x 36) 2 x 3.ª generación 8380 (2.3 GHz x 40)
Monster 652.526942 671.145395
chatarrería 401.119468 407.141514
Aulas 308.802541 320.507039
Total 1362.448951 1398.793948

Además, en una prueba de entrenamiento interna del modelo de IA, observamos un aumento aproximado del 5 % en el rendimiento, midiendo 95 minutos para el 3 de 8380.ª generación frente a 90 minutos para el 4Y de 8452.ª generación. 

En general, las mejoras en la eficiencia que ofrecen los procesadores escalables Intel Xeon de cuarta generación los convierten en una opción atractiva para los operadores de centros de datos que buscan reducir su consumo de energía y sus costos. Los procesadores de uso general ofrecen un excelente equilibrio entre rendimiento y eficiencia, lo que los convierte en una opción sólida para una amplia gama de cargas de trabajo. Estamos entusiasmados de comenzar a probar aceleradores específicos en las cargas de trabajo del centro de datos, incluido el Acelerador de almacenamiento de datos.

Impacto en el mercado

En nuestro Los procesadores escalables Intel Xeon de cuarta generación finalmente se envían a la empresa, los proveedores de la nube los han tenido durante algún tiempo, la batalla está en marcha con CPU AMD Génova en el centro de datos. Si bien se encuentra en un nivel alto, es realmente fácil observar el conteo masivo de carriles PCI de Génova y declararlos vencedores. Pero seleccionar la CPU correcta en estos días es mucho más complicado que eso. Existe un delicado equilibrio entre costo, energía, rendimiento y calificación con componentes adicionales en el sistema. Ah, y no descuidemos la importancia de comprender la carga de trabajo para alinearla con la CPU correcta. 

Así que hoy en día, no hay una respuesta fácil a la pregunta de quién es mejor, Génova o Sapphire Rapids. Eso tomará tiempo para que Dell, HPE, Supermicro, Lenovo y otros lleven sistemas al mercado. Con la adopción de nuevos Factores de forma SSD sucediendo ahora mismo en servidores, soporte para rendimiento Gen5 y nuevas opciones de redes y aceleradores de alta velocidad como DPU, el juego está en marcha. Esto, sin embargo, no es una batalla de las hojas de especificaciones. La responsabilidad recae en la organización de TI de la empresa para ser lo más diligente e informada posible para garantizar que están invirtiendo en sistemas que respalden adecuadamente las necesidades de sus aplicaciones. Y ese puede ser el mayor desafío de todos. Con tantas opciones, los socios de TI sofisticados pueden ser más críticos ahora que nunca.

Interactuar con StorageReview

Boletín informativo | Canal de YouTube | Podcast iTunes/Spotify | @Instagram | Twitter | @TikTok | RSS Feed