inicio Empresa Revisión de AMD EPYC de cuarta generación (AMD Génova)

Revisión de AMD EPYC de cuarta generación (AMD Génova)

by Jordan Ranous

AMD ha anunciado la disponibilidad general de las nuevas CPU EPYC 9004 de cuarta generación. Con el nombre en código AMD Genoa, la nueva línea de CPU admite 4 canales de DDR12-5 (hasta 4800 TB de capacidad de memoria por socket), 6 carriles de PCIe Gen128, tecnología AMD Infinity Fabric/Guard y hasta 5 núcleos. Esto los hace ideales para cargas de trabajo críticas en la nube, la empresa y la computación de alto rendimiento.

AMD ha anunciado la disponibilidad general de las nuevas CPU EPYC 9004 de cuarta generación. Con el nombre en código AMD Genoa, la nueva línea de CPU admite 4 canales de DDR12-5 (hasta 4800 TB de capacidad de memoria por socket), 6 carriles de PCIe Gen128, tecnología AMD Infinity Fabric/Guard y hasta 5 núcleos. Esto los hace ideales para cargas de trabajo críticas en la nube, la empresa y la computación de alto rendimiento.

Beneficios de las CPU de cuarta generación EPYC 9004 para empresas

Con su recuento masivo de 96 núcleos en un solo procesador, los nuevos procesadores AMD Genoa permitirán a las organizaciones reducir su huella física al implementar menos servidores y aprovechar servidores más potentes. Esto aporta una mayor flexibilidad a los ecosistemas de los centros de datos y les ayuda a alcanzar objetivos de sostenibilidad y preparación para el futuro.

Servidor AMD Génova

AMD construyó sus nuevos procesadores EPYC con un gran enfoque en la seguridad mejorada, particularmente con la expansión de AMD Infinity Guard, el conjunto de características de la compañía que ofrece capas de protección tanto físicas como virtuales para sus CPU. Por ejemplo, cuenta con el doble de claves de cifrado en comparación con las generaciones anteriores, lo que ayuda a los clientes a mantener sus datos seguros, ya sea que estén almacenados localmente, en la nube o residiendo en un almacenamiento.

Las organizaciones podrán beneficiarse de su conjunto de características "todo incluido", con opciones para elegir un modelo con el número de núcleos y la frecuencia (consulte la tabla a continuación) que mejor se adapte a sus necesidades. Además, los procesadores AMD EPYC de cuarta generación ahora admiten memoria DDR4 y PCIe Gen 5, los cuales son vitales para las aplicaciones de inteligencia artificial y aprendizaje automático. Por supuesto, los proveedores de SSD empresariales están ansiosos por llevar sus unidades a la corriente principal, desbloqueando el doble de potencial de ancho de banda que Gen 5.

SKU de la serie AMD Genoa 9004

Modelo Colores TDP predeterminado cTDP Base (GHz) impulso (GHz)
9654 96 360w 320-400w 2.4 3.7
9634 84 290w 240-300w 2.25 3.7
9554 64 360w 320-400w 3.1 3.75
9534 64 280w 240-300w 2.45 3.7
9454 48 290w 240-300w 2.75 3.8
9354 32 280w 240-300w 3.25 3.8
9334 32 210w 200-240w 2.7 3.9
9254 24 200w 200-240w 2.9 4.15
9224 24 200w 200-240w 2.5 3.7
9124 16 200w 200-240w 3.0 3.7
9474F 48 360w 320-400w 3.6 4.1
9374F 32 320w 320-400w 3.85 4.3
9274F 24 320w 320-400w 4.05 4.3
9174F 16 320w 320-400w 4.1 4.4
9654P 96 360w 320-400w 2.4 3.7
9554P 64 360w 320-400w 3.1 3.75
9454P 48 290w 240-300w 2.75 3.8
9354P 32 280w 240-300w 3.25 3.8

AMD Génova – Arquitectura Zen 4

Lanzado en septiembre pasado, Zen 4 es la nueva microarquitectura para las CPU AMD EPYC 9004, que presenta el núcleo de mayor rendimiento de AMD hasta la fecha. Esto ayuda a las CPU EPYC 9004 a ofrecer nuevos niveles de liderazgo en rendimiento y eficiencia energética, y permite a los clientes acelerar la modernización del centro de datos para lograr un mayor rendimiento de las aplicaciones y más información procesable. Zen 4 también impulsa sus nuevos procesadores de escritorio Ryzen 7000 de nivel de consumidor.

amd génova DRAM

Uno de los cambios más grandes que trae Zen 4 es que ya no es compatible con la memoria DDR4, ya que se ha movido únicamente a DDR5. Además, Zen 4 es compatible con los nuevos perfiles AMD EXPO SPD, lo que permite un ajuste de memoria y un overclocking más completos por parte de los fabricantes de RAM.

Algunas de las otras características nuevas incluyen:

  • Caché privado rápido de 1M L2
  • Se admiten más fallas sobresalientes de L2 a L3 por núcleo
  • Más fallas sobresalientes admitidas desde L3 a la memoria
  • L3 y L2 mejorados miss BW
  • Un ancho de banda más alto permite mejoras en la captación previa

Descripción general de la microarquitectura Zen 4

Zen 4 frente a Zen 3

Mejoras de la serie AMD EPYC 9004 con respecto a las generaciones anteriores

El nuevo AMD Genoa ofrece una gama de mejoras notables, incluido un aumento en el recuento máximo de núcleos a 96 por CPU. Esto es significativo en comparación con las últimas generaciones:

  • Máxima núcleos 64 por CPU con el 7773X y 7763 (3rd Gen EPYC) modelos
  • Máxima núcleos 40 por CPU con el 8380 (3rd Gen Xeon Platino) modelo

AMD indica que esto se traducirá en aproximadamente 2.3 veces el rendimiento en comparación con su competencia (o 1.6 veces el rendimiento por vatio) cuando se trata de soluciones más rápidas. Este será el mayor impulso en el rendimiento general que hemos visto de sus lanzamientos de próxima generación. Para las operaciones comerciales empresariales por segundo, los 4th Gen AMD espera que sus CPU EPYC ofrezcan ~2.6 veces el rendimiento, al tiempo que insinúan un aumento del rendimiento de 2.4 veces en las velocidades de renderizado cuando se utiliza Arnold Autodesk.

amd genova heatsync

También ofrece una mejora significativa en el rendimiento central debido a la arquitectura Zen 4 y un aumento potencial de ~14 por ciento en la mejora de IPC para CPU de servidor.

La nueva serie EPYC 9004 también tiene capacidades de plataforma de liderazgo que se aprovisionan para escalar:

  • DDR12-5 de 4800 canales con rendimiento de rango único mejorado
  • 128L 32Gps y 8L 8Gps SERDES multifunción (serializador/deserializador)

Además, cuenta con soporte de memoria CXL1.1+ (CXL “Type3”), que incluye capacidad de conexión de memoria avanzada para DDR y memoria emergente, así como extensiones de administración de memoria en niveles, QoS y SEV-SNP. Para mayor seguridad, admite extensiones de clave SEV-SNP y AES-256-XTS.

Memoria de la serie AMD EPYC 9004

Las CPU AMD Genoa admiten 12 canales por CPU, 6 TB por capacidad de socket, hasta DDR4800 y, en teoría, también pueden alcanzar hasta 460 GB/s en ancho de banda máximo.

Aquí hay un vistazo rápido a las comparaciones entre el rendimiento del ancho de banda de la memoria de 3.ª y 4.ª generación:

Posicionamiento de la CPU de la serie AMD EPYC 9004

Al igual que en su generación anterior, AMD ha clasificado sus nuevas CPU en tres grupos diferentes:

  • Rendimiento central, que se compone de CPU de alta frecuencia con una gran proporción de caché/núcleo. Los modelos que se incluyen en esto incluyen 9474F (48 núcleos a 360 W), 9374F (32 núcleos a 320 W), 9274F (24 núcleos a 320 W) y 9174F (16 núcleos a 320 W).
  • Densidad del núcleo, que se compone de las CPU de mayor número de núcleos y subprocesos. Los modelos que se incluyen en esto incluyen 9654/P (96 núcleos a 360 W), 9634 (84 núcleos a 290 W), 9554/P (64 núcleos a 360 W), 9534 (64 núcleos a 280 W) y 9454/P (48 núcleos a 290 W). ).
  • Rendimiento equilibrado y optimizado, que se compone de CPU que ofrecen un equilibrio entre rendimiento y TCO. Los modelos que se incluyen en esto incluyen 9354/P (32 núcleos a 280 W), 9334 (32 núcleos a 210 W), 9254 (24 núcleos a 200 W), 9224 (24 núcleos a 200 W) y 9124 (16 núcleos a 200 W).

Rendimiento de la CPU AMD Genoa 9004

Configuración de evaluación comparativa

Para nuestra prueba inicial, posicionamos las actuales plataformas Intel y AMD de gama alta una contra la otra en un lote inicial de cargas de trabajo intensivas de CPU. Para nuestra plataforma Intel, aprovechamos nuestra plataforma Intel 8380 de doble CPU inicial construida alrededor de un servidor Intel OEM contra nuestra plataforma AMD EPYC 9654 de doble CPU dentro de un chasis Quanta.

Especificaciones de la plataforma Intel:
2 CPU Intel Xeon Platinum 8380 de 40 núcleos
16 memorias DDR32 de 3200 GB y 4 MHz
Sistema operativo Windows Server 2022

Especificaciones de la plataforma AMD:
2 CPU AMD EPYC 9654 de 96 núcleos
24 memorias DDR64 de 4800 GB y 5 MHz
Sistema operativo Windows Server 2022

V-Ray

V-Ray Benchmark es una aplicación de Chaos Group para calificar y comparar varias CPU y GPU. Chaos Group es conocido por su trabajo en visualizaciones y renderizado especializado en tecnología de trazado de rayos. V-Ray Benchmark contiene una escena de prueba de compilación personalizada para probar cualquier combinación de CPU y GPU y comparar el rendimiento de un sistema con otro.

En nuestro laboratorio, utilizamos el punto de referencia de V-Ray en el modo de solo CPU. Para minimizar cualquier cuello de botella potencial, utilizamos un SSD NVMe Solidigm P5520 de 7.68 TB y una instalación limpia de Windows Server 2022. La parte superior de la tabla de clasificación para V-Ray era anteriormente un sistema de procesador de 2 núcleos 7x AMD EPYC 83K64 que obtuvo una impresionante promedio de 100,844 en 6 pruebas. Nuestro sistema de muestra con 2x AMD EPYC Genoa 96-Core obtuvo un promedio de 126,940 9 en XNUMX pruebas. Comparado con el sistema Intel

Compilación de Firefox desde la fuente

Firefox, el navegador de Mozilla, es un gran proyecto de código abierto. Mozilla desea ofrecerle la capacidad de compilar el proyecto a partir del código fuente usted mismo, algo que se ha vuelto más omnipresente como herramienta para comparar el rendimiento. La descarga para esto es de varios gigabytes con miles de archivos que deben compilarse.

En nuestras pruebas, quedamos más que impresionados con el tiempo de 6 minutos y 57 segundos de la plataforma Intel Xeon 8380, hasta que lo disparamos en la plataforma Génova, que llegó a una velocidad increíblemente rápida de 6 minutos y 33 segundos. segundo tiempo de compilación. A modo de comparación, una estación de trabajo de primer nivel podrá completar esta tarea en apenas menos de 10 minutos si la alimenta con una dieta constante de nitrógeno líquido y exceso de voltaje, lo que significa que estamos lidiando con una potencia bruta seria desde el principio con estas fichas

FF Construir desde la fuente
2 x AMD 9654 de 96 núcleos 6:33.85
2 Intel 8380 de 40 núcleos 6:57.85

Blender: punto de referencia de la CLI

Blender Benchmark es un estándar establecido en la escena de evaluación comparativa de CPU y GPU. Blender es una herramienta de animación y modelado 3D de código abierto que es muy avanzada y se considera líder en el espacio. De acuerdo con el tema de los procesadores Genoa EPYC, lo estamos utilizando para mostrar la flexibilidad de tener una arquitectura combinada que es capaz de una CPU y una posible GPU de reemplazo para implementaciones de rack de alta densidad.

Blender tiene tres puntos de referencia, conocidos como Monster, Junkshop y Classroom. Estas son tres escenas que se representan secuencialmente y se les asigna una puntuación a cada sección, que luego se suma para obtener una puntuación total.

Prueba de licuadora 2 x AMD 9654 de 96 núcleos 2 Intel 8380 de 40 núcleos
Monster 1788.189128 671.145395
chatarrería 1062.533142 407.141514
Aulas 850.646333 320.507039
Total 3701.368603 1398.793948

La plataforma de Génova obtuvo un aplastante total de 3701, con 1788.2 en Monster, 1062.5 en Junkshop y 850.6 en el punto de referencia de Classroom. Comparar Genoa con Intel Xeon Platinum puede parecer injusto en algunos aspectos, teniendo en cuenta que Intel solo llega al bate con aproximadamente el 41 por ciento del recuento de núcleos; sin embargo, si observamos los datos y normalizamos la diferencia en el recuento de núcleos, los resultados se vuelven interesantes. . El chip AMD Genoa, gracias a su nueva arquitectura, conjuntos de instrucciones y el uso de DDR5, es aproximadamente un 10 por ciento más rápido que la plataforma Intel.

2 x AMD 9654 de 96 núcleos Porcentaje relativo de recuento de núcleos de Intel 2 Intel 8380 de 40 núcleos
Núcleo 192 41.67 por ciento Núcleo 80
Tema 384 41.67 por ciento Tema 160

 

2 x AMD 9654 de 96 núcleos 2 Intel 8380 de 40 núcleos
Puntuación total de Blender 3701 1399
Núcleos / Hilos 192/384 80/160
Recuento de núcleos Intel/AMD 41.67 por ciento
Comparación de puntuación directa Intel/AMD 37.79 por ciento
Puntaje de AMD normalizado básico 1542
Intel/AMD relativo, núcleo normalizado 90.70 por ciento

Cinebench R23

Cinebench de Maxon ha sido un pilar de la evaluación comparativa desde hace algún tiempo, gracias a su metodología de prueba estandarizada y al uso de pruebas del mundo real para comparar el rendimiento de varios núcleos y de un solo núcleo. R23, la última versión de Cinebench, tiene una limitación que no hemos tenido que solucionar anteriormente; Solo es capaz de comparar 256 núcleos/hilos. Nuestro equipo de prueba tiene 384. Curiosamente, hubo muchos puntos de referencia y aplicaciones "estándar" con los que nos encontramos que tenían un límite de núcleo de 256, por lo que Cinebench no es el único que necesita una actualización para el futuro de recuento de núcleos al que nos dirigimos. hacia.

Para intentar abordar esta limitación, ejecutamos dos pruebas simultáneamente y limitamos cada instancia a 196 subprocesos para intentar dividir la carga de manera uniforme. Por lo general, puede configurar la afinidad de la CPU en el Administrador de tareas; sin embargo, algo estaba bloqueando esta operación con Cinebench, sospechamos que es un indicador que se ha configurado en la forma subyacente en que se llama a la API para la prioridad de la CPU. Intentamos ejecutarlo como usuarios con menos privilegios y lanzarlo con el indicador "start /affinity NODE 0" de la línea de comando para intentar forzarlo, pero no pudimos bloquear la aplicación en un solo nodo NUMA.

Al no poder asignar una afinidad específica para el programa, simplemente ejecutamos la aplicación dos veces y las iniciamos juntas. Los resultados mostraron dos puntajes drásticamente diferentes de las dos instancias de la aplicación, sin embargo, al monitorear el uso de la CPU, pudimos observar que rebotaba entre el 80 y el 100 por ciento de uso durante la prueba.

Instancia única de Cinebench 2 x AMD 9654 de 96 núcleos 2 Intel 8380 de 40 núcleos
Hilo múltiple (256 cap) 85,160 70,540
Unipolares 972 985
Relación MP 87.65x 71.63x

 

2 instancias de Cinebench
Ejecución de prueba 1 de AMD Ejecución de prueba 2 de AMD
Puntuación, 1ª instancia 82,063 68,231
Puntuación, 2ª instancia 57,557 57,221
Total 139,620 125,452

Reflexiones Finales:

El proceso de evaluación comparativa de las CPU AMD EPYC 9004 ha sido un ejercicio interesante, por decir lo menos. Los desafíos que enfrentamos en el proceso de revisión inicial son indicativos de los desafíos generales que los desarrolladores de software tendrán que abordar a medida que el panorama de la CPU cambie al modelo de ultra alta densidad. Si bien hay algunas aplicaciones listas para usar que pueden utilizarlo, encontramos cada vez más límites de software que no podían escalar más allá de algunos umbrales de recuento de subprocesos.

En el laboratorio, estamos trabajando en algunos puntos de referencia de Tensorflow Machine Learning de cosecha propia para poder probar estas nuevas CPU en escenarios del mundo real. Seguiremos con los resultados cuando tengamos confianza en los resultados de la nueva aplicación y la hayamos validado en varias plataformas y generaciones de CPU.

Sin embargo, por ahora, el lanzamiento de AMD Genoa es muy emocionante, como hemos visto hasta ahora con el servidor Quanta. Más, HPE y Dell han anunciado sus servidores, cada uno de los cuales ofrece cuatro sistemas, dos chasis de 1 CPU y dos chasis de 2 CPU. Esto traerá a AMD Genoa a la empresa de inmediato, expandiendo rápidamente la huella de Genoa más allá de los hiperescaladores.

amd genova cpu desnudo

Entonces, la gran pregunta es obvia: ¿vale la pena la inversión en AMD Genoa? Esto se reducirá a la carga de trabajo en términos de justificar el gasto, pero al igual que DPU para VMware, estas nuevas tecnologías de CPU tienen mucho que ofrecer en términos de potencia informática, seguridad y eficiencia. Reemplazar EPYC de 3.ª generación con estos probablemente sea un poco prematuro, pero cualquiera que haya estado esperando una razón para saltar debería estar muy feliz de ver lo que Génova ha traído a la mesa.

Tenemos muchas más pruebas y trabajo por hacer y con Intel Sapphire Rapids próximamente, querremos comparar lo mejor que cada uno tiene para ofrecer. Pero por ahora, AMD Genoa es extremadamente convincente y debería estar en cualquier PoC de actualización de infraestructura para que las organizaciones puedan comprender mejor el impacto de todos estos núcleos y eficiencias que AMD tiene para ofrecer.

Vídeo de lanzamiento de AMD

Interactuar con StorageReview

Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed