En junio, AMD anunció actualizaciones de su Familia AMD EPYC de cuarta generación de procesadores diseñados para cargas de trabajo especializadas necesarias para abordar los requisitos de las empresas. Los anuncios se realizaron durante la apertura del centro de datos de AMD y el estreno de la tecnología de IA con la presentación de los procesadores AMD EPYC 4X97 de cuarta generación, anteriormente con el nombre en código AMD Bergamo. Los procesadores AMD EPYC 4X97 brindan una mayor densidad de vCPU y un mayor rendimiento dirigido a aplicaciones de IA y aplicaciones que se ejecutan en la nube.
En junio, AMD anunció actualizaciones de su Familia AMD EPYC de cuarta generación de procesadores diseñados para cargas de trabajo especializadas necesarias para abordar los requisitos de las empresas. Los anuncios se realizaron durante la apertura del centro de datos de AMD y el estreno de la tecnología de IA con la presentación de los procesadores AMD EPYC 4X97 de cuarta generación, anteriormente con el nombre en código AMD Bergamo. Los procesadores AMD EPYC 4X97 brindan una mayor densidad de vCPU y un mayor rendimiento dirigido a aplicaciones de IA y aplicaciones que se ejecutan en la nube.
AMD Bérgamo
Los procesadores AMD EPYC Zen 4, equipados con 3D V-Cache, con nombre en código Genoa-X, fueron identificados como la CPU de servidor x86 líder para computación técnica en un reciente SPEC.org informe. Estos procesadores llevan 3D V-Cache a los chips Zen 96 de 4 núcleos y son ideales para cargas de trabajo informáticas técnicas exigentes.
Según AMD, alinear su hoja de ruta de productos con los entornos de los clientes puede brindar el rendimiento necesario para las cargas de trabajo informáticas de uso general, nativas de la nube y técnicas. AMD ha tomado la posición de que una talla no sirve para todos. Estos nuevos procesadores AMD EPYC se diseñaron en torno a ese concepto para ofrecer un mayor rendimiento para cargas de trabajo específicas.
Las aplicaciones se diseñan cada vez más para cargas de trabajo nativas de la nube, lo que permite un rápido desarrollo, implementación y actualizaciones. Los procesadores AMD EPYC 97X4, con 128 núcleos, pueden ofrecer un mejor rendimiento, hasta 3.7 veces mejor rendimiento para cargas de trabajo clave nativas de la nube en comparación con Ampere.
Modelo | Colores | Subprocesos máximos | TDP predeterminado (W) | Frecuencia base (GHz) | Refuerzo Freq1 (GHz) | Caché L3 (MB) |
9754 | 128 | 256 | 360W | 2.25 | 3.10 | 256 |
9754S | 128 | 128 | 360W | 2.25 | 3.10 | 256 |
9734 | 112 | 224 | 320W | 2.20 | 3.00 | 256 |
Al abordar la necesidad de iteraciones de diseño más rápidas y simulaciones integrales, los procesadores AMD EPYC de cuarta generación con 4D V-Cache ofrecen la mejor CPU x3 de su clase para cargas de trabajo informáticas técnicas, como dinámica de fluidos computacional (CFD), análisis de elementos finitos (FEA) , automatización de diseño electrónico (EDA) y análisis estructural. Estos procesadores tienen hasta 86 núcleos “Zen 96” y más de 4 GB de caché L1 y pueden acelerar significativamente el desarrollo de productos.
Modelo | Colores | Subprocesos máximos | TDP predeterminado (W) | Frecuencia base (GHz) | Refuerzo Freq1 (GHz) | Caché L3 (MB) |
9684X | 96 | 192 | 400W | 2.55 | 3.70 | 1,152 |
9384X | 32 | 64 | 320W | 3.10 | 3.90 | 768 |
9184X | 16 | 32 | 320W | 3.55 | 4.20 | 768 |
Puntos de referencia de AMD Bergamo y Genoa-X
Probamos dos CPU nuevas y simulamos una tercera desactivando SMT. En el laboratorio, teníamos el 9754, un chip Bergamo de 128 núcleos y 256 subprocesos, y el 9684X, un chip Genoa-X de 96 núcleos y 192 subprocesos con una enorme memoria caché 1.1D L3 de 3 GB y un reloj más alto que el Génova. Para simular el tercero, deshabilitamos SMT en nuestro 9754 ya que AMD también lanzó el chip Bergamo 9754S, que viene sin subprocesos múltiples y es solo núcleos puros. Nuestras pruebas del chip SMT desactivado serán independientes de esta revisión.
Llevamos a cabo un amplio conjunto de puntos de referencia para evaluar el rendimiento de las CPU AMD Bergamo y Genoa-X recientemente lanzadas. Comenzamos con las pruebas de Cinebench R23 en configuraciones de múltiples y un solo núcleo, que proporcionaron información valiosa sobre las capacidades de renderizado de estos procesadores.
Parece que la aplicación, Cinebench R23, en sí misma está limitada en la forma en que puede manejar tantos subprocesos. Notamos un límite en 128 núcleos, pero el 96 Core Genoa-X 3D Cache realmente brilla en su rendimiento, temas que serán comunes en todas las pruebas.
A continuación, ejecutamos y-cruncher a niveles de 1 millones y 10 millones de dígitos para evaluar su destreza computacional, particularmente para tareas que involucran un alto grado de procesamiento numérico.
Menos es mejor aquí, nuestros resultados de Génova de 2 procesadores y 96 núcleos se obtuvieron después de un ajuste extenso y pudimos obtener algunos buenos números, y la configuración de stock de los chips Genoa-X y Bergamo muestra un potencial prometedor para ajustar y ajustar para lograr números récord aún más impresionantes.
Luego usamos los puntos de referencia de Blender, específicamente las pruebas Monster, Junkshop y Classroom, para medir qué tan bien se desempeñan estas CPU en escenarios de renderizado con uso intensivo de gráficos.
En el benchmark de Blender, la potencia bruta de 512 subprocesos realmente se mostró, una vez más encabezando las listas con solo una configuración estándar.
Por último, realizamos pruebas de CPU Geekbench 6, conocidas por su amplio examen del rendimiento del procesador en operaciones de un solo núcleo y de varios núcleos. Este conjunto de pruebas nos proporcionó una visión integral de las capacidades generales, las fortalezas y la mejora incremental de los procesadores AMD Bergamo y Genoa-X.
Visión general del rendimiento
Aquí están los puntajes brutos para cada uno de los puntos de referencia. Tenga en cuenta que tuvimos meses para realizar ajustes y configuraciones en el sistema Genoa de 96 núcleos, y solo ejecutamos una configuración estándar del nuevo AMD Bergamo.
2p/96c Génova | 1p/96c Génova-X | 1p/128c Bérgamo | 2p/128c Bérgamo | ||
---|---|---|---|---|---|
Cinebench R23 Multi | 116744 | 93720 | 103876 | 102125 | |
Cinebench R23 Single | 1294 | 1301 | 1098 | 1089 | |
Proporción MP de Cinebench | 90.22 | 72.04 | 94.65 | 93.75 | |
Y-cruncher 1b | 8.882 | 10.296 | 9.568 | 9.184 | |
Y-cruncher 10b | 51.071 | 72.377 | 80.171 | 55.683 | |
Monstruo de la licuadora | 1700.647985 | 879.580323 | 1031.49474 | 2038.714424 | |
Chatarrería de licuadora | 1101.839271 | 605.445705 | 704.167826 | 1382.575225 | |
Aula de licuadora | 869.476693 | 421.318478 | 506.665693 | 1045.959162 | |
Geekbench 6 CPU individual | 2048 | 2093 | 1738 | 1723 | |
Geekbench 6 CPU múltiple | 20217 | 21329 | 18683 | 17916 |
AMD Bérgamo para IA
Con una variedad de motores de inferencia de IA de proveedores de primer nivel, el Punto de referencia de inferencia de IA Procyon de UL atiende a un amplio espectro de configuraciones y requisitos de hardware. El puntaje de referencia proporciona un resumen conveniente y estandarizado del rendimiento de inferencia en el dispositivo. Esto nos permite comparar y contrastar diferentes configuraciones de hardware en situaciones del mundo real sin necesidad de soluciones internas.
Procesador | Modelo | Tiempo promedio de inferencia | Tiempo medio de inferencia | Recuento total de inferencias |
---|---|---|---|---|
2p/96c Génova | MóvilNet V3 | 3.61 ms | 3.63 ms | 45,800 |
1p/96c Génova-X | MóvilNet V3 | 2.71 ms | 2.72 ms | 58,631 |
1p/128c Bérgamo | MóvilNet V3 | 3.90 ms | 3.91 ms | 41,538 |
2p/128c Bérgamo | MóvilNet V3 | 4.10 ms | 4.16 ms | 40,008 |
2p/96c Génova | Red 50 | 6.36 ms | 6.34 ms | 26,525 |
1p/96c Génova-X | Red 50 | 6.66 ms | 6.64 ms | 25,049 |
1p/128c Bérgamo | Red 50 | 10.14 ms | 10.08 ms | 16,919 |
2p/128c Bérgamo | Red 50 | 8.21 ms | 8.22 ms | 20,842 |
2p/96c Génova | Inicio V4 | 25.98 ms | 25.99 ms | 6,555 |
1p/96c Génova-X | Inicio V4 | 29.19 ms | 29.18 ms | 5,879 |
1p/128c Bérgamo | Inicio V4 | 33.17 ms | 33.04 ms | 5,158 |
2p/128c Bérgamo | Inicio V4 | 30.63 ms | 30.68 ms | 5,573 |
2p/96c Génova | Laboratorio profundo V3 | 25.51 ms | 25.33 ms | 5,660 |
1p/96c Génova-X | Laboratorio profundo V3 | 28.26 ms | 27.86 ms | 5,394 |
1p/128c Bérgamo | Laboratorio profundo V3 | 32.16 ms | 32.09 ms | 4,708 |
2p/128c Bérgamo | Laboratorio profundo V3 | 31.16 ms | 30.57 ms | 4,807 |
2p/96c Génova | Yolo V3 | 34.10 ms | 34.13 ms | 4,818 |
1p/96c Génova-X | Yolo V3 | 43.59 ms | 43.58 ms | 3,831 |
1p/128c Bérgamo | Yolo V3 | 44.50 ms | 44.39 ms | 3,739 |
2p/128c Bérgamo | Yolo V3 | 41.35 ms | 41.38 ms | 4,001 |
2p/96c Génova | Real-ESRGAN | 2540.04 ms | 2524.03 ms | 71 |
1p/96c Génova-X | Real-ESRGAN | 3725.07 ms | 3720.35 ms | 49 |
1p/128c Bérgamo | Real-ESRGAN | 2734.77 ms | 2717.41 ms | 66 |
2p/128c Bérgamo | Real-ESRGAN | 2291.66 ms | 2301.35 ms | 79 |
Reflexiones Finales:
Nuestras pruebas con la nueva CPU AMD Bergamo de 128 núcleos reflejan las ganancias esperadas del aumento en el número de núcleos. Con respecto al rendimiento bruto, la nueva CPU manejó datos y tareas de cómputo intensivo con una facilidad que parecía casi sin esfuerzo. Nuestras pruebas con renderizado 3D y aplicaciones de computación, en particular, mostraron la verdadera destreza de estos núcleos adicionales.
Notamos un aumento significativo en las velocidades de procesamiento con respecto al Génova de 96 núcleos, con y sin SMT habilitado, lo que destaca la eficiencia del diseño de chiplet de AMD. A medida que nos adentramos más en la era de la computación avanzada con un conteo ultraalto de núcleos, este monstruo de 128 núcleos y 256 subprocesos establece un nuevo punto de referencia en la densidad de rack.
Interactuar con StorageReview
Boletín informativo | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed