Inicio Empresa Revisión preliminar de Supermicro SuperServer con memoria persistente Intel Optane DC

Revisión preliminar de Supermicro SuperServer con memoria persistente Intel Optane DC

by Brian Beeler

El Supermicro SuperServer 1029U-TN10RT es un sistema completo de doble procesador 1U. Supermicro diseñó el SuperServer para abordar una gran cantidad de casos de uso populares como virtualización, bases de datos, computación en la nube y otros que pueden beneficiarse de la potencia informática de alta densidad. El sistema se ha actualizado para admitir CPU escalables Intel Xeon de segunda generación y es uno de los primeros en enviarse con soporte para Módulos de memoria persistente Intel Optane DC.


El Supermicro SuperServer 1029U-TN10RT es un sistema completo de doble procesador 1U. Supermicro diseñó el SuperServer para abordar una gran cantidad de casos de uso populares como virtualización, bases de datos, computación en la nube y otros que pueden beneficiarse de la potencia informática de alta densidad. El sistema se ha actualizado para admitir CPU escalables Intel Xeon de segunda generación y es uno de los primeros en enviarse con soporte para Módulos de memoria persistente Intel Optane DC (PMM).

Además de la compatibilidad con las últimas tecnologías de centros de datos de Intel, el sistema proporciona almacenamiento a través de diez bahías NVMe de 2.5″ intercambiables en caliente en la parte delantera. Internamente, Supermicro brinda soporte para dos ranuras M.2, una SATA y una NVMe, aunque se pueden agregar ranuras M.2 adicionales como opción. La placa admite 24 ranuras DIMM, que se pueden usar de la forma tradicional con DRAM o con PMEM, como es la configuración en esta revisión. En cuanto a la conectividad, el sistema tiene dos puertos LAN 10GBase-T integrados. La expansión para conectividad adicional está disponible a través de dos ranuras para tarjetas PCI-E 3.0 x16 (FH, 10.5″L).

Como se señaló, nuestro sistema de revisión presenta dos Intel Xeon Scalable 8268 (2.9GHz, 24C) junto con 12 dispositivos DRAM y 12 módulos de memoria persistente Intel Optane DC. Si bien aún es muy temprano en el viaje de la memoria persistente, esta configuración de memoria persistente 4: 1 a DRAM que usa todas las ranuras de memoria en la placa y dos CPU Intel probablemente será una configuración de servidor típica y recomendada para aprovechar al máximo estas nuevas tecnologías. Además de estos componentes básicos, el sistema bajo revisión incluye diez SSD Intel DC P4510 NVMe.

Supermicro SuperServer 1029U-TN10RT Especificaciones

  • Chasis: Ultra 1U SYS-1029U-TN10RT
  • CPU: 2 x Intel Xeon escalable 8268 (2.9 GHz, 24C)
  • Almacenamiento: 10 SSD Intel DC P4510 de 2 TB NVMe, 1 DWPD
  • DRAM: 12 x 32 GB DDR4-2933
  • Memoria persistente: 12 x 128 GB DDR4-2666 Intel Optane DC PMM
  • Red: 2 x 10GBaseT

Diseño y construcción

Como se indicó, el Supermicro SuperServer 1029U-TN10RT es un servidor denso de 1U que puede albergar dos de los nuevos procesadores Intel Xeon Scalable. La mayor parte de la parte frontal del dispositivo está ocupada por bahías para unidades NVMe de 2.5”, diez en total. A la derecha está el panel de control con el botón de encendido, el botón UID y los LED de estado. Debajo hay dos puertos USB 3.0 tipo A.

Volteando el dispositivo hacia atrás, hay dos PSU a la izquierda, seguidos de dos puertos LAN 10GBase-T PJ45, dos puertos USB 3.0, un puerto LAN dedicado para IPMI, un puerto serie, indicador UID y conmutador, puerto de video y dos Ranuras PCIe.

Las bahías de 2.5″ en la parte frontal tienen capacidad de intercambio en caliente y los usuarios pueden empujar fácilmente la pestaña naranja para extender el asa para una rápida extracción/instalación. En este servidor y otros de Supermicro, los caddies naranjas indican compatibilidad con NVMe.

Con el SuperServer equipado con diez bahías de 2.5″, nuestro sistema de revisión se suministró con 10 SSD NVMe Intel P4510 de 2 TB.

Los módulos de memoria persistente Intel Optane tienen el mismo factor de forma que la DRAM tradicional. No requieren cableado de alimentación ni refrigeración adicionales. Los difusores de calor se incluyen como parte del diseño de la memoria persistente, que sigue las mismas consideraciones de diseño que los módulos DRAM en cuanto a ancho y alto. Por lo tanto, no deberíamos ver ningún cambio nuevo para servidores delgados con cubiertas de flujo de aire sobre las ranuras DRAM.

Al igual que con muchos servidores Supermicro, la cubierta superior se quita fácilmente con dos botones y quitando los tornillos de fijación en la parte trasera. Esto proporciona acceso rápido a las nuevas CPU, RAM, instalación de una GPU u otros dispositivos PCIe y, lo que es más importante para esta revisión, instalación de Intel Optane DC PMM.

Desempeno

En nuestro primer vistazo a la nueva memoria persistente Intel Optane DC, nos enfocamos en medir su rendimiento de una forma bastante tradicional; comparando su rendimiento de almacenamiento en bloque con SSD NVMe estándar. Si bien existen diferentes modos para que funcione la memoria persistente, planeamos centrarnos en casos de uso específicos en el futuro cercano en torno al modo de memoria y el nivel de bytes directo de la aplicación. Específicamente, colocamos 12 módulos de memoria persistente de 128 GB (6 por CPU) configurados en dos grupos frente a 10 SSD NVMe Intel P4510 de 2 TB. Nuestra aplicación de referencia en este escenario sigue usando vdbench con nuestras cargas de trabajo de cuatro esquinas, así como con los perfiles de carga de trabajo de la base de datos. En el futuro, volveremos a hacer la transición a FIO, así como a aplicaciones de base de datos que hacen uso de la memoria persistente directamente.

En términos de nuestra configuración técnica de referencia, agrupamos 6 módulos de memoria persistente para formar un solo grupo (un grupo por CPU) y asignamos el espacio completo del grupo al espacio de nombres de la memoria persistente. A nivel del sistema operativo, luego llenamos previamente los módulos de memoria persistente sin procesar, los particionamos al 50 % de su tamaño total y realizamos nuestras cargas de trabajo en esa sección más pequeña. Luego, las cargas de trabajo se aplican con la intención de mostrar un rendimiento sostenido, lo que imita cómo los conjuntos de datos de la aplicación estarían operando en ellas.

Nuestra primera prueba es la prueba de lectura aleatoria de 4K aquí, la memoria persistente comenzó en 1,371,386 4.6 13,169,761 IOPS a 12.1 μs y alcanzó un máximo de 5,263,647 191.4 6 IOPS con una latencia de solo XNUMX μs. Si bien las unidades Intel NVMe funcionaron bien, con un pico de XNUMX XNUMX XNUMX IOPS y una latencia de XNUMX μs, los PMM claramente lo superaron con más del doble de rendimiento y una latencia de solo el XNUMX % de las unidades NVMe.

Al observar la escritura aleatoria de 4K, vemos una limitación de la tecnología cuando se trata de escrituras. Como lo anterior muestra un aumento dramático en el rendimiento, la memoria persistente alcanzará picos mucho más rápido en las escrituras. Aquí, la memoria persistente comenzó en 162,642 8.9 IOPS con una latencia de 980 μs y alcanzó un máximo de alrededor de 60 XNUMX IOPS con una latencia de aproximadamente XNUMX μs antes de caer.

Cambiando a cargas de trabajo secuenciales, en lectura de 64K, los PMM Optane DC comenzaron con 106,739 6.67 IOPS o 31.9 GB/s con una latencia de 1,055,634 μs y alcanzaron un máximo de 65.98 57.2 431,252 IOPS o 26.6 GB/s con una latencia de 721.5 μs. Una vez más, las unidades NVMe funcionaron bien con puntuaciones máximas de XNUMX XNUMX IOPS o XNUMX GB/s con una latencia de XNUMX μs, pero no se acercaron a la de la memoria persistente.

En escrituras secuenciales de 64K, la memoria persistente comenzó con 52,472 1.64 IOPS o 78.8 GB/s con una latencia de 255,405 μs. Los módulos de memoria persistente alcanzaron un máximo de 15.96 121.8 IOPS o 4510 GB/s con una latencia de solo XNUMX μs. Esto contrasta con el grupo Intel PXNUMX que aumentó la latencia a medida que las unidades se acercaban a su punto de saturación y lo superaban.

Lo siguiente son las pruebas SQL VDBench que incluyen SQL, SQL 90-20 y SQL 80-20. Para SQL, la memoria persistente comenzó en 547,821 6.4 IOPS con una latencia de 5,095,690 μs y alcanzó un máximo de 10.7 188,170 170 IOPS con una latencia de XNUMX μs. Las unidades NVMe nuevamente tuvieron un rendimiento sólido con un rendimiento máximo de XNUMX XNUMX IOPS y XNUMX µs.

Para SQL 90-10, las dos comparaciones fueron un poco más cercanas en rendimiento, aunque no hay dudas sobre la latencia, la memoria persistente sin dudas tiene una latencia más baja. La memoria persistente comenzó en 169,874 8.1 IOPS con una latencia de 1,911,900 μs y alcanzó un máximo de 27.1 1,612,337 189.8 IOPS con una latencia de XNUMX μs en comparación con el pico de NVMe de XNUMX XNUMX XNUMX IOPS con una latencia de XNUMX μs.

Para SQL 80-20, la memoria persistente tuvo una mejor latencia máxima, 65.3 μs, pero un rendimiento mucho más bajo, 668,983 1,482,554 IOPS, en comparación con el rendimiento de la unidad NVMe, 206 XNUMX XNUMX IOPS con una latencia de XNUMX μs.

Nuestro lote final de pruebas para esta revisión son nuestras cargas de trabajo de Oracle, Oracle, Oracle 90-10 y Oracle 80-20. La prueba de Oracle mostró que la memoria persistente alcanzó su punto máximo temprano en 453,449 IOPS con una latencia de 103 μs. La unidad NVMe pudo alcanzar un máximo de 1,366,615 225.8 XNUMX IOPS con una latencia de XNUMX μs.

Para Oracle 90-10, la memoria persistente comenzó en 181,455 7.8 IOPS con una latencia de 2,080,543 μs y alcanzó un máximo de 16.9 1,357,112 157.1 IOPS con una latencia de solo XNUMX μs. Una vez más aplastando el rendimiento de la unidad NVMe que alcanzó un máximo de XNUMX XNUMX XNUMX IOPS con una latencia de XNUMX μs.

Finalmente, para nuestro Oracle 80-20, la memoria persistente comenzó en 225,492 8.5 IOPS con una latencia de 1,146,229 μs y alcanzó un máximo de 30.4 1,265,479 165.9 IOPS con una latencia de XNUMX μs. La unidad NVMe tenía un rendimiento más bajo, XNUMX XNUMX XNUMX IOPS, pero también una latencia mucho más alta, XNUMX μs.

Conclusión

El Supermicro SuperServer 1029U-TN10RT es un sistema de dos zócalos con 10 bahías para unidades NVMe de 2.5” que cabe en un espacio de 1U. Además de las bahías para unidades NVMe de 2.5”, el servidor también puede configurarse con dos ranuras de almacenamiento M.2, una SATA y otra NVMe. El servidor está diseñado para virtualización, bases de datos y computación en la nube, entre otros casos de uso que aprovechan un factor de forma denso con alta potencia informática. Hablando de cómputo, el servidor es compatible con las CPU escalables Intel Xeon de segunda generación recientemente lanzadas. Junto a las CPU hay 24 ranuras DIMM. Además de incluir en este servidor una gran cantidad de DRAM, la compatibilidad con las nuevas CPU significa compatibilidad con los nuevos módulos de memoria persistente Optane DC de Intel.

En cuanto al rendimiento, los módulos de memoria persistente de Intel pudieron alcanzar un nivel de rendimiento que aún no se había visto en nuestro laboratorio. Dado que Intel es más o menos el único juego en la ciudad en este momento con memoria persistente, no tenemos competidores o versiones anteriores con las que comparar. En cambio, lo comparamos con las unidades Intel P4510 2TB NVMe como un ejemplo de qué esperar al aprovechar la nueva tecnología. En lecturas, los PMM superaron a la tecnología NVMe con lecturas 4K de 13.2 millones de IOPS con una latencia de solo 12.1 μs y lecturas secuenciales de 64 K que alcanzaron los 66 GB/s con una latencia de solo 57.2 μs. La escritura aleatoria vio una pequeña limitación de la tecnología con la memoria persistente aumentando rápidamente hasta 980K IOPS y una latencia de aproximadamente 60 μs antes de caer, mucho más baja que las unidades NVMe. 64K escribe, sin embargo, la memoria persistente dominó con 15.96 GB/s con una latencia de solo 121.8 μs. Para las pruebas comparativas de SQL, la memoria persistente aplastó la unidad NVMe en SQL (5,095,690 10.7 90 IOPS con una latencia de 10 μs) y SQL 1,911,900-27.1 (90 10 2,080,543 IOPS con una latencia de 16.9 μs). En nuestra prueba de Oracle, la memoria persistente mostró una puntuación mucho más alta en Oracle 103-10.7 (XNUMX XNUMX XNUMX IOPS con una latencia de solo XNUMX μs), pero quedó rezagada en las otras dos pruebas desde la perspectiva del rendimiento. Algo a tener en cuenta es la latencia. La latencia máxima más alta para la memoria persistente fue de XNUMX μs y la latencia máxima más baja fue de XNUMX μs.

Claramente, hay muchas razones para estar extremadamente entusiasmado al mirar los resultados iniciales en esta revisión. Vemos la mejora de las nuevas CPU escalables Xeon en su conjunto, pero, por supuesto, los módulos de memoria persistente Optane DC son las estrellas aquí. Como se señaló, esta revisión inicial no pretende ser el punto de parada de cómo evaluamos los sistemas con memoria persistente; es solo el comienzo. Actualmente tenemos engranajes en movimiento para observar más profundamente el rendimiento de las aplicaciones en este sistema y continuaremos ampliando los límites y las mejores prácticas para evaluar la memoria persistente Intel Optane DC en los modos App Direct y Memory. Sin embargo, por ahora, muchas felicitaciones a Supermicro y su equipo de ingeniería por armar este kit de manera tan rápida y completa, esta será una serie divertida de revisiones.

Página del producto Supermicro SuperServer 1029U-TN10RT

Discutir esta revisión