Inicio Empresa Revisión de Intel SSD DC P4510

Revisión de Intel SSD DC P4510

by Adam Armstrong

Introducido a principios de este año, la serie DC P4510 es la nueva SSD NVMe para centros de datos de Intel. Diseñado específicamente para la nube (con el lema "Inspirado en la nube. Almacenamiento optimizado"), el P4510 es el primer SSD 64D NAND empresarial de 3 capas de Intel. Aprovechando esta tecnología, la empresa pudo aumentar la capacidad de la unidad hasta 8 TB y, al mismo tiempo, pudo instalarla en un factor de forma U.2 de 15 mm.


Introducido a principios de este año, la serie DC P4510 es la nueva SSD NVMe para centros de datos de Intel. Diseñado específicamente para la nube (con el lema "Inspirado en la nube. Almacenamiento optimizado"), el P4510 es el primer SSD 64D NAND empresarial de 3 capas de Intel. Aprovechando esta tecnología, la empresa pudo aumentar la capacidad de la unidad hasta 8 TB y, al mismo tiempo, pudo instalarla en un factor de forma U.2 de 15 mm.

La capacidad ampliada puede ayudar a las empresas a consolidar cargas de trabajo o admitir mejor cargas de trabajo en la nube más amplias, lo que permite a los proveedores de servicios aumentar la cantidad de usuarios y mejorar los niveles de servicio de datos. Junto con la alta capacidad, la unidad ha mejorado la QoS que utiliza un algoritmo de firmware inteligente que mantiene los datos de lectura/escritura del host y de fondo en un equilibrio óptimo. El P4510 ha citado un rendimiento de 3.2 GB/s de lectura y 3 GB/s de escritura, así como 637 139 IOPS de lectura y XNUMX XNUMX IOPS de escritura.

La serie de unidades también minimiza las interrupciones del servicio a través del monitoreo SMART mejorado de la salud y el estado de las unidades, utilizando un mecanismo en banda y acceso fuera de banda. Esto también ayuda en el caso de una pérdida repentina de energía para evitar que los datos se pierdan junto con él. El P4510 tiene mejoras de firmware integradas en su nueva 3D NAND que prioriza las cargas de trabajo del host, lo que garantiza mejores niveles de servicio.

Intel DC P4510 viene en capacidades de 1 TB, 2 TB, 4 TB y 8 TB y utiliza la especificación NVMe 1.2. Para esta revisión, analizaremos los modelos de 2 TB y 8 TB. 

Especificaciones Intel DC P4510

Capacidad 1TB 2TB 4TB 8TB
Fácil de usar PCIe 3.1 x4, NVMe 1.2
Factor de forma U.2 2.5” 15mm
NAND Tecnología Intel 3D NAND, 64 capas, TLC
Desempeno
Lectura secuencial de 128k hasta 3,200 MB / s
escritura secuencial de 128k hasta 3,000 MB / s
Lectura aleatoria de 4k hasta 637,000 IOPS
escritura aleatoria 4k hasta 139,000 IOPS
Lectura/escritura de latencia 110μs
Fiabilidad
Escritura de por vida 13.88PB
DWPD 1
MTBF 2 millón de horas
UBER 1 sector por 10^17 bits leídos
Vibración
Funcionamiento 2.17 GRMS (5-700 Hz)
No operacional 3.13 GRMS (5-800 Hz)
Choque 1000G (0.5ms)
Potencia  
Active 16W
Idle 5W

 

Desempeno

Banco de pruebas

Nuestras revisiones de Enterprise SSD aprovechan un Lenovo ThinkSystem SR850 para pruebas de aplicaciones y un Dell PowerEdge R740xd para benchmarks sintéticos. El ThinkSystem SR850 es una plataforma de CPU cuádruple bien equipada que ofrece una potencia de CPU muy por encima de lo que se necesita para hacer hincapié en el almacenamiento local de alto rendimiento. Las pruebas sintéticas que no requieren muchos recursos de CPU utilizan el servidor de doble procesador más tradicional. En ambos casos, la intención es mostrar el almacenamiento local de la mejor manera posible que se alinee con las especificaciones máximas de la unidad del proveedor de almacenamiento.

Lenovo Think System SR850

  • 4 CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 DRAM ECC de 32 GB DDR4-2666 MHz
  • 2 tarjetas RAID 930-8i 12 Gb/s
  • 8 bahías NVMe
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 16 memorias ECC de 16 GB DDR4-2666 MHz
  • 1 tarjeta RAID PERC 730 de 2 GB y 12 Gb/s
  • Adaptador NVMe adicional
  • Ubuntu-16.04.3-escritorio-amd64

Antecedentes de prueba y comparables

Los Laboratorio de pruebas de StorageReview Enterprise proporciona una arquitectura flexible para realizar pruebas comparativas de dispositivos de almacenamiento empresarial en un entorno comparable al que encuentran los administradores en implementaciones reales. El Enterprise Test Lab incorpora una variedad de servidores, redes, acondicionamiento de energía y otra infraestructura de red que permite a nuestro personal establecer condiciones del mundo real para medir con precisión el rendimiento durante nuestras revisiones.

Incorporamos estos detalles sobre el entorno de laboratorio y los protocolos en las revisiones para que los profesionales de TI y los responsables de la adquisición de almacenamiento puedan comprender las condiciones en las que hemos logrado los siguientes resultados. El fabricante del equipo que estamos probando no paga ni supervisa ninguna de nuestras revisiones. Detalles adicionales sobre el Laboratorio de pruebas de StorageReview Enterprise y una descripción general de sus capacidades de red están disponibles en esas respectivas páginas.

Comparables para esta revisión:

Análisis de la carga de trabajo de la aplicación

Para comprender las características de rendimiento de los dispositivos de almacenamiento empresarial, es esencial modelar la infraestructura y las cargas de trabajo de las aplicaciones que se encuentran en los entornos de producción en vivo. Nuestros puntos de referencia para el Intel P4510 son, por lo tanto, el Rendimiento de MySQL OLTP a través de SysBench y Rendimiento de OLTP de Microsoft SQL Server con una carga de trabajo de TCP-C simulada. Para nuestras cargas de trabajo de aplicaciones, cada unidad ejecutará de 2 a 4 máquinas virtuales configuradas de manera idéntica.

Rendimiento de SQL Server

Cada máquina virtual con SQL Server está configurada con dos discos virtuales: un volumen de 100 GB para el arranque y un volumen de 500 GB para la base de datos y los archivos de registro. Desde la perspectiva de los recursos del sistema, configuramos cada VM con 16 vCPU, 64 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI. Si bien nuestras cargas de trabajo de Sysbench probadas anteriormente saturaron la plataforma tanto en E/S de almacenamiento como en capacidad, la prueba de SQL busca el rendimiento de la latencia.

Esta prueba utiliza SQL Server 2014 ejecutándose en máquinas virtuales invitadas de Windows Server 2012 R2 y está destacada por Benchmark Factory for Databases de Quest. Reseñas de almacenamiento Protocolo de prueba OLTP de Microsoft SQL Server emplea el borrador actual del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark de procesamiento de transacciones en línea que simula las actividades que se encuentran en entornos de aplicaciones complejos. El punto de referencia TPC-C se acerca más que los puntos de referencia de rendimiento sintéticos para medir las fortalezas de rendimiento y los cuellos de botella de la infraestructura de almacenamiento en entornos de bases de datos. Cada instancia de nuestra VM de SQL Server para esta revisión utiliza una base de datos de SQL Server de 333 GB (escala 1,500) y mide el rendimiento transaccional y la latencia bajo una carga de 15,000 XNUMX usuarios virtuales.

Configuración de prueba de SQL Server (por VM)

  • Windows Server 2012 R2
  • Huella de almacenamiento: 600 GB asignados, 500 GB utilizados
  • SQL Server 2014
    • Tamaño de la base de datos: escala 1,500
    • Carga de clientes virtuales: 15,000
    • Búfer RAM: 48GB
  • Duración de la prueba: 3 horas
    • 2.5 horas de preacondicionamiento
    • Período de muestra de 30 minutos

Para nuestro punto de referencia transaccional de SQL Server, el P4510 aterrizó en tercer lugar con 12,625.4 TPS, 10.7 detrás del mejor desempeño, el PBlaze4.

Para la latencia promedio de SQL, el P4510 nuevamente ocupó el tercer lugar con 9 ms. 

Rendimiento de Sysbench

El siguiente punto de referencia de la aplicación consiste en un Base de datos OLTP MySQL de Percona medido a través de SysBench. Esta prueba mide el promedio de TPS (transacciones por segundo), la latencia promedio y también la latencia promedio del percentil 99.

Cada banco de sistema La máquina virtual está configurada con tres discos virtuales: uno para arranque (~92 GB), uno con la base de datos preconstruida (~447 GB) y el tercero para la base de datos bajo prueba (270 GB). Desde la perspectiva de los recursos del sistema, configuramos cada VM con 16 vCPU, 60 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI.

Configuración de prueba de Sysbench (por VM)

  • CentOS 6.3 de 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tablas de base de datos: 100
    • Tamaño de la base de datos: 10,000,000
    • Subprocesos de la base de datos: 32
    • Búfer RAM: 24GB
  • Duración de la prueba: 3 horas
    • 2 horas preacondicionamiento 32 hilos
    • 1 hora 32 hilos

Con el punto de referencia transaccional de Sysbench, el P4510 quedó en segundo y tercer lugar con 7,346.8 TPS para el de 8 TB y 6,537 TPS para el de 2 TB.

Con latencia promedio, el P4510 tuvo la misma ubicación que el anterior con el 8TB en segundo lugar con una latencia de 17.4ms y el 2TB en tercero con 19.6ms

Nuestro punto de referencia de latencia en el peor de los casos una vez más tuvo la misma ubicación con el P8 de 4510 TB en segundo lugar con 30.9 ms y la versión de 2 TB en tercer lugar con 35.6 ms. 

Houdini por SideFX

La prueba de Houdini está diseñada específicamente para evaluar el rendimiento del almacenamiento en relación con la representación CGI. El banco de pruebas para esta aplicación es una variante del núcleo Dell PowerEdge R740xd tipo de servidor que usamos en el laboratorio con dos CPU Intel 6130 y 64 GB de DRAM. En este caso, instalamos Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) ejecutando bare metal. La salida del punto de referencia se mide en segundos para completarse, cuanto menos mejor.

La demostración de Maelstrom representa una sección de la canalización de renderizado que destaca las capacidades de rendimiento del almacenamiento al demostrar su capacidad para usar de manera efectiva el archivo de intercambio como una forma de memoria extendida. La prueba no escribe los datos de los resultados ni procesa los puntos para aislar el efecto de tiempo de pared del impacto de la latencia en el componente de almacenamiento subyacente. La prueba en sí se compone de cinco fases, tres de las cuales ejecutamos como parte del benchmark, que son las siguientes:

  1. Carga puntos empaquetados desde el disco. Este es el momento de leer desde el disco. Esto es de un solo subproceso, lo que puede limitar el rendimiento general.
  2. Desempaqueta los puntos en una sola matriz plana para permitir que se procesen. Si los puntos no dependen de otros puntos, el conjunto de trabajo podría ajustarse para permanecer en el núcleo. Este paso es de subprocesos múltiples.
  3. (No Ejecutar) Procesar los puntos.
  4. Los vuelve a empaquetar en bloques divididos en cubos adecuados para volver a almacenarlos en el disco. Este paso es de subprocesos múltiples.
  5. (No ejecutar) Vuelva a escribir los bloques en cubos en el disco.

El Intel P4510 lo hizo bastante bien en la prueba de Houdini, quedando en segundo lugar entre las unidades que no son Optane con 2,595.7 segundos. En general ocupó el séptimo lugar. A la de 2 TB no le fue tan bien con 2,845.6 segundos.

Análisis de carga de trabajo de VDBench

Cuando se trata de comparar dispositivos de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no es una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita la comparación de manzanas con manzanas entre las soluciones de la competencia. Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, hasta capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de cargas de trabajo vdBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran clúster de pruebas informáticas. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales. Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie del disco con datos, luego divide una sección del disco equivalente al 25% de la capacidad del disco para simular cómo el disco podría responder a las cargas de trabajo de la aplicación. Esto es diferente a las pruebas de entropía completa que usan el 100% del impulso y lo llevan al estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más altas.

perfiles:

  • Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
  • Escritura aleatoria 4K: 100 % de escritura, 64 subprocesos, 0-120 % de iorate
  • Lectura secuencial de 64 K: 100 % de lectura, 16 subprocesos, 0-120 % de iorate
  • Escritura secuencial de 64 K: 100 % de escritura, 8 subprocesos, 0-120 % de iorate
  • Base de datos sintética: SQL y Oracle
  • Trazas de clones vinculados y clones completos de VDI

En nuestro primer análisis de carga de trabajo de VDBench, Random 4K Read, el Intel DC P8 de 4510 TB tuvo un rendimiento máximo de 642,149 198 IOPS y una latencia de 5 µs. Esto colocó a la unidad en tercer lugar detrás del Memblaze PBlaze04 y justo detrás del Toshiba PX2. La versión de 621,469 TB ocupó el cuarto lugar con un rendimiento máximo de 205 XNUMX IOPS y una latencia de XNUMX µs.

Para la escritura aleatoria de 4K, el P8 de 4510 TB alcanzó un máximo de alrededor de 433 36 IOPS con 3700 µs. Sin embargo, inmediatamente vio una caída en el rendimiento y un aumento en la latencia, colocándolo a la par con el P2 y en tercer lugar. El de 233,299 TB llegó penúltimo, con un rendimiento máximo de 540 XNUMX IOPS con una latencia de XNUMX µs.

Cambiando a cargas de trabajo secuenciales, el P8 de 4510TB pudo superar al Toshiba PX04 por el segundo lugar en lecturas de 64K con un puntaje máximo de 39,502 IOPS o 2.5GB/s con una latencia de 396µs. El 2TB volvió a ocupar el cuarto lugar con 37,582 IOPS o 2.35 GB/s y una latencia de 425 µs.

Para escrituras de 64K, el P8 de 4510TB ocupó el tercer lugar una vez más con un rendimiento máximo de 26,150 1.63 IOPS o 605 GB/s y una latencia de 2 µs. Una vez más, el de 15,453 TB tuvo un rendimiento de escritura mucho más bajo, quedando en penúltimo lugar con 966 1.02 IOPS o XNUMX MB/s y una latencia de XNUMX ms.

A continuación, analizamos las cargas de trabajo de SQL. Para el primer punto de referencia, el P8 de 4510 TB ocupó el segundo lugar por poco con un rendimiento máximo de 241,242 132 IOPS y una latencia de 2 µs. El P4510 de 188,170 TB ocupó el cuarto lugar con un rendimiento máximo de 170 XNUMX IOPS y XNUMX µs.

En SQL 90-10, nuevamente la unidad de 8 TB ocupó el segundo lugar, alcanzando un máximo de 213,390 146 IOPS con una latencia de 200 µs antes de caer por debajo de 2 182,868 IOPS y la latencia aumentó ligeramente. La versión de 196 TB tuvo un rendimiento máximo de XNUMX XNUMX IOPS con una latencia de XNUMX µs, colocándose en cuarto lugar.

En SQL 80-20, vimos la misma ubicación con un efecto similar del P8 de 4510 TB con un máximo de 204,683 156 IOPS con una latencia de 2 µs antes de caer un poco. La versión de 150,201 TB alcanzó un máximo de 209 XNUMX IOPS con una latencia de XNUMX µs antes de caer ligeramente en el rendimiento y quedar en tercer lugar. 

Nuestro próximo lote de puntos de referencia analiza las cargas de trabajo de Oracle. El primero mostró que el P8 de 4510 TB quedó en segundo lugar con un rendimiento máximo de 191,472 188 IOPS y una latencia de 2 µs. El 136,675TB alcanzó el rendimiento máximo de 237 IOPS con una latencia de XNUMXµs ocupando el cuarto lugar.

Para Oracle 90-10, el P8 de 4510 TB estuvo a punto de superar al PBlaze5 con un rendimiento máximo de 177,256 124 IOPS y una latencia de 2 µs. La versión de 137,302 TB alcanzó un pico de 160 XNUMX IOPS con una latencia de XNUMX µs.

Con la prueba Oracle 80-20, el P8 de 4510 TB volvió a ocupar el segundo lugar con un rendimiento máximo de 177,851 130 IOPS y una latencia de 2 µs. La unidad de 127,888 TB alcanzó un pico de 171 XNUMX IOPS y una latencia de XNUMX µs, lo que la colocó en el tercer lugar.

A continuación, cambiamos a nuestra prueba de clonación de VDI, completa y vinculada. Para VDI Full Clone Boot, el P8 de 4510 TB quedó en segundo lugar con un rendimiento máximo de 160,678 215 IOPS y una latencia de 2 µs. La versión de 138,821 TB estuvo a la altura de la unidad Toshiba con un rendimiento máximo de 244 XNUMX IOPS y una latencia de XNUMX µs.

Con el inicio de sesión inicial de VDI FC, el P8 de 4510 TB alcanzó un máximo de 79,306 375 IOPS con una latencia de 2 µs antes de perder un poco el rendimiento. Una vez más ocupó el segundo lugar. La versión de 54,562 TB fue la penúltima con un rendimiento máximo de 546 XNUMX IOPS y una latencia de XNUMX µs.

En el VDI FC Monday Login, el P8 de 4510 TB ocupó el segundo lugar con un rendimiento máximo de 67,351 236 IOPS y una latencia de 2 µs. El P4510 de 51,803 TB ocupó el tercer lugar con un rendimiento máximo de 307 XNUMX IOPS y una latencia de XNUMX µs.

En la prueba de arranque VDI LC, vimos que el P8 de 4510 TB ocupó el tercer lugar detrás de Memblaze y Toshiba con un rendimiento máximo de 75,572 211 IOPS y una latencia de 2 µs. Justo detrás estaba el P4510 de 65,274 TB con 244 XNUMX IOPS y una latencia de XNUMX µs.

El inicio de sesión inicial de VDI LC vio una mejor ubicación para el P8 de 4510 TB que quedó en segundo lugar con un rendimiento máximo de 48,495 IOPS y una latencia de 205 µs. En tercer lugar quedó la versión de 2TB con 31,468 IOPS y una latencia de 252µs.

Y, finalmente, nuestro VDI LC Monday Login tuvo el P8 de 4510 TB en segundo lugar con un rendimiento máximo de 48,324 328 IOPS y una latencia de 2 µs. La unidad de 35,999 TB cayó al penúltimo lugar con 439 XNUMX IOPS y XNUMX µs de latencia. 

Conclusión

La serie SSD Intel DC P4510 NVMe son las nuevas unidades para centros de datos de la empresa diseñadas pensando en la nube. Las unidades vienen en un factor de forma U.2 con una impresionante capacidad máxima de 8 TB que aprovecha la NAND 64D de 3 capas de Intel. Esta capacidad se traduce en cargas de trabajo en la nube más amplias, más usuarios y mejores niveles de servicio. El P4510 tiene una QoS mejorada que equilibra las lecturas y escrituras en el host y en segundo plano. También supervisa la salud y el estado de la unidad para ayudar a garantizar la disponibilidad y la protección de datos. 

En cuanto al rendimiento en nuestro análisis de carga de trabajo de la aplicación, Intel SSD DC P4510 obtuvo buenos números en nuestra prueba de SQL Server con 12,625.4 TPS y una latencia media de 9 ms. Ambas unidades Memblaze lo superaron por un pequeño margen. Con Sysbench, el P8 de 4510 TB ocupó el segundo lugar en todos los ámbitos con 7,346.8 TPS, una latencia media de 17.4 ms y el peor de los casos de 30.9 ms, mientras que el de 2 TB alcanzó los 6,537 TPS, una latencia media de 17.4 ms y un peor de 35.6 ms. de los casos. Con la prueba de Houdini, el P8 de 4510 TB ocupó el segundo lugar para una unidad que no sea Optane con 2,595.7 segundos, ocupó el séptimo lugar en la general. La versión de 2 TB pudo alcanzar los 2,845.6 segundos.

Para el análisis de carga de trabajo de VDBench, el P8 de 4510 TB quedó en segundo o tercer lugar en todos los puntos de referencia. Sin embargo, obtuvo números impresionantes, por ejemplo, en 4K aleatorio, pudo alcanzar más de 642 433 IOPS de lectura y 2.5 1.63 IOPS de escritura (aunque experimentó una fuerte caída en el rendimiento después de alcanzar su punto máximo). En cargas de trabajo secuenciales, la unidad alcanzó 4510 GB/s de lectura y 241 GB/s de escritura. Para las cargas de trabajo de SQL, el P213 pudo alcanzar más de 90 10 IOPS, 204 80 IOPS para 20-191 y más de 177 90 IOPS para 10-80. Para nuestras cargas de trabajo de Oracle, la unidad Intel pudo alcanzar más de 20 90 IOPS, así como 10 5 IOPS para 160-79 y 67-75. En Oracle 48-48, Intel casi alcanza al favorito, PBlazeXNUMX. Para nuestras pruebas VDI FC, la unidad pudo alcanzar más de XNUMX XNUMX IOPS para el arranque, XNUMX XNUMX IOPS para el inicio de sesión inicial y XNUMX XNUMX IOPS para el inicio de sesión del lunes. Para VDI LC, la unidad alcanzó más de XNUMX XNUMX IOPS para el arranque, XNUMX XNUMX IOPS para el inicio de sesión inicial y XNUMX XNUMX IOPS para el inicio de sesión del lunes.

Al P4510 le fue bien en la mayoría de los puntos de referencia, mejorando fácilmente al P4500 anterior. Con la variedad de ofertas de capacidad y factores de forma, Intel ha posicionado bien al P4510 para que sea su caballo de batalla de NVMe, especialmente con el modelo de 8 TB de mayor capacidad. 

Lo más importante es...

El Intel SSD DC P4510 es un SSD NVMe que viene en capacidades de hasta 8 TB y un amplio rendimiento para permitir que los proveedores de servicios hagan más con sus servicios de datos.

Intel SSD CC P4510

Discutir esta revisión

Suscríbase al boletín de StorageReview