La última vez que hablamos de SK hynix fue en agosto, cuando analizábamos el la historia de la empresa y repasó sus soluciones Enterprise SSD. Hoy estamos revisando y analizando el rendimiento del SSD empresarial SK hynix PE6011. El PE6011 presenta un factor de forma U.2 de 7 mm, 3D TLC NAND, interfaz PCIe NVMe y capacidades de hasta 7.68 TB. Es ideal para cargas de trabajo de lectura intensiva y uso ligero de escritura. Lo que es único acerca de este producto es que, desde la conceptualización hasta la fabricación, SK hynix realiza todo internamente. Este producto está dirigido a aquellos que buscan una solución PCIe económica para el entorno del centro de datos.
La última vez que hablamos de SK hynix fue en agosto, cuando analizábamos el la historia de la empresa y repasó sus soluciones Enterprise SSD. Hoy estamos revisando y analizando el rendimiento del SSD empresarial SK hynix PE6011. El PE6011 presenta un factor de forma U.2 de 7 mm, 3D TLC NAND, interfaz PCIe NVMe y capacidades de hasta 7.68 TB. Es ideal para cargas de trabajo de lectura intensiva y uso ligero de escritura. Lo que es único acerca de este producto es que, desde la conceptualización hasta la fabricación, SK hynix realiza todo internamente. Este producto está dirigido a aquellos que buscan una solución PCIe económica para el entorno del centro de datos.
Mirando el diseño y la construcción de esta unidad, la totalidad de la carcasa es plateada pulida. Es una unidad de 2.5″ con un conector U.2 y un factor de forma de altura z de 7 mm. Al ser de 7 mm, ocupa un espacio físico más pequeño y le da a esta unidad la capacidad de equiparse y adaptarse a una gran variedad de cosas para un atractivo universal. La marca y la información de identificación única se pueden encontrar en la parte superior de la unidad.
SK hynix PE6011 Especificaciones
Factor de forma | U.2 7mm | |||
Fácil de usar | PCIe Gen3x4/NVMe 1.3 | |||
NAND | 3D V4 cariño | |||
Capacidad | 960 GB | 1.92 TB | 3.84 TB | 7.68 TB |
Performance | ||||
Lectura secuencial (128 KB) | Hasta 3,200MB / s | Hasta 3,200MB / s | Hasta 3,200MB / s | Hasta 3,200MB / s |
Escritura secuencial (128 KB) | Hasta 650 MB / S | Hasta 1,250MB / s | Hasta 2,300MB / s | Hasta 2,450MB / s |
Lectura aleatoria (4KB, QD64) | Hasta 220K IOPS | Hasta 410K IOPS | Hasta 620K IOPS | Hasta 620K IOPS |
Escritura aleatoria (4KB, QD64) | Hasta 27K IOPS | Hasta 50K IOPS | Hasta 67K IOPS | Hasta 70K IOPS |
Lectura aleatoria QOS 4KB | 95μs | 95μs | 95μs | 95μs |
QOS 4KB Escritura aleatoria | 25μs | 25μs | 25μs | 25μs |
Seguridad | Cifrado AES de 256 bits | |||
Trabajadora | ||||
MTBF | 2 millón de horas | |||
UBER | 1 sector por 10^17 bits leídos | |||
Consumo de energía | ||||
Activo Listo/Escritura Típico | Hasta 14.0W | |||
Idle | Hasta 3.7W | |||
Voltaje admisible | 12.0 V ± 5% | |||
Temperatura de Funcionamiento | 0 70-° C | |||
Choque | 1500G, duración 0.5ms | |||
Físico | ||||
Dimensiones (An x P) | 69.85 x 100 x 7.0 mm | |||
Peso | 84.7 g (± 5 %) |
Performance
Banco de pruebas
Nuestras revisiones Enterprise SSD aprovechan un Lenovo Think System SR850 para pruebas de aplicación y un Dell PowerEdge R740xd para benchmarks sintéticos. El ThinkSystem SR850 es una plataforma de CPU cuádruple bien equipada que ofrece una potencia de CPU muy por encima de lo que se necesita para hacer hincapié en el almacenamiento local de alto rendimiento. Las pruebas sintéticas que no requieren muchos recursos de CPU utilizan el servidor de doble procesador más tradicional. En ambos casos, la intención es mostrar el almacenamiento local de la mejor manera posible que se alinee con las especificaciones máximas de la unidad del proveedor de almacenamiento.
Lenovo Think System SR850
- 4 CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
- 16 DRAM ECC de 32 GB DDR4-2666 MHz
- 2 tarjetas RAID 930-8i 12 Gb/s
- 8 bahías NVMe
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
- 4 memorias ECC de 16 GB DDR4-2666 MHz
- 1 tarjeta RAID PERC 730 de 2 GB y 12 Gb/s
- Adaptador NVMe adicional
- Ubuntu-16.04.3-escritorio-amd64
Fondo de prueba
La Laboratorio de pruebas de StorageReview Enterprise proporciona una arquitectura flexible para realizar pruebas comparativas de dispositivos de almacenamiento empresarial en un entorno comparable al que encuentran los administradores en implementaciones reales. El Enterprise Test Lab incorpora una variedad de servidores, redes, acondicionamiento de energía y otra infraestructura de red que permite a nuestro personal establecer condiciones del mundo real para medir con precisión el rendimiento durante nuestras revisiones.
Incorporamos estos detalles sobre el entorno de laboratorio y los protocolos en las revisiones para que los profesionales de TI y los responsables de la adquisición de almacenamiento puedan comprender las condiciones en las que hemos logrado los siguientes resultados. El fabricante del equipo que estamos probando no paga ni supervisa ninguna de nuestras revisiones.
Análisis de la carga de trabajo de la aplicación
Para comprender las características de rendimiento de los dispositivos de almacenamiento empresarial, es esencial modelar la infraestructura y las cargas de trabajo de las aplicaciones que se encuentran en los entornos de producción en vivo. Nuestros puntos de referencia para el Kingston DC500M son, por lo tanto, el Rendimiento de MySQL OLTP a través de SysBench y Rendimiento de OLTP de Microsoft SQL Server con una carga de trabajo de TCP-C simulada. Para nuestras cargas de trabajo de aplicaciones, cada unidad ejecutará de 2 a 4 máquinas virtuales configuradas de manera idéntica.
Rendimiento de SQL Server
Cada máquina virtual con SQL Server está configurada con dos discos virtuales: un volumen de 100 GB para el arranque y un volumen de 500 GB para la base de datos y los archivos de registro. Desde la perspectiva de los recursos del sistema, configuramos cada VM con 16 vCPU, 64 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI. Si bien nuestras cargas de trabajo de Sysbench probadas anteriormente saturaron la plataforma tanto en E/S de almacenamiento como en capacidad, la prueba de SQL busca el rendimiento de la latencia.
Esta prueba usa SQL Server 2014 ejecutándose en máquinas virtuales invitadas de Windows Server 2012 R2 y está destacada por Benchmark Factory for Databases de Quest. Reseñas de almacenamiento Protocolo de prueba OLTP de Microsoft SQL Server emplea el borrador actual del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark de procesamiento de transacciones en línea que simula las actividades que se encuentran en entornos de aplicaciones complejos. El punto de referencia TPC-C se acerca más que los puntos de referencia de rendimiento sintéticos para medir las fortalezas de rendimiento y los cuellos de botella de la infraestructura de almacenamiento en entornos de bases de datos. Cada instancia de nuestra VM de SQL Server para esta revisión utiliza una base de datos de SQL Server de 333 GB (escala 1,500) y mide el rendimiento transaccional y la latencia bajo una carga de 15,000 XNUMX usuarios virtuales.
Configuración de prueba de SQL Server (por VM)
- Windows Server 2012 R2
- Huella de almacenamiento: 600 GB asignados, 500 GB utilizados
- SQL Server 2014
- Tamaño de la base de datos: escala 1,500
- Carga de clientes virtuales: 15,000
- Búfer RAM: 48GB
- Duración de la prueba: 3 horas
- 2.5 horas de preacondicionamiento
- Período de muestra de 30 minutos
Para nuestro punto de referencia transaccional de SQL Server, el SK hynix PE6011 se desempeñó igual que el Intel P4510 8TB con un total de 12,625.4 TPS.
Una mejor indicación del rendimiento de SQL Server es la latencia en comparación con TPS. Aquí, vemos que el SK hynix PE6011 se quedó atrás con una latencia promedio notablemente más larga en comparación con el Intel P4510 con 46.3 ms.
Rendimiento de Sysbench
El siguiente punto de referencia de la aplicación consiste en un Base de datos OLTP MySQL de Percona medido a través de SysBench. Esta prueba mide el promedio de TPS (transacciones por segundo), la latencia promedio y también la latencia promedio del percentil 99.
Cada banco de sistema La máquina virtual está configurada con tres discos virtuales: uno para arranque (~92 GB), uno con la base de datos preconstruida (~447 GB) y el tercero para la base de datos bajo prueba (270 GB). Desde la perspectiva de los recursos del sistema, configuramos cada máquina virtual con 16 vCPU, 60 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI.
Configuración de prueba de Sysbench (por VM)
- CentOS 6.3 de 64 bits
- Percona XtraDB 5.5.30-rel30.1
- Tablas de base de datos: 100
- Tamaño de la base de datos: 10,000,000
- Subprocesos de la base de datos: 32
- Búfer RAM: 24GB
- Duración de la prueba: 3 horas
- 2 horas preacondicionamiento 32 hilos
- 1 hora 32 hilos
Con el punto de referencia transaccional de Sysbench, el PE6011 se quedó atrás y quedó en último lugar con 5,936.6 TPS.
En la latencia promedio de Sysbench, el PE6011 nuevamente mostró resultados que lo ubicaron en la parte inferior del paquete con 21.6ms.
Para nuestra latencia en el peor de los casos (percentil 99), el PE6011 que terminó en último lugar está a 1 ms del Samsung 983 DCT con un resultado de 39.6 ms de latencia.
Houdini por SideFX
La prueba de Houdini está diseñada específicamente para evaluar el rendimiento del almacenamiento en relación con la representación CGI. El banco de pruebas para esta aplicación es una variante del tipo de servidor central Dell PowerEdge R740xd que usamos en el laboratorio con dos CPU Intel 6130 y 64 GB de DRAM. En este caso, instalamos Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) ejecutando bare metal. La salida del punto de referencia se mide en segundos para completarse, cuanto menos mejor.
La demostración de Maelstrom representa una sección de la canalización de renderizado que destaca las capacidades de rendimiento del almacenamiento al demostrar su capacidad para usar de manera efectiva el archivo de intercambio como una forma de memoria extendida. La prueba no escribe los datos de los resultados ni procesa los puntos para aislar el efecto de tiempo de pared del impacto de la latencia en el componente de almacenamiento subyacente. La prueba en sí se compone de cinco fases, tres de las cuales ejecutamos como parte del benchmark, que son las siguientes:
Carga puntos empaquetados desde el disco. Este es el momento de leer desde el disco. Esto es de un solo subproceso, lo que puede limitar el rendimiento general.
Desempaqueta los puntos en una sola matriz plana para permitir que se procesen. Si los puntos no dependen de otros puntos, el conjunto de trabajo podría ajustarse para permanecer en el núcleo. Este paso es de subprocesos múltiples.
(No Ejecutar) Procesa los puntos.
Los vuelve a empaquetar en bloques divididos en cubos adecuados para volver a almacenarlos en el disco. Este paso es de subprocesos múltiples.
(No Ejecutar) Escribe los bloques almacenados nuevamente en el disco.
Con la prueba de Houdini, el PE6011 se ubicó en el rango medio con 2,860.1 segundos.
Análisis de carga de trabajo de VDBench
Cuando se trata de comparar dispositivos de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no son una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita la comparación de manzanas con manzanas entre las soluciones de la competencia. Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, hasta capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de carga de trabajo VDBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran grupo de pruebas de cómputo. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales. Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie del disco con datos, luego divide una sección del disco equivalente al 25% de la capacidad del disco para simular cómo el disco podría responder a las cargas de trabajo de la aplicación. Esto es diferente a las pruebas de entropía completa que usan el 100% del impulso y lo llevan al estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más altas.
perfiles:
- Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
- Escritura aleatoria 4K: 100 % de escritura, 64 subprocesos, 0-120 % de iorate
- Lectura secuencial de 64 K: 100 % de lectura, 16 subprocesos, 0-120 % de iorate
- Escritura secuencial de 64 K: 100 % de escritura, 8 subprocesos, 0-120 % de iorate
- Base de datos sintética: SQL y Oracle
- Trazas de clones vinculados y clones completos de VDI
En nuestro primer análisis de carga de trabajo de VDBench, Random 4K Read, el SK hynix PE6011 pudo permanecer por debajo de 1 ms durante toda la prueba con un pico de 626,681 203.2 IOPS y una latencia de XNUMX μs
El rendimiento de escritura aleatoria de 4K mostró una latencia de menos de un milisegundo durante toda la prueba nuevamente. Aquí, el PE6011 mostró un rendimiento máximo de 209,000 609.6 IOPS y una latencia de XNUMX μs.
Cambiando a cargas de trabajo secuenciales, el SK hynix PE6011 se ubicó en la parte superior del paquete en lecturas secuenciales de 64K con una puntuación máxima de 41,554 2.59 IOPS o 384.5 GB/s con una latencia de XNUMX μs.
El PE6011 alcanzó un máximo de 13,956 0.87 IOPS o 1137.7 GB/s con una latencia de 64 μs en la escritura secuencial de XNUMX K.
Pasando a las cargas de trabajo de SQL, el PE6011 alcanzó un máximo de 164,402 194.2 IOPS con una latencia de XNUMX μs
SQL 90-10 vio el pico de PE6011 en 133,898 238.4 IOPS y una latencia de XNUMX μs.
El PE6011 alcanzó un máximo de 120,450 264.8 IOPS y una latencia de XNUMX.
En nuestra carga de trabajo de Oracle, el PE6011 se ubicó en el medio del grupo con un pico de 112,610 312.8 IOPS y una latencia de XNUMX μs.
En Oracle 90-10, el PE6011 alcanzó un máximo de 117,287 187 IOPS y una latencia de XNUMX μs.
Para Oracle 80-20, vimos el pico de PE6011 en 106,489 205.9 IOPS y una latencia de XNUMX μs.
Luego, pasamos a nuestro punto de referencia de clones de VDI, Full and Linked, donde el PE6011 se ubicó en el medio del paquete para la mayoría de estas pruebas con latencias máximas constantemente por debajo de 1 ms. Para VDI Full Clone Boot, el PE6011 tuvo un rendimiento máximo de 99,196 349.4 IOPS y una latencia de XNUMX μs.
El inicio de sesión inicial de VDI FC vio el PE6011 con un rendimiento máximo de 46,907 635.8 IOPS y una latencia de 4510 μs, justo por detrás del Intel PXNUMX.
Con VDI FC Monday Login, el PE6011 terminó con un rendimiento máximo de 43,590 364.6 IOPS y una latencia de XNUMX μs.
Cambiando a Linked Clone (LC), primero observamos la prueba de arranque. Aquí, el PE6011 quedó ligeramente rezagado con 62,680 254.6 IOPS y una latencia de XNUMX μs.
El inicio de sesión inicial de VDI LC mostró 27,110 292.2 IOPS y una latencia de XNUMX μs, lo que lo coloca en el medio del grupo.
En la prueba VDI LC Monday Login, el PE6011 mostró un rendimiento máximo de 30,740 516.9 y una latencia de XNUMX μs, lo que le otorga un primer puesto en el acabado fotográfico.
Conclusión:
Disponible en un factor de forma U.2 de 7 mm, el PE6011 es parte de la nueva línea de SSD Enterprise NVMe de SK hynix, que incluye un producto de próxima generación compatible con PCIe 4.0 que saldrá en el primer semestre de 1. El PE20 es ideal para cargas de trabajo intensivas de lectura y baja latencia (6011/70 r/w). En el mercado empresarial, esta unidad podría ser lucrativa en función de los precios económicos por volumen, así como del hecho de que se trata de una unidad con una orientación horizontal totalmente integrada. El PE30 viene en capacidades de hasta 6011 TB, lo que se adapta a la mayoría de las cargas de trabajo empresariales convencionales, así como cargas de trabajo con requisitos de gran capacidad. Cuenta con tecnología 7.68D NAND de 72 capas y admite cifrado de datos AES de 3 bits, protección contra pérdida de energía (por circuito integrado), regulación térmica y administración básica SMBus (fuera de banda).
Al observar el rendimiento del SK hynix PE6011, no domina el campo, sino que ofrece un perfil de rendimiento completo que funciona para la mayoría de las aplicaciones. Aunque lo comparamos con un par de unidades de Samsung e Intel, el PE6011 no se desempeñó demasiado lejos de esas unidades la mayor parte del tiempo. Con Sysbench, la unidad SK hynix alcanzó los 5,936.6 TPS, una latencia media de 21.6 ms y una latencia en el peor de los casos de 39.6 ms. En Houdini, el SK hynix PE6011 se posicionó de manera bastante neutral en el medio del grupo. En nuestros puntos de referencia de VDBench, el PE6011 mantuvo una latencia de menos de un milisegundo durante todas nuestras pruebas. Le fue bien en nuestro 4K y 64K, se mantuvo firme en nuestro VDI Full Clone y Linked Clone Traces, pero cayó un poco en las bases de datos sintéticas. Algunos de los aspectos más destacados son los rendimientos máximos de 626,681 4 IOPS de lectura aleatoria 41,554K, 64 46,907 IOPS de lectura secuencial 30,740 K, XNUMX XNUMX IOPS VDI-FC-Init-Login y XNUMX XNUMX IOPS VDI-LC-Monday Login.
El SK hynix PE6011 ofrece buen rendimiento, baja latencia y mucha capacidad en un factor de forma pequeño de 2.5” y 7 mm. Si bien no es el mejor desempeño de nuestras unidades comparables, el PE6011 ofrece buenos números en general. Aquellos que buscan una buena relación precio-rendimiento para cargas de trabajo determinadas no necesitan buscar mucho más que el PE6011.