Inicio Empresa Revisión del SSD KIOXIA CM6 PCIe 4.0

Revisión del SSD KIOXIA CM6 PCIe 4.0

by Adam Armstrong

Los SSD NVMe se han convertido en los mejores en todos los ámbitos. Comenzaron dando grandes saltos con respecto a las unidades SAS y SATA, pero en los últimos años han ido obteniendo un poco más de rendimiento con cada iteración. Hay un límite superior con PCIe 3.0 y las unidades actuales lo están alcanzando. Pero ahora, con las CPU AMD EPYC 7002 de segunda generación, PCIe 4.0 está aquí y KIOXIA lo está aprovechando con las SSD CM6.

Los SSD NVMe se han convertido en los mejores en todos los ámbitos. Comenzaron dando grandes saltos con respecto a las unidades SAS y SATA, pero en los últimos años han ido obteniendo un poco más de rendimiento con cada iteración. Hay un límite superior con PCIe 3.0 y las unidades actuales lo están alcanzando. Pero ahora con la segunda generación CPU AMD EPYC 7002, PCIe 4.0 está aquí y KIOXIA lo está aprovechando con los SSD CM6.

KIOXIA CM6

KIOXIA anunció las nuevas unidades PCIe 4.0, CM6 y CD6, como demostración en el último Flash Memory Summit, en los tiempos olvidados de los eventos físicos. En ese momento, eran los primeros SSD PCIe 4.0 y, al momento de escribir este artículo, la serie SSD CM6 aún puede ser uno de los pocos, aunque solo sea PCIe 4.0 SSD para empresas. El gran problema con las nuevas unidades será un mayor rendimiento: se dice que alcanzará hasta 6.9 GB/s y 1.4 millones de IOPS de lectura. Esos son algunos números teóricos impresionantes. Las unidades también vienen con NVMe-MI en banda, registro de eventos persistente y granularidad de espacio de nombres.

Fondo KIOXIA CM6

El KIOXIA CM6 es un factor de forma U.3, compatible con SFF-TA-1001, lo que permite su uso en backplanes habilitados para tres modos. El CM6 viene en una amplia gama de capacidades que van desde 800 GB hasta 30.72 TB. Las unidades vienen en versiones de uso intensivo de lectura (CM6-R) y de uso mixto (CM6-V), según las necesidades de los usuarios. Además de los modelos específicos de casos de uso, hay una variedad de versiones seguras que incluyen un Sanitize Instat Erase (SIE), una unidad de autocifrado (SED) y un modelo FIPS 140-2 (Nivel 2). La unidad tiene dos puertos para proporcionar también una alta disponibilidad.

Lateral KIOXIA CM6

Para esta revisión, estamos viendo un KIOXIA CM6-V de 6.4 TB de capacidad.

Especificaciones KIOXIA CM6 PCIe 4.0

Modelo CM6-R (lectura intensiva) CM6-V (uso mixto)
Factor de forma Altura Z de 2.5 pulgadas y 15 mm
Capacidad 1 960 GB, 1.92 TB, 3.84 TB, 7.68 TB, 15.36 TB, 30.72 TB 800 GB, 1.6 TB, 3.2 TB, 6.4 TB, 12.8 TB
Fácil de usar PCIe Gen3/4, 1×4 y 2×2
Cumplimiento normativo PCIe 4.0 y NVMe 1.4
Tipo NAND KIOXIA BiCS FLASH TLC 96D de 3 capas
Lectura secuencial Gen3 = hasta 3,500 MB/s
Gen4 = hasta 6,900 MB/s
Gen3 = hasta 3,500 MB/s
Gen4 = hasta 6,900 MB/s
Escritura secuencial Gen3 = hasta 3,100 MB/s
Gen4 = hasta 4,200 MB/s
Gen3 = hasta 3,100 MB/s
Gen4 = hasta 4,200 MB/s
Lectura aleatoria Gen3 = hasta 800 XNUMX IOPS
Gen4 = hasta 1.4 millones de IOPS
Gen3 = hasta 800 XNUMX IOPS
Gen4 = hasta 1.4 millones de IOPS
Escritura Aleatoria Gen3 = hasta 155 XNUMX IOPS
Gen4 = hasta 170 XNUMX IOPS
Gen3 = hasta 290 XNUMX IOPS
Gen4 = hasta 350 XNUMX IOPS
Consumo de energía Activo: 20W; Inactivo: <5W
Trabajadora 1 DWPD por 5 años 3 DWPD por 5 años
BER incorregible 1 sector por 10^17 bits leídos
MTTF / AFR 2.5 millones de horas / 0.35 %
Temperatura de Funcionamiento 0 a 70C

Performance

Banco de pruebas

Nuestras nuevas revisiones de PCIe Gen4 Enterprise SSD aprovechan una Lenovo Think System SR635 para pruebas de aplicación y benchmarks sintéticos. El ThinkSystem SR635 es una plataforma AMD de una sola CPU bien equipada que ofrece una potencia de CPU muy por encima de lo que se necesita para hacer hincapié en el almacenamiento local de alto rendimiento. También es la única plataforma en nuestro laboratorio (y una de las pocas en el mercado actualmente) con bahías PCIe Gen4 U.2. Las pruebas sintéticas no requieren muchos recursos de CPU, pero aún aprovechan la misma plataforma de Lenovo. En ambos casos, la intención es mostrar el almacenamiento local de la mejor manera posible que se alinee con las especificaciones máximas de la unidad del proveedor de almacenamiento.

Plataforma de aplicación y sintética PCIe Gen4 (Lenovo ThinkSystem SR635)

  • 1 x AMD 7452 (2.35 GHz x 32 núcleos)
  • 8 memorias ECC de 64 GB DDR4-3200 MHz
  • CentOS 7.7 1908
  • ESXi 6.7u3

Plataforma de aplicaciones PCIe Gen3 (Lenovo Think System SR850)

  • 4 CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 DRAM ECC de 32 GB DDR4-2666 MHz
  • 2 tarjetas RAID 930-8i 12 Gb/s
  • 8 bahías NVMe
  • VMware ESXI 6.7u3

Plataforma sintética PCIe Gen3 (Dell PowerEdge R740xd)

  • 2 CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 4 memorias ECC de 16 GB DDR4-2666 MHz
  • 1 tarjeta RAID PERC 730 de 2 GB y 12 Gb/s
  • Adaptador NVMe adicional
  • Ubuntu-16.04.3-escritorio-amd64

Al ser el primer conjunto de revisiones en una nueva plataforma, hemos incluido resultados de unidades anteriores, que son comparaciones cercanas pero no 100% manzanas con manzanas, ya que estaban probando en una plataforma más antigua. Nuestras diferencias de prueba sintéticas no tendrán mucho sesgo en los resultados, pero las cargas de trabajo de la aplicación que funcionan en la plataforma AMD de CPU única frente a la plataforma Intel de CPU cuádruple pueden hacerlo hasta cierto punto. En nuestras pruebas de MySQL, uno de los nuevos productos Gen4 KIOXIA tomó la delantera, pero en el servidor SQL, la latencia fue promedio. Con solo dos unidades Gen4 que hemos podido publicar, no tenemos una cantidad significativa de datos comparables, pero es algo a tener en cuenta al ver estos resultados. También hemos aumentado nuestras pruebas sintéticas para aprovechar las SSD más rápidas, y ahora muestran resultados de prueba con recuentos máximos de subprocesos más altos.

Antecedentes de prueba y comparables

La Laboratorio de pruebas de StorageReview Enterprise proporciona una arquitectura flexible para realizar pruebas comparativas de dispositivos de almacenamiento empresarial en un entorno comparable al que encuentran los administradores en implementaciones reales. El Enterprise Test Lab incorpora una variedad de servidores, redes, acondicionamiento de energía y otra infraestructura de red que permite a nuestro personal establecer condiciones del mundo real para medir con precisión el rendimiento durante nuestras revisiones.

Incorporamos estos detalles sobre el entorno de laboratorio y los protocolos en las revisiones para que los profesionales de TI y los responsables de la adquisición de almacenamiento puedan comprender las condiciones en las que hemos logrado los siguientes resultados. El fabricante del equipo que estamos probando no paga ni supervisa ninguna de nuestras revisiones. Detalles adicionales sobre el Laboratorio de pruebas de StorageReview Enterprise y una descripción general de sus capacidades de red están disponibles en esas páginas respectivas.

Análisis de la carga de trabajo de la aplicación

Para comprender las características de rendimiento de los dispositivos de almacenamiento empresarial, es esencial modelar la infraestructura y las cargas de trabajo de las aplicaciones que se encuentran en los entornos de producción en vivo. Nuestros puntos de referencia para el KIOXIA CM6 son, por lo tanto, el Rendimiento de MySQL OLTP a través de SysBench y Rendimiento de OLTP de Microsoft SQL Server con una carga de trabajo de TCP-C simulada. Para nuestras cargas de trabajo de aplicaciones, cada unidad ejecutará 4 máquinas virtuales configuradas de forma idéntica.

Rendimiento de SQL Server

Cada máquina virtual con SQL Server está configurada con dos discos virtuales: un volumen de 100 GB para el arranque y un volumen de 500 GB para la base de datos y los archivos de registro. Desde la perspectiva de los recursos del sistema, configuramos cada VM con 8 vCPU, 64 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI. Si bien nuestras cargas de trabajo de Sysbench probadas anteriormente saturaron la plataforma tanto en E/S de almacenamiento como en capacidad, la prueba de SQL busca el rendimiento de la latencia.

Esta prueba usa SQL Server 2014 ejecutándose en máquinas virtuales invitadas de Windows Server 2012 R2 y está destacada por Benchmark Factory for Databases de Quest. Reseñas de almacenamiento Protocolo de prueba OLTP de Microsoft SQL Server emplea el borrador actual del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark de procesamiento de transacciones en línea que simula las actividades que se encuentran en entornos de aplicaciones complejos. El punto de referencia TPC-C se acerca más que los puntos de referencia de rendimiento sintéticos para medir las fortalezas de rendimiento y los cuellos de botella de la infraestructura de almacenamiento en entornos de bases de datos. Cada instancia de nuestra VM de SQL Server para esta revisión utiliza una base de datos de SQL Server de 333 GB (escala 1,500) y mide el rendimiento transaccional y la latencia bajo una carga de 15,000 XNUMX usuarios virtuales.

Configuración de prueba de SQL Server (por VM)

  • Windows Server 2012 R2
  • Huella de almacenamiento: 600 GB asignados, 500 GB utilizados
  • SQL Server 2014
    • Tamaño de la base de datos: escala 1,500
    • Carga de clientes virtuales: 15,000
    • Búfer RAM: 48GB
  • Duración de la prueba: 3 horas
    • 2.5 horas de preacondicionamiento
    • Período de muestra de 30 minutos

Para nuestro punto de referencia transaccional de SQL Server, KIOXIA CM6 ocupó el cuarto lugar general con 12,633.6 TPS, aunque solo estuvo 10.6 TPS por debajo del mejor desempeño.

KIOXIA CM6 SQL TPS

Con la latencia promedio de SQL Server, el CM6 tuvo una latencia promedio de 5.5 ms, la misma que su primo CD6 SSD.

Rendimiento de Sysbench

El siguiente punto de referencia de la aplicación consiste en un Base de datos OLTP MySQL de Percona medido a través de SysBench. Esta prueba mide el promedio de TPS (transacciones por segundo), la latencia promedio y también la latencia promedio del percentil 99.

Cada banco de sistema La máquina virtual está configurada con tres discos virtuales: uno para arranque (~92 GB), uno con la base de datos preconstruida (~447 GB) y el tercero para la base de datos bajo prueba (270 GB). Desde la perspectiva de los recursos del sistema, configuramos cada VM con 8 vCPU, 60 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI.

Configuración de prueba de Sysbench (por VM)

  • CentOS 6.3 de 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tablas de base de datos: 100
    • Tamaño de la base de datos: 10,000,000
    • Subprocesos de la base de datos: 32
    • Búfer RAM: 24GB
  • Duración de la prueba: 3 horas
    • 2 horas preacondicionamiento 32 hilos
    • 1 hora 32 hilos

En cuanto a nuestro punto de referencia transaccional de Sysbench, el KIOXIA CM6 tuvo 8,632 TPS nuevamente ocupando el cuarto lugar en nuestro paquete comparable.

Banco de sistema KIOXIA CM6 TPS

Con la latencia promedio de Sysbench, el CM6 ocupó el cuarto lugar una vez más con 14.82 ms.

Para nuestra latencia en el peor de los casos (percentil 99), el CM6 permaneció donde se siente cómodo, en cuarto lugar, con 29.86 ms.

Análisis de carga de trabajo de VDBench

Cuando se trata de comparar dispositivos de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no es una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita la comparación de manzanas con manzanas entre las soluciones de la competencia. Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, hasta capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de cargas de trabajo vdBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran clúster de pruebas informáticas. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales. Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie del disco con datos, luego divide una sección del disco equivalente al 25% de la capacidad del disco para simular cómo el disco podría responder a las cargas de trabajo de la aplicación. Esto es diferente a las pruebas de entropía completa que usan el 100% del impulso y lo llevan a un estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más altas.

perfiles:

  • Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
  • Escritura aleatoria 4K: 100 % de escritura, 128 subprocesos, 0-120 % de iorate
  • Lectura aleatoria 4K (carga alta): 100 % de lectura, 512 subprocesos, 0-120 % de iorate
  • Escritura aleatoria 4K (carga alta): 100 % de escritura, 512 subprocesos, 0-120 % de iorate
  • Lectura secuencial de 64 K: 100 % de lectura, 32 subprocesos, 0-120 % de iorate
  • Escritura secuencial de 64 K: 100 % de escritura, 16 subprocesos, 0-120 % de iorate
  • Lectura secuencial de 64 K (carga alta): 100 % de lectura, 64 subprocesos, 0-120 % de iorate
  • Escritura secuencial de 64 K (carga alta): 100 % de escritura, 64 subprocesos, 0-120 % de iorate
  • Base de datos sintética: SQL y Oracle
  • Trazas de clones vinculados y clones completos de VDI

Comparables:

En nuestro primer análisis de carga de trabajo de VDBench, lectura aleatoria de 4K, el KIOXIA CM6 dio la vuelta con un rendimiento impresionante que alcanzó un máximo de 846,288 150 IOPS con una latencia de XNUMX µs. Esto pone la unidad en el primer lugar.

KIOXIA CM6 4K lectura

Las nuevas unidades PCIe 4.0 pueden soportar una carga más alta y sería negligente si no las presionáramos un poco más para ver qué pueden hacer. Entonces, con una carga alta de lectura aleatoria de 4K, el CM6 pudo alcanzar un máximo de 1,507,564 337.9 6 IOPS con una latencia de XNUMX µs. Mucho mejor que su contraparte CDXNUMX.

KIOXIA CM6 4K lectura alta

Para escritura aleatoria 4K, ocupó el tercer lugar en la general. Funcionó con una latencia inferior a 100 µs hasta aproximadamente 490 548,169 IOPS y alcanzó un máximo de 226.4 XNUMX IOPS con una latencia de XNUMX µs.

La alta carga de escritura aleatoria de 4K hizo que el CM6 alcanzara un máximo de 549,103 922 IOPS con una latencia de 6 µs por detrás del CDXNUMX esta vez.

Al cambiar a cargas de trabajo secuenciales, el CM6 tuvo la oportunidad de brillar una vez más al ocupar el primer lugar en lectura de 64K con una puntuación máxima de 97,779 6.11 IOPS o 325 GB/s con una latencia de solo XNUMX µs.

KIOXIA CM6 64k lecturaLa lectura secuencial de 64K de alta carga vio una ubicación similar a la lectura de 4K con el CM6 alcanzando un máximo de 101,018 6.3 IOPS o 629 GB/s con una latencia de XNUMX µs.

KIOXIA CM6 64K lectura altaLa escritura de 64K mostró el CM6 con una puntuación máxima sólida, aunque el rendimiento cayó después del pico, quedando en tercer lugar. El rendimiento máximo fue de aproximadamente 49 3.1 IOPS o 50 GB/s con una latencia de aproximadamente XNUMX µs.

La escritura secuencial High Load 64K vio que el CM6 tenía un pico más alto pero luego disminuyó el rendimiento. El CM6 alcanzó un máximo de alrededor de 49 3.1 IOP o XNUMX GB/s con una latencia tan baja que apenas podemos verlo antes de caer.

Nuestro próximo conjunto de pruebas son nuestras cargas de trabajo de SQL: SQL, SQL 90-10 y SQL 80-20. Comenzando con SQL, KIOXIA CM6 ocupó el segundo lugar general con un pico de 266,458 119 IOPS a una latencia de XNUMX µs.

 

Para SQL 90-10, el CM6 ocupó el segundo lugar una vez más con un rendimiento máximo de 265,276 119.2 IOPS a una latencia de XNUMX µs.

SQL 80-20 le dio al CM6 la oportunidad de presumir al llegar primero con un rendimiento máximo de 263,819 119.4 IOPS XNUMX µs.

Lo siguiente son nuestras cargas de trabajo de Oracle: Oracle, Oracle 90-10 y Oracle 80-20. Comenzando con Oracle, el CM6 ocupó el primer lugar una vez más con un rendimiento máximo de 271,230 128.6 IOPS a una latencia de XNUMX µs.

Oracle 90-10 ocupó el segundo lugar en CM6 con un rendimiento máximo de 202,341 107.4 IOPS con una latencia de solo XNUMX µs.

El CM6 se desliza justo al lado de la competencia para tomar el primer lugar una vez más en Oracle 80-20 con un pico de 206,733 104.7 IOPS a una baja latencia de XNUMX µs.

A continuación, cambiamos a nuestra prueba de clonación de VDI, completa y vinculada. Para VDI Full Clone (FC) Boot, el CM6 ocupó el primer lugar con 223,668 153.5 IOPS y una latencia de XNUMX µs.

Para el inicio de sesión inicial de VDI FC, el CM6 cayó al tercer puesto con un rendimiento máximo de 154,836 189 IOPS a una latencia de XNUMX µs.

Nuestro punto de referencia VDI FC Monday Login vio que el CM6 se mantuvo en tercer lugar con un pico de 98,867 IOPS con una latencia de 158.4µs.

Para VDI Linked Clone (LC) Boot, KIOXIA CM6 volvió al primer puesto con una puntuación máxima de 115,058 137.7 IOPS con una latencia de XNUMX µs.

El inicio de sesión inicial de VDI LC es un poco difícil de leer en el gráfico, pero el CM6 aterrizó en el medio del grupo con un pico de 38,848 202.4 IOPS a una latencia de XNUMX µs antes de dejar algunos.

Finalmente, VDI LC Monday Login hizo que el CM6 una vez más funcionara mejor con una puntuación máxima de 96,008 162.5 IOPS y una latencia de XNUMX µs.

Conclusión

El KIOXIA CM6 fue uno de los primeros SSD PCIe 4.0 para la empresa, si no el primero. Las nuevas unidades vienen con la promesa de un mayor rendimiento, en este caso hasta 6.9 GB/sy hasta 1.4 millones de IOPS. El CM6 tiene dos puertos, lo que agrega un nivel de alta disponibilidad a la unidad. La unidad viene en una amplia gama de capacidades desde 800 GB hasta 30.72 TB con 9 opciones de capacidad intermedias. El CM6 tiene un modelo de lectura intensiva y de uso mixto con 1 y 3 DWPD respectivamente. Y el SSD viene con una variedad de opciones de modelos seguros.

Para el rendimiento, ejecutamos nuestro aluvión habitual de análisis de carga de trabajo de aplicaciones y VDBench con algunas excepciones. Tuvimos que omitir la prueba de Houdini ya que la plataforma de prueba es Intel y las unidades KIOXIA se verían perjudicadas por los puertos Gen3. En VDBench, agregamos una prueba de carga más alta para estresar un poco más las nuevas unidades, ya que están diseñadas para manejarlo.

En nuestro análisis de carga de trabajo de la aplicación, ejecutamos SQL Server y Sysbench. Con SQL Server, el CM6 ocupó el cuarto lugar tanto en TPS como en latencia promedio con 12,633.6 TPS y 5.5ms, aún muy buen puntaje. Con Sysbench, la unidad volvió a ocupar el cuarto lugar en todos los ámbitos con 8,632 TPS, una latencia promedio de 14.82 ms y una latencia de 29.86 ms en el peor de los casos.

En VDBench, la unidad realmente brilló. El CM6 fue el que mejor se desempeñó en varios de nuestros puntos de referencia. Los puntos destacados básicos incluyen 846 4 IOPS en lectura 1.5K, 4 millones de IOPS en lectura 548K con carga alta, 4 549 IOPS en escritura 4K, 6.1 64 IOPS en escritura 6.3K con carga alta, 64 GB/s en lectura 3.1K, 64 GB/s en lectura 64K con carga alta, y 266 GB/s en escritura de 265 K y carga alta de escritura de 90 K. SQL vio picos de 10 264 IOPS, 80 20 IOPS en SQL 271-202 y 90 10 IOPS en SQL 207-80. Oracle nos proporcionó picos de 20 224 IOPS, 155 99 IOPS en Oracle 115-39 y 96 XNUMX IOPS en Oracle XNUMX-XNUMX. VDI FC nos proporcionó un arranque de XNUMX XNUMX IOPS, un inicio de sesión inicial de XNUMX XNUMX IOPS y un inicio de sesión de lunes de XNUMX XNUMX IOPS. VDI LC vio un arranque de XNUMX XNUMX IOPS, un inicio de sesión inicial de XNUMX XNUMX IOPS y un inicio de sesión de lunes de XNUMX XNUMX IOPS.

Esta revisión y la del CD6 analizan específicamente PCIe 4.0 y el futuro de los dispositivos de almacenamiento a medida que ingresan más al mercado. No hay muchos proveedores de servidores que produzcan soporte completo para PCIe 4.0, siendo Lenovo el único en nuestro laboratorio al momento de escribir este artículo. Lenovo se apresuró a aprovechar todas las ventajas que ofrece la segunda generación de procesadores AMD EPYC 2, anticipándose a productos de almacenamiento como KIOXIA CM7002. Pero para KIOXIA, los coloca en el lugar interesante de estar por delante de los demás, pero el potencial completo de su unidad solo se encuentra con servidores más nuevos basados ​​en AMD (hasta que Intel decida participar también). Por ahora, el CM6 seguirá funcionando con equipos heredados y estará listo para liberar más rendimiento a medida que las empresas se actualicen.

SSD empresariales KIOXIA

Discutir en Reddit

Interactuar con StorageReview

Boletín informativo | Canal de YouTube | Podcast iTunes/Spotify | @Instagram | Twitter | Facebook | RSS Feed