La interfaz NVMe, específicamente PCIe 3.0 NVMe 1.3, ha sido la interfaz SSD preferible para prácticamente cualquier caso de uso desde hace un tiempo. Esta interfaz se ha utilizado una y otra vez a medida que los proveedores continúan mejorando su rendimiento con cada nueva generación. PCIe ahora ha ingresado a 4.0, trayendo consigo ganancias masivas en el rendimiento secuencial y aleatorio. El KIOXIA CD6 es el último SSD en llegar al mercado (y uno de los primeros PCIe 4.0 para empresas), que se centra en un rendimiento constante en entornos exigentes las 24 horas del día, los 7 días de la semana. Esto lo hace ideal para centros de datos con necesidades de resistencia de uso mixto y lectura intensiva. Los SSD KIOXIA CD6 también son compatibles con SFF-TA-1001, lo que permite la conectividad con unidades SAS, SATA y NVMe en el mismo backplane (así como controladores Tri-mode). La línea KIOXIA cuenta con capacidades que van desde 800 GB hasta 15.36 TB y están disponibles en varias opciones diferentes de seguridad y resistencia.
La interfaz NVMe, específicamente PCIe 3.0 NVMe 1.3, ha sido la interfaz SSD preferible para prácticamente cualquier caso de uso desde hace un tiempo. Esta interfaz se ha utilizado una y otra vez a medida que los proveedores continúan mejorando su rendimiento con cada nueva generación. PCIe ahora ha ingresado a 4.0, trayendo consigo ganancias masivas en el rendimiento secuencial y aleatorio. El KIOXIA CD6 es el último SSD en llegar al mercado (y uno de los primeros PCIe 4.0 para empresas), que se centra en un rendimiento constante en entornos exigentes las 24 horas del día, los 7 días de la semana. Esto lo hace ideal para centros de datos con necesidades de resistencia de uso mixto y lectura intensiva. Los SSD KIOXIA CD6 también son compatibles con SFF-TA-1001, lo que permite la conectividad con unidades SAS, SATA y NVMe en el mismo backplane (así como controladores Tri-mode). La línea KIOXIA cuenta con capacidades que van desde 800 GB hasta 15.36 TB y están disponibles en varias opciones diferentes de seguridad y resistencia. El CD6 también viene en factores de forma de 2.5 pulgadas y 15 mm de altura Z y está alimentado por el controlador, el firmware y la memoria TLC 96D BiCS FLASH de 3 capas de KIOXIA. Utiliza un diseño de puerto único (es decir, hay una ruta de datos desde el host hasta el SSD).
ACTUALIZACIÓN 4/2/22: hemos vuelto a revisar la Kioxi CD6 con firmware más maduro
El rendimiento de PCIe 4.0 tiene potencial para alcanzar cifras bastante increíbles, y el KIOXIA CD6 ciertamente no es una excepción. KIOXIA cita su nueva línea de unidades para ofrecer un rendimiento secuencial de hasta 6.2 GB/s y 4.0 GB/s en lecturas y escrituras, respectivamente, mientras que el rendimiento aleatorio tiene el potencial de alcanzar hasta un millón de IOPS en lecturas y 250,000 XNUMX IOPS en escrituras. Estos son números impresionantes por decir lo menos.
También cuenta con una variedad de funcionalidades de confiabilidad integradas, que incluyen recuperación de fallas de unidades de sexta generación y protección de paridad doble y protección contra pérdida de energía (PLP), corrección de datos de extremo a extremo para mayor confiabilidad. El KIOXIA CD6 es compatible con NVMe 6, lo que aporta algunas funciones importantes a la unidad. Esto incluye registros de eventos persistentes, mejoras en la limpieza y granularidad del espacio de nombres y protección contra escritura del espacio de nombres.
Especificaciones de KIOXIA CD6
Especificaciones | CM6-R (lectura intensiva) | CM6-V (uso mixto) |
Factor de forma |
Altura Z de 2.5 pulgadas y 15 mm |
|
Capacidad[ 1 ][ 2 ] | 960 GB, 1.92 TB, 3.84 TB, 7.68TB, 15.36 TB | 800 GB, 1.6 TB, 3.2 TB, 6.4 TB, 12.8 TB |
Fácil de usar | PCIe Gen3/4, 1×4 | |
Cumplimiento normativo | PCIe 4.0 y NVMe 1.4 | |
Tipo NAND | KIOXIA BiCS FLASH TLC 96D de 3 capas | |
Lectura secuencial | Gen3 = hasta 3,500 MB/s; Gen4 = hasta 6,200 MB/s | Gen3 = hasta 3,500 MB/s; Gen4 = hasta 6,200 MB/s |
Escritura secuencial | Gen3 = hasta 2,350 MB/s; Gen4 = hasta 4,000 MB/s | Gen3 = hasta 2,350 MB/s; Gen4 = hasta 4,000 MB/s |
Lectura aleatoria | Gen3 = hasta 770 4 IOPS; Gen1.0 = hasta XNUMX millones de IOPS | Gen3 = hasta 770 4 IOPS; Gen1.0 = hasta XNUMX millones de IOPS |
Escritura Aleatoria | Gen3 = hasta 75 4 IOPS; Gen85 = hasta XNUMX XNUMX IOPS | Gen3 = hasta 165 4 IOPS; Gen250 = hasta XNUMX XNUMX IOPS |
Consumo de energía |
Activo: 20W; Inactivo: <5W |
|
Trabajadora | 1 DWPD por 5 años | 3 DWPD por 5 años |
BER incorregible |
1 sector por 10^17 bits leídos |
|
MTTF / AFR |
2.5 millones de horas / 0.35 % |
|
Temperatura de Funcionamiento |
0 a 70C |
Rendimiento de KIOXIA CD6
Banco de pruebas
Nuestras nuevas revisiones de PCIe Gen4 Enterprise SSD aprovechan una Lenovo Think System SR635 para pruebas de aplicación y benchmarks sintéticos. El ThinkSystem SR635 es una plataforma AMD de una sola CPU bien equipada que ofrece una potencia de CPU muy por encima de lo que se necesita para hacer hincapié en el almacenamiento local de alto rendimiento. También es la única plataforma en nuestro laboratorio (y una de las pocas en el mercado actualmente) con bahías PCIe Gen4 U.2. Las pruebas sintéticas no requieren muchos recursos de CPU, pero aún aprovechan la misma plataforma de Lenovo. En ambos casos, la intención es mostrar el almacenamiento local de la mejor manera posible que se alinee con las especificaciones máximas de la unidad del proveedor de almacenamiento.
Plataforma de aplicación y sintética PCIe Gen4 (Lenovo ThinkSystem SR635)
- 1 x AMD 7452 (2.35 GHz x 32 núcleos)
- 8 memorias ECC de 64 GB DDR4-3200 MHz
- CentOS 7.7 1908
- ESXi 6.7u3
Plataforma de aplicaciones PCIe Gen3 (Lenovo Think System SR850)
- 4 CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
- 16 DRAM ECC de 32 GB DDR4-2666 MHz
- 2 tarjetas RAID 930-8i 12 Gb/s
- 8 bahías NVMe
- VMware ESXI 6.7u3
Plataforma sintética PCIe Gen3 (Dell PowerEdge R740xd)
- 2 CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
- 4 memorias ECC de 16 GB DDR4-2666 MHz
- 1 tarjeta RAID PERC 730 de 2 GB y 12 Gb/s
- Adaptador NVMe adicional
- Ubuntu-16.04.3-escritorio-amd64
Al ser el primer conjunto de revisiones en una nueva plataforma, hemos incluido resultados de unidades anteriores, que son comparaciones cercanas pero no 100% manzanas con manzanas, ya que estaban probando en una plataforma más antigua. Nuestras diferencias de prueba sintéticas no tendrán mucho sesgo en los resultados, pero las cargas de trabajo de la aplicación que funcionan en la plataforma AMD de CPU única frente a la plataforma Intel de CPU cuádruple pueden hacerlo hasta cierto punto. En nuestras pruebas de MySQL, uno de los nuevos productos Gen4 KIOXIA tomó la delantera, pero en el servidor SQL, la latencia fue promedio. Con solo dos unidades Gen4 que hemos podido publicar, no tenemos una cantidad significativa de datos comparables, pero es algo a tener en cuenta al ver estos resultados. También hemos aumentado nuestras pruebas sintéticas para aprovechar las SSD más rápidas, y ahora muestran resultados de prueba con recuentos máximos de subprocesos más altos.
Antecedentes de prueba y comparables
El Laboratorio de pruebas de StorageReview Enterprise proporciona una arquitectura flexible para realizar pruebas comparativas de dispositivos de almacenamiento empresarial en un entorno comparable al que encuentran los administradores en implementaciones reales. El Enterprise Test Lab incorpora una variedad de servidores, redes, acondicionamiento de energía y otra infraestructura de red que permite a nuestro personal establecer condiciones del mundo real para medir con precisión el rendimiento durante nuestras revisiones.
Incorporamos estos detalles sobre el entorno de laboratorio y los protocolos en las revisiones para que los profesionales de TI y los responsables de la adquisición de almacenamiento puedan comprender las condiciones en las que hemos logrado los siguientes resultados. El fabricante del equipo que estamos probando no paga ni supervisa ninguna de nuestras revisiones. Detalles adicionales sobre el Laboratorio de pruebas de StorageReview Enterprise y una descripción general de sus capacidades de red están disponibles en esas respectivas páginas.
Análisis de la carga de trabajo de la aplicación
Para comprender las características de rendimiento de los dispositivos de almacenamiento empresarial, es esencial modelar la infraestructura y las cargas de trabajo de las aplicaciones que se encuentran en los entornos de producción en vivo. Nuestros puntos de referencia para el Kioxia CD6 son, por lo tanto, el Rendimiento de MySQL OLTP a través de SysBench y Rendimiento de OLTP de Microsoft SQL Server con una carga de trabajo de TCP-C simulada. Para nuestras cargas de trabajo de aplicaciones, cada unidad ejecutará 4 máquinas virtuales configuradas de forma idéntica.
Rendimiento de SQL Server
Cada máquina virtual con SQL Server está configurada con dos discos virtuales: un volumen de 100 GB para el arranque y un volumen de 500 GB para la base de datos y los archivos de registro. Desde la perspectiva de los recursos del sistema, configuramos cada VM con 8 vCPU, 64 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI. Si bien nuestras cargas de trabajo de Sysbench probadas anteriormente saturaron la plataforma tanto en E/S de almacenamiento como en capacidad, la prueba de SQL busca el rendimiento de la latencia.
Esta prueba usa SQL Server 2014 ejecutándose en máquinas virtuales invitadas de Windows Server 2012 R2 y está destacada por Benchmark Factory for Databases de Quest. Reseñas de almacenamiento Protocolo de prueba OLTP de Microsoft SQL Server emplea el borrador actual del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark de procesamiento de transacciones en línea que simula las actividades que se encuentran en entornos de aplicaciones complejos. El punto de referencia TPC-C se acerca más que los puntos de referencia de rendimiento sintéticos para medir las fortalezas de rendimiento y los cuellos de botella de la infraestructura de almacenamiento en entornos de bases de datos. Cada instancia de nuestra VM de SQL Server para esta revisión utiliza una base de datos de SQL Server de 333 GB (escala 1,500) y mide el rendimiento transaccional y la latencia bajo una carga de 15,000 XNUMX usuarios virtuales.
Configuración de prueba de SQL Server (por VM)
- Windows Server 2012 R2
- Huella de almacenamiento: 600 GB asignados, 500 GB utilizados
- SQL Server 2014
-
- Tamaño de la base de datos: escala 1,500
- Carga de clientes virtuales: 15,000
- Búfer RAM: 48GB
- Duración de la prueba: 3 horas
- 2.5 horas de preacondicionamiento
- Período de muestra de 30 minutos
Para nuestro punto de referencia transaccional de SQL Server, KIOXIA CD6 obtuvo una puntuación de 12,633.7 TPS en 4 VM.
La latencia promedio hizo que el KIOXIA CD6 tuviera 5.5 ms a 4 VM (lo mismo que el CD6), colocándolo ligeramente por detrás de las unidades Huawei y Memblaze.
Rendimiento de Sysbench
El siguiente punto de referencia de la aplicación consiste en un Base de datos OLTP MySQL de Percona medido a través de SysBench. Esta prueba mide el promedio de TPS (transacciones por segundo), la latencia promedio y también la latencia promedio del percentil 99.
Cada banco de sistema La máquina virtual está configurada con tres discos virtuales: uno para arranque (~92 GB), uno con la base de datos preconstruida (~447 GB) y el tercero para la base de datos bajo prueba (270 GB). Desde la perspectiva de los recursos del sistema, configuramos cada VM con 8 vCPU, 60 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI.
Configuración de prueba de Sysbench (por VM)
- CentOS 6.3 de 64 bits
- Percona XtraDB 5.5.30-rel30.1
-
- Tablas de base de datos: 100
- Tamaño de la base de datos: 10,000,000
- Subprocesos de la base de datos: 32
- Búfer RAM: 24GB
- Duración de la prueba: 3 horas
- 2 horas preacondicionamiento 32 hilos
- 1 hora 32 hilos
Pasando al punto de referencia transaccional de Sysbench, KIOXIA registró una puntuación líder de 9,333 TPS en 4VM.
En la latencia promedio de Sysbench, vimos el CD6 con una latencia de solo 13.71 ms a 4 VM, nuevamente liderando el grupo.
Para nuestra latencia en el peor de los casos (percentil 99), el CD6 alcanzó los 27.48 ms a 4 VM, esta vez detrás del Huawei por un pelo (27.22 ms).
Análisis de carga de trabajo de VDBench
Cuando se trata de comparar dispositivos de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no es una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita la comparación de manzanas con manzanas entre las soluciones de la competencia. Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, hasta capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de cargas de trabajo vdBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran clúster de pruebas informáticas. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales. Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie del disco con datos, luego divide una sección del disco equivalente al 25% de la capacidad del disco para simular cómo el disco podría responder a las cargas de trabajo de la aplicación. Esto es diferente a las pruebas de entropía completa que usan el 100% del impulso y lo llevan a un estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más altas.
perfiles:
- Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
- Escritura aleatoria 4K: 100 % de escritura, 128 subprocesos, 0-120 % de iorate
- Lectura aleatoria 4K (carga alta): 100 % de lectura, 512 subprocesos, 0-120 % de iorate
- Escritura aleatoria 4K (carga alta): 100 % de escritura, 512 subprocesos, 0-120 % de iorate
- Lectura secuencial de 64 K: 100 % de lectura, 32 subprocesos, 0-120 % de iorate
- Escritura secuencial de 64 K: 100 % de escritura, 16 subprocesos, 0-120 % de iorate
- Lectura secuencial de 64 K (carga alta): 100 % de lectura, 64 subprocesos, 0-120 % de iorate
- Escritura secuencial de 64 K (carga alta): 100 % de escritura, 64 subprocesos, 0-120 % de iorate
- Base de datos sintética: SQL y Oracle
- Trazas de clones vinculados y clones completos de VDI
Comparables:
En nuestro primer análisis de carga de trabajo VDBench, Random 4K Read, el KIOXIA CD6 obtuvo una puntuación máxima de 760,160 165.5 IOPS con una latencia de XNUMX µsDurante una carga alta en Random 4K Read, vimos que el KIOXIA CD6 se ralentizaba un poco acercándose a la marca de 1 millón de IOPS, y terminó con un pico de 1,067,840 472 XNUMX IOPS a XNUMX µs.
Para la escritura aleatoria de 4K, el CD6 fue el de mejor rendimiento, alcanzando un máximo de 579,919 211.1 IOPS con una latencia de XNUMX µs.
En una alta carga de escritura, el KIOXIA CD6 mostró un pico impresionante de 709,547 713.3 IOPS con XNUMX µs de latencia.
Cambiando a cargas de trabajo secuenciales, el CD6 mostró resultados sólidos con un pico de 68,413 4.28 IOPS (o 465.6 GB/s) a XNUMX µs (se esperaba que el otro KIOXIA fuera el mejor disco en lecturas). Durante una alta carga de lecturas secuenciales, el CD6 alcanzó un máximo de 75,598 4.72 IOPS (843.5 GB/s) antes de disminuir la velocidad y alcanzar una latencia de hasta XNUMX ms.
Para la escritura secuencial de 64K, el KIOXIA CD6 volvió a demostrar que es una potencia en escritura, registrando un máximo de 53,402 3.33 IOPS (o 291.6 GB/s) con una latencia de XNUMX ms antes de caer un poco al final.
En una alta carga de escritura, el KIOXIA CD6 alcanzó un máximo de 42,299 2.58 IOPS (o 65.1 GB/s) con una latencia de solo XNUMX ms.
Nuestro próximo conjunto de pruebas son nuestras cargas de trabajo de SQL: SQL, SQL 90-10 y SQL 80-20. Comenzando con SQL, KIOXIA CD6 tuvo un pico sólido de 241,700 131.1 IOPS y una latencia de XNUMX ms. En SQL 90-10, el CD6 tenía prácticamente el mismo rendimiento que la unidad Memblaze, alcanzando un máximo de 243,292 129.9 IOPS y XNUMX ms de latencia.En el SQL 80-20, las unidades de alto rendimiento mostraron un rendimiento bastante similar, con el CD6 registrando un pico de 244,857 IOPS con una latencia de 128.3 ms.
Lo siguiente son nuestras cargas de trabajo de Oracle: Oracle, Oracle 90-10 y Oracle 80-20. Comenzando con Oracle, KIOXIA CD6 alcanzó el tercer lugar con un sólido 253,635 IOPS y una latencia de 137.5µs.
Oracle 90-10 nos mostró más de lo anterior, el CD6 alcanzó un máximo de 168,000 116.8 IOPS con XNUMX µs de latencia.Con Oracle 80-20, las 4 unidades principales mostraron un rendimiento muy similar, ya que el CD6 alcanzó un máximo de 192,663 112.3 con una latencia de XNUMX ms.A continuación, cambiamos a nuestra prueba de clonación de VDI, completa y vinculada. Para VDI Full Clone (FC) Boot, KIOXIA CD6 tuvo un pico de 196,584 172.3 IOPS con una latencia de XNUMX µs para el tercer lugar. Inicio de sesión inicial de VDI FC, el KIOXIA CD6 tuvo el mejor rendimiento con un pico de 169,412 172.6 IOPS a XNUMX ms.
VDI FC Monday Login, el CD6 mostró el máximo rendimiento una vez más con un pico de 109,488 142.7 IOPS a XNUMX ms.
Para VDI Linked Clone (LC) Boot, el CD6 mostró un impresionante 100,678 157 IOPS a 6 ms de latencia, solo por detrás del KIOXIA CMXNUMX. El inicio de sesión inicial de VDI LC mostró números desiguales durante el perfil de inicio de sesión inicial, alcanzando un máximo de 25,235 313.8 IOPS y XNUMX ms de latencia antes de sufrir una gran caída en el rendimiento.Por último, con VDI LC Monday Login, el KIOXIA CD6 finalizó nuestras pruebas con otro buen rendimiento, con 84,903 184.3 IOPS a XNUMX ms.
Conclusión
El KIOXIA CD6 es el SSD de centro de datos de alto rendimiento más nuevo que ha llegado al mercado y aprovecha la nueva interfaz PCIe 4.0. Está diseñado específicamente para entornos exigentes las 24 horas del día, los 7 días de la semana, específicamente aquellos con necesidades de resistencia de uso mixto y lectura intensiva. La nueva unidad KIOXIA está disponible en formato de 2.5 pulgadas y 15 mm de altura Z, cuenta con KIOXIA BiCS FLASH 96D TLC de 3 capas y está disponible en una amplia gama de capacidades, desde 960 GB hasta 15.36 TB. También viene con una gama de opciones de seguridad.
En cuanto al rendimiento, comparamos el CD6 con otros SSD de clasificación similar, incluido el KIOXIA CM6. Para el análisis de carga de trabajo de la aplicación, vimos que el CD6 alcanzó 12,633.7 5.5 TPS con una latencia promedio de 9,333 ms en SQL Server, colocándolo justo debajo de las unidades Memblaze y Huawei. Para Sysbench, la unidad alcanzó 13.71 TPS, una latencia promedio de 27.48 ms y una latencia en el peor de los casos de XNUMX m.
Nuestra prueba VDbench vio un desempeño más sólido por parte de KIOXIA. En la mayoría de los casos, sin embargo, iba detrás de la unidad CM6. Los puntos destacados incluyen: 760,160 4 IOPS en lectura 1,067,840K (579,919 4 709,547 IOPS de carga alta), 4.28 64 IOPS en escritura 4.72K (3.33 64 IOPS de carga alta), 2.58 GB/s en lectura de 242 K (243 GB/s de carga alta) y 90 GB/s en 10 K escritura (carga alta de 245 GB/s). Las cargas de trabajo de SQL registraron 80 20 IOPS, 6 254 IOPS para SQL 168-90 y 10 192 IOPS en SQL 80-20. En Oracle, las unidades de mayor rendimiento se desempeñaron de manera muy similar (el CD6 entre ellas), publicando cargas de trabajo con XNUMX IOPS, XNUMX XNUMX IOPS en Oracle XNUMX-XNUMX y XNUMX XNUMX IOPS en Oracle XNUMX-XNUMX. En nuestra prueba VDI Clone, el CDXNUMX mostró un rendimiento impresionante en todos los ámbitos, destacado por su alto rendimiento en nuestras pruebas VDI FC Monday Login y VDI FC Initial Login.
El enfoque de esta revisión está en el rendimiento del CD6, que reúne una tarjeta de puntuación impresionante. Sin embargo, quizás la historia más importante sea el futuro de PCIe Gen4. Lenovo es el primero en salir con un servidor que admite PCIe Gen4 de adelante hacia atrás. La mayoría de los otros servidores solo admiten Gen4 en la parte posterior, lo cual es una decisión de diseño fundamental. Era más fácil y rápido saltarse las bahías delanteras. Lenovo tomó el camino más completo y desarrolló sus servidores Rome para poder aprovechar todo lo que AMD tenía para ofrecer. El resultado neto es que Lenovo puede aprovechar la nueva tecnología, como el CD6 de KIOXIA, donde la mayoría de los demás no pueden. Esto pone a KIOXIA en un escenario de huevo o gallina, al menos hasta que Intel lance sus CPU de servidor de próxima generación. Se podría decir que estar por delante de la curva de TI en este caso está bien, sin embargo, el CD6 funcionará bien con plataformas heredadas, listo para dar más cuando los sistemas PCIe Gen4 estén disponibles. Por ahora, espere ver muchos puntos de referencia promocionando los beneficios de los servidores AMD, especialmente a medida que los sistemas de doble CPU de Lenovo ingresan al mercado.
ACTUALIZACIÓN 4/2/22: hemos vuelto a revisar la Kioxi CD6 con firmware más maduro
Interactuar con StorageReview
Boletín informativo | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed