Inicio Empresa Revisión del SSD DapuStor H3900

Revisión del SSD DapuStor H3900

by Adam Armstrong

El DapuStor H3900 es un SSD empresarial que forma parte de la línea Haishen3-XL de la empresa. A diferencia del H3100 o el H3200, el DapuStor H3900 se basa en KIOXIA FLASH XL tecnología (el primer accionamiento disponible en el mercado con la nueva tecnología), de ahí el nombre de Haishen3-XL. Al estar basado en la memoria de clase de almacenamiento (SCM), este SSD compartirá casos de uso similares a los de los medios de la misma clase, incluidos caché y aceleración de datos, base de datos en memoria, entrenamiento de IA y Big Data.

El DapuStor H3900 es un SSD empresarial que forma parte de la línea Haishen3-XL de la empresa. A diferencia del H3100 o el H3200, el DapuStor H3900 se basa en KIOXIA FLASH XL tecnología (el primer accionamiento disponible en el mercado con la nueva tecnología), de ahí el nombre de Haishen3-XL. Al estar basado en la memoria de clase de almacenamiento (SCM), este SSD compartirá casos de uso similares a los de los medios de la misma clase, incluidos caché y aceleración de datos, base de datos en memoria, entrenamiento de IA y Big Data.

Dapustor H3900

La memoria de clase de almacenamiento ha estado disponible durante algunos años con Optane de Intel dominando más o menos ese segmento del mercado. Es bueno ver algo de competencia para ver cómo se sostienen entre sí. Cuando solo hay una opción, por supuesto que es la mejor. Al igual que otros SCM, el SSD DapuStor H3900 proporcionará una latencia ultrabaja con un mayor rendimiento. DapuStor cotiza hasta 3.5 GB/3.2 GB de ancho de banda, 830 300/20 30 IOPS en cargas de trabajo de profundidad de cola baja con latencia de lectura de XNUMX μs. Además de las ganancias de rendimiento, la unidad también tiene una increíble resistencia con hasta XNUMX DWPD. La unidad aprovecha el controlador Marvell ZAO.

Interfaz DapuStor H3900

Al igual que con otros SCM, existe un límite de capacidad. El H3900 viene en capacidades de 400 GB, 750 GB, 800 GB y 1.6 TB. Para esta revisión, analizaremos la versión de 800 GB.

Especificaciones del SSD DapuStor H3900

N º de Modelo H3900
Capacidad (TB) 0.4 0.75 0.8 1.6
Factor de forma U.2 y HHHL
Fácil de usar PCIe 3.0 x 4 NVMe 1.3
Tipo de flash 96L 3D XL-FLASH
Ancho de banda de lectura (128 KB) MB/s 3500 3500 3500 3500
Ancho de banda de escritura (128 KB) MB/s 3000 3100 3100 3200
Lectura aleatoria (4KB) KIOPS 830 830 830 830
Escritura aleatoria (4KB) KIOPS 246 350 300 288
Consumo de energía (típ./máx.) Watt 7.0/8.1 7.0/8.5 7.0/8.5 7.0/9.5
Vida útil 30 DWPD
Latencia aleatoria 4K (típ.) R/W μs 30/17 | 20/09
Tasa de error de bit incorregible (UBER) <10-17
Tiempo medio entre fallos (MTBF) 2 millón de horas
Sistemas operativos soportados RHEL, SLES, CentOS, Ubuntu, Windows Server, VMware ESXi
Certificación FCC, CE, ROHS, REACH, WEEE, PCI express, NVM express

 

Rendimiento del SSD DapuStor H3900

Banco de pruebas

Nuestras revisiones Enterprise SSD aprovechan un Lenovo Think System SR850 para pruebas de aplicaciones (Nota: tuvimos que usar una tarjeta adaptadora en lugar de una ranura frontal debido a un problema de compatibilidad) y una Dell PowerEdge R740xd para benchmarks sintéticos. El ThinkSystem SR850 es una plataforma de CPU cuádruple bien equipada que ofrece una potencia de CPU muy por encima de lo que se necesita para hacer hincapié en el almacenamiento local de alto rendimiento. Las pruebas sintéticas que no requieren muchos recursos de CPU utilizan el servidor de doble procesador más tradicional. En ambos casos, la intención es mostrar el almacenamiento local de la mejor manera posible que se alinee con las especificaciones máximas de la unidad del proveedor de almacenamiento.

Servidor DapuStor H3900

Lenovo Think System SR850

  • 4 CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 DRAM ECC de 32 GB DDR4-2666 MHz
  • 2 tarjetas RAID 930-8i 12 Gb/s
  • 8 bahías NVMe
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 4 memorias ECC de 16 GB DDR4-2666 MHz
  • 1 tarjeta RAID PERC 730 de 2 GB y 12 Gb/s
  • Adaptador NVMe adicional
  • Ubuntu-16.04.3-escritorio-amd64

Antecedentes de prueba y comparables

La Laboratorio de pruebas de StorageReview Enterprise proporciona una arquitectura flexible para realizar pruebas comparativas de dispositivos de almacenamiento empresarial en un entorno comparable al que encuentran los administradores en implementaciones reales. El Enterprise Test Lab incorpora una variedad de servidores, redes, acondicionamiento de energía y otra infraestructura de red que permite a nuestro personal establecer condiciones del mundo real para medir con precisión el rendimiento durante nuestras revisiones.

Incorporamos estos detalles sobre el entorno de laboratorio y los protocolos en las revisiones para que los profesionales de TI y los responsables de la adquisición de almacenamiento puedan comprender las condiciones en las que hemos logrado los siguientes resultados. El fabricante del equipo que estamos probando no paga ni supervisa ninguna de nuestras revisiones. Detalles adicionales sobre el Laboratorio de pruebas de StorageReview Enterprise y una descripción general de sus capacidades de red están disponibles en esas páginas respectivas.

Análisis de la carga de trabajo de la aplicación

Para comprender las características de rendimiento de los dispositivos de almacenamiento empresarial, es esencial modelar la infraestructura y las cargas de trabajo de las aplicaciones que se encuentran en los entornos de producción en vivo. Nuestros puntos de referencia para el DapuStor H3100 son, por lo tanto, el Rendimiento de MySQL OLTP a través de SysBench y Rendimiento de OLTP de Microsoft SQL Server con una carga de trabajo de TCP-C simulada. Para nuestras cargas de trabajo de aplicaciones, cada unidad ejecutará de 2 a 4 máquinas virtuales configuradas de manera idéntica.

Houdini por SideFX

La prueba de Houdini está diseñada específicamente para evaluar el rendimiento del almacenamiento en relación con la representación CGI. El banco de pruebas para esta aplicación es una variante del tipo de servidor central Dell PowerEdge R740xd que usamos en el laboratorio con dos CPU Intel 6130 y 64 GB de DRAM. En este caso, instalamos Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) ejecutando bare metal. La salida del punto de referencia se mide en segundos para completarse, cuanto menos mejor.

La demostración de Maelstrom representa una sección de la canalización de renderizado que destaca las capacidades de rendimiento del almacenamiento al demostrar su capacidad para usar de manera efectiva el archivo de intercambio como una forma de memoria extendida. La prueba no escribe los datos de los resultados ni procesa los puntos para aislar el efecto de tiempo de pared del impacto de la latencia en el componente de almacenamiento subyacente. La prueba en sí se compone de cinco fases, tres de las cuales ejecutamos como parte del benchmark, que son las siguientes:

  • Carga puntos empaquetados desde el disco. Este es el momento de leer desde el disco. Esto es de subproceso único, lo que puede limitar el rendimiento general.
  • Desempaqueta los puntos en una sola matriz plana para permitir que se procesen. Si los puntos no dependen de otros puntos, el conjunto de trabajo podría ajustarse para permanecer en el núcleo. Este paso es de subprocesos múltiples.
  • (No Ejecutar) Procesa los puntos.
  • Los vuelve a empaquetar en bloques divididos en cubos adecuados para volver a almacenarlos en el disco. Este paso es de subprocesos múltiples.
  • (No Ejecutar) Escribe los bloques almacenados nuevamente en el disco.

Aquí, el DapuStor H3900 fue capaz de alcanzar los 2,201.987 segundos, colocándose justo en el rango de las otras unidades SCM.

DapuStor H3900 Houdini

Análisis de carga de trabajo de VDBench

Cuando se trata de comparar dispositivos de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no es una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita la comparación de manzanas con manzanas entre las soluciones de la competencia. Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, hasta capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de cargas de trabajo vdBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran clúster de pruebas informáticas. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales. Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie del disco con datos, luego divide una sección del disco equivalente al 25% de la capacidad del disco para simular cómo el disco podría responder a las cargas de trabajo de la aplicación. Esto es diferente a las pruebas de entropía completa que usan el 100% del impulso y lo llevan a un estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más altas.

perfiles:

  • Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
  • Escritura aleatoria 4K: 100 % de escritura, 64 subprocesos, 0-120 % de iorate
  • Lectura secuencial de 64 K: 100 % de lectura, 16 subprocesos, 0-120 % de iorate
  • Escritura secuencial de 64 K: 100 % de escritura, 8 subprocesos, 0-120 % de iorate
  • Base de datos sintética: SQL y Oracle
  • Trazas de clones vinculados y clones completos de VDI

Comparables:

En nuestro primer análisis de carga de trabajo de VDBench, Lectura aleatoria de 4K, el DapuStor mostró un rendimiento con una latencia de solo 31.7 μs y alcanzó un máximo de 835,064 148.2 IOPS con una latencia de solo XNUMX μs antes de caer un poco. Esto puso al drive en primer lugar por un cómodo margen.

Lectura DapuStor H3900 4k

La escritura aleatoria 4K fue una historia diferente para el H3900. Aquí, la unidad ocupó el tercer lugar con un rendimiento máximo de 338,630 457.4 IOPS con una latencia de XNUMX µs.

DapuStor H3900 4k escribir

Cambiando a cargas de trabajo secuenciales, observamos nuestros puntos de referencia de 64K. Para lectura secuencial, el H3900 alcanzó un máximo de 47,707 3 IOPS o 334.3 GB/s con una latencia de XNUMX µs para el segundo lugar.

Lectura DapuStor H3900 64k

Con una escritura secuencial de 64K, DapuStor volvió a estar en la cima con un pico de 36,571 2.3 IOPS o 431 GB/s con una latencia de XNUMX µs.

DapuStor H3900 64k escribir

Nuestro próximo conjunto de pruebas son nuestras cargas de trabajo de SQL: SQL, SQL 90-10 y SQL 80-20. Comenzando con SQL, el DapuStor H3900 tuvo una ejecución impresionante y se mantuvo en su totalidad por debajo de los 100 µs. La unidad alcanzó el primer lugar con 405,709 IOPS y una latencia de solo 78.6 µs.

DapuStor H3900 sql

Para SQL 90-10, el H3900 repitió su tendencia de latencia con una puntuación máxima de 388,430 81.8 IOPS con una latencia de solo XNUMX µs. El drive tomó fácilmente el primer lugar.

 

SQL 80-20 mostró la mejor ubicación del H3900 hasta ahora con un pico de 378,175 83.9 IOPS a XNUMX µs de latencia, muy por delante del resto.

Lo siguiente son nuestras cargas de trabajo de Oracle: Oracle, Oracle 90-10 y Oracle 80-20. Comenzando con Oracle, el DapuStor H3900 continuó con su dominio de latencia extremadamente baja. La unidad tomó el primer lugar con un pico de 354,991 98.5 IOPS con una latencia de XNUMX µs.

Con Oracle 90-10, el H3900 se mantuvo en el primer lugar con un pico de 332,320 65.7 IOPS y una latencia de XNUMX µs.

Oracle 80-20 una vez más tuvo al H3900 en la cima con 328,103 IOPS y una latencia de 66.3µs.

A continuación, cambiamos a nuestra prueba de clonación de VDI, completa y vinculada. Para VDI Full Clone (FC) Boot, el DapuStor H3900 estaba a la cabeza con un pico de 231,866 138.8 IOPS con una latencia de XNUMX µs antes de caer un poco.

Para el inicio de sesión inicial de VDI FC, el H3900 estuvo a la cabeza con un pico de 145,357 203.4 IOPS y una latencia de XNUMX µs.

VDI FC Monday Login vio a DapuStor tomar el lugar de parada con 118,009 IOPS con una latencia de 133.6µs.

Para el arranque VDI Linked Clone (LC), el DapuStor H3900 alcanzó un pico de 107,815 147.8 IOPS con una latencia de XNUMX µs. El drive se mantuvo en primer lugar.

Después de mucho tiempo en la cima, el H3900 se colocó en segundo lugar detrás del Intel 900p en nuestro inicio de sesión inicial de VDI LC con un pico de 64,107 122 IOPS y una latencia de XNUMX µs.

Finalmente, el H3900 tomó la delantera en VDI LC Monday Login con un pico de 84,739 186.2 IOPS y una latencia de XNUMX µs.

Conclusión

El DapuStor H3900 es un SSD de memoria de clase de almacenamiento (SCM) para la empresa. La unidad aprovecha la tecnología XL-FLASH de KIOXIA, lo que la convierte en parte de la línea Haishen3-XL de DapuStor. Al ser una unidad SCM, está dirigida a los mismos casos de uso asociados con SCM, pero está particularmente dirigida a la caché y aceleración de datos, base de datos en memoria, entrenamiento de IA y Big Data. La unidad viene en factores de forma U.2 y HHHL (estamos viendo la versión U.2). Y al igual que otras unidades SCM, la capacidad es un poco baja, pero se ofrece en 400 GB, 750 GB, 800 GB y 1.6 TB. En cuanto al rendimiento, se dice que la unidad alcanza un ancho de banda de hasta 3.5 GB/3.2 GB, 830 300/20 30 IOPS en cargas de trabajo de baja profundidad de cola con una latencia de lectura de XNUMX μs, con hasta XNUMX DWPD.

En cuanto al rendimiento, ejecutamos nuestro análisis de carga de trabajo de la aplicación (solo Houdini) y las pruebas de VDBench. Para Houdini by SideFX, el H3900 se ubicó cerca de la cima con 2,201.987 segundos. Mejor que las unidades NAND convencionales, pero en el extremo inferior de las unidades SCM.

Para VDBench, la unidad realmente brilló. Los puntos destacados incluyen 835 4 IOPS para lectura en 339 K, 4 3 IOPS para escritura en 64 K, 64 GB/s para lectura en 2.3 K y para escritura en 406 K, la unidad alcanza los 388 GB/s. Con SQL vimos 90 10 IOPS, 378 80 IOPS para SQL 20-100, 355 332 IOPS para SQL 90-10 con una latencia máxima inferior a 328 µs en las tres pruebas. Para Oracle vimos 80 20 IOPS, 100 3900 IOPS para Oracle 232-145, 118 108 IOPS para Oracle 64-85 y nuevamente una latencia máxima inferior a XNUMX µs en las tres pruebas. En nuestras pruebas de clones de VDI, el HXNUMX continuó impresionando y se mantuvo en la cima o cerca de ella. En el arranque de VDI FC, la unidad tenía XNUMX XNUMX IOPS, en el inicio de sesión inicial de VDI FC, la unidad tenía XNUMX XNUMX IOPS, en el inicio de sesión de lunes de VDI FC, XNUMX XNUMX IOPS, en el arranque de VDI LC alcanzó XNUMX XNUMX IOPS, en el inicio de sesión inicial de VDI LC, el pico fue de XNUMX XNUMX IOPS y en el inicio de sesión de VDI LC Monday, la unidad alcanzó aproximadamente XNUMX XNUMX IOPS.

Con Optane siendo el rey reinante durante tanto tiempo en el espacio SCM, es bueno ver a un competidor entrar al campo con una actuación impresionante. Si bien DapuStor no ocupó el primer lugar en Houdini, aunque estuvo cerca, dominó la mayoría de nuestros otros puntos de referencia con una pequeña cantidad de latencia en varios casos. Para las cargas de trabajo que necesitan una latencia extremadamente baja y un gran rendimiento, el DapuStor H3900 es la unidad que está buscando.

DapuStor Haishen3

Interactuar con StorageReview

Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed