Durante su evento Step Ahead en Beijing, Memblaze lanzó una nueva serie de unidades 500 NVME, así como una expansión de su línea 900 a 910 y 916. Analizaremos la serie 910 en esta revisión. Las nuevas unidades 910 se ofrecen en dos factores de forma y aprovechan 64D NAND de 3 capas, lo que permite que las unidades tengan capacidades de hasta 16 TB. Esta densidad más alta puede generar racks más densos o consolidación de racks en el centro de datos.
Durante su evento Step Ahead en Beijing, Memblaze lanzó una nueva serie de unidades 500 NVME, así como una expansión de su línea 900 a 910 y 916. Analizaremos la serie 910 en esta revisión. Las nuevas unidades 910 se ofrecen en dos factores de forma y aprovechan 64D NAND de 3 capas, lo que permite que las unidades tengan capacidades de hasta 16 TB. Esta densidad más alta puede generar racks más densos o consolidación de racks en el centro de datos.
Además de aprovechar 64 capas para alcanzar mayores capacidades, el Memblaze PBlaze5 910 reclama un rendimiento superior al de los modelos anteriores. La compañía afirma que la unidad puede alcanzar lecturas secuenciales de hasta 3.5 GB/s y un rendimiento de hasta 835 910 IOPS, todo ello con una latencia de menos de un milisegundo. La unidad también viene con alta disponibilidad incorporada, siendo de doble puerto, por lo que se elimina una única ruta de falla. El 1 tiene XNUMX DWPD de resistencia, así como dos millones de horas MTBF. Los casos de uso ideales incluyen: base de datos, búsqueda, indexación, CDN, nube e hiperescala, SDS, aprendizaje profundo y análisis de big data, ERP, SAP HANA, BOSS, banca, impuestos, comercio de alta frecuencia y pago en línea.
Para esta revisión, analizaremos los 3.84 TB, U.2 del PBlaze5 910.
Memblaze PBlaze5 910 NVMe SSD Especificaciones
Factor de forma | U.2 | ||
Capacidad | 3.84TB | 7.68TB | 15.36TB |
NAND | ETLC 3D | ||
Fácil de usar | PCIe 3.0 x 4 | ||
Protocolo | NVMe 1.2a | ||
Performance | |||
Lectura secuencial (128 KB) | 3.5GB / s | 3.5GB / s | 3.3GB / s |
Escritura secuencial (128 KB) | 3.1GB / s | 3.5GB / s | 3.3GB / s |
Lectura aleatoria sostenida (4KB) | 835K IOPS | 830K IOPS | 826K IOPS |
Escritura aleatoria sostenida (4KB) | 99K IOPS | 135K IOPS | 150K IOPS |
Latencia L/E | 87 / 12μs | ||
DWPD | 1 | ||
UBER | <10^-17 | ||
MTBF | 2 millón de horas | ||
Consumo de energía | 7 ~ 25W |
Performance
Banco de pruebas
Nuestras revisiones de Enterprise SSD aprovechan un Lenovo ThinkSystem SR850 para pruebas de aplicaciones y un Dell PowerEdge R740xd para benchmarks sintéticos. El ThinkSystem SR850 es una plataforma de CPU cuádruple bien equipada que ofrece una potencia de CPU muy por encima de lo que se necesita para hacer hincapié en el almacenamiento local de alto rendimiento. Las pruebas sintéticas que no requieren muchos recursos de CPU utilizan el servidor de doble procesador más tradicional. En ambos casos, la intención es mostrar el almacenamiento local de la mejor manera posible que se alinee con las especificaciones máximas de la unidad del proveedor de almacenamiento.
Lenovo Think System SR850
- 4 CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
- 16 DRAM ECC de 32 GB DDR4-2666 MHz
- 2 tarjetas RAID 930-8i 12 Gb/s
- 8 bahías NVMe
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
- 16 memorias ECC de 16 GB DDR4-2666 MHz
- 1 tarjeta RAID PERC 730 de 2 GB y 12 Gb/s
- Adaptador NVMe adicional
- Ubuntu-16.04.3-escritorio-amd64
Antecedentes de prueba y comparables
Los Laboratorio de pruebas de StorageReview Enterprise proporciona una arquitectura flexible para realizar pruebas comparativas de dispositivos de almacenamiento empresarial en un entorno comparable al que encuentran los administradores en implementaciones reales. El Enterprise Test Lab incorpora una variedad de servidores, redes, acondicionamiento de energía y otra infraestructura de red que permite a nuestro personal establecer condiciones del mundo real para medir con precisión el rendimiento durante nuestras revisiones.
Incorporamos estos detalles sobre el entorno de laboratorio y los protocolos en las revisiones para que los profesionales de TI y los responsables de la adquisición de almacenamiento puedan comprender las condiciones en las que hemos logrado los siguientes resultados. El fabricante del equipo que estamos probando no paga ni supervisa ninguna de nuestras revisiones. Detalles adicionales sobre el Laboratorio de pruebas de StorageReview Enterprise y una descripción general de sus capacidades de red están disponibles en esas respectivas páginas.
Comparables para esta revisión:
- Memblaze PBlaze5 3.2TB
- Memblaze PBlaze4 3.2TB
- Intel P3700 2 TB
- Intel P4500 2 TB
- HGST SN100 3.2TB
- Toshiba PX04 1.6TB
Análisis de la carga de trabajo de la aplicación
Para comprender las características de rendimiento de los dispositivos de almacenamiento empresarial, es esencial modelar la infraestructura y las cargas de trabajo de las aplicaciones que se encuentran en los entornos de producción en vivo. Nuestros puntos de referencia para el Memblaze PBlaze5 910 son, por lo tanto, el Rendimiento de MySQL OLTP a través de SysBench y Rendimiento de OLTP de Microsoft SQL Server con una carga de trabajo de TCP-C simulada. Para nuestras cargas de trabajo de aplicaciones, cada unidad ejecutará de 2 a 4 máquinas virtuales configuradas de manera idéntica.
Rendimiento de SQL Server
Cada máquina virtual con SQL Server está configurada con dos discos virtuales: un volumen de 100 GB para el arranque y un volumen de 500 GB para la base de datos y los archivos de registro. Desde la perspectiva de los recursos del sistema, configuramos cada VM con 16 vCPU, 64 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI. Si bien nuestras cargas de trabajo de Sysbench probadas anteriormente saturaron la plataforma tanto en E/S de almacenamiento como en capacidad, la prueba de SQL busca el rendimiento de la latencia.
Esta prueba utiliza SQL Server 2014 ejecutándose en máquinas virtuales invitadas de Windows Server 2012 R2 y está destacada por Benchmark Factory for Databases de Quest. Reseñas de almacenamiento Protocolo de prueba OLTP de Microsoft SQL Server emplea el borrador actual del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark de procesamiento de transacciones en línea que simula las actividades que se encuentran en entornos de aplicaciones complejos. El punto de referencia TPC-C se acerca más que los puntos de referencia de rendimiento sintéticos para medir las fortalezas de rendimiento y los cuellos de botella de la infraestructura de almacenamiento en entornos de bases de datos. Cada instancia de nuestra VM de SQL Server para esta revisión utiliza una base de datos de SQL Server de 333 GB (escala 1,500) y mide el rendimiento transaccional y la latencia bajo una carga de 15,000 XNUMX usuarios virtuales.
Configuración de prueba de SQL Server (por VM)
- Windows Server 2012 R2
- Huella de almacenamiento: 600 GB asignados, 500 GB utilizados
- SQL Server 2014
- Tamaño de la base de datos: escala 1,500
- Carga de clientes virtuales: 15,000
- Búfer RAM: 48GB
- Duración de la prueba: 3 horas
- 2.5 horas de preacondicionamiento
- Período de muestra de 30 minutos
Para nuestro punto de referencia transaccional de SQL Server, Memblaze PBlaze5 910 U.2 se ubicó en la parte inferior del paquete con 12,546.5 TPS, menos que otras tres unidades PBlaze.
Sorprendentemente, el 910 también tuvo la latencia más alta con 38.8 ms.
Rendimiento de Sysbench
El siguiente punto de referencia de la aplicación consiste en un Base de datos OLTP MySQL de Percona medido a través de SysBench. Esta prueba mide el promedio de TPS (transacciones por segundo), la latencia promedio y también la latencia promedio del percentil 99.
Cada banco de sistema La máquina virtual está configurada con tres discos virtuales: uno para arranque (~92 GB), uno con la base de datos preconstruida (~447 GB) y el tercero para la base de datos bajo prueba (270 GB). Desde la perspectiva de los recursos del sistema, configuramos cada VM con 16 vCPU, 60 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI.
Configuración de prueba de Sysbench (por VM)
- CentOS 6.3 de 64 bits
- Percona XtraDB 5.5.30-rel30.1
- Tablas de base de datos: 100
- Tamaño de la base de datos: 10,000,000
- Subprocesos de la base de datos: 32
- Búfer RAM: 24GB
- Duración de la prueba: 3 horas
- 2 horas preacondicionamiento 32 hilos
- 1 hora 32 hilos
Con el punto de referencia transaccional de Sysbench, el U.2 910 lo hizo mejor alcanzando 6,664.6 TPS aterrizando en el medio del paquete probado.
Con la latencia promedio de Sysbench, el U.2 910 nuevamente se encontró en el medio del grupo con una latencia de 19.2ms.
Nuestro punto de referencia de latencia del peor de los casos vio que el U.2 910 aterrizaba nuevamente cerca del medio con 37.8ms.
Houdini por SideFX
La prueba de Houdini está diseñada específicamente para evaluar el rendimiento del almacenamiento en relación con la representación CGI. El banco de pruebas para esta aplicación es una variante del núcleo Dell PowerEdge R740xd tipo de servidor que usamos en el laboratorio con dos CPU Intel 6130 y 64 GB de DRAM. En este caso, instalamos Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) ejecutando bare metal. La salida del punto de referencia se mide en segundos para completarse, cuanto menos mejor.
La demostración de Maelstrom representa una sección de la canalización de renderizado que destaca las capacidades de rendimiento del almacenamiento al demostrar su capacidad para usar de manera efectiva el archivo de intercambio como una forma de memoria extendida. La prueba no escribe los datos de los resultados ni procesa los puntos para aislar el efecto de tiempo de pared del impacto de la latencia en el componente de almacenamiento subyacente. La prueba en sí se compone de cinco fases, tres de las cuales ejecutamos como parte del benchmark, que son las siguientes:
- Carga puntos empaquetados desde el disco. Este es el momento de leer desde el disco. Esto es de un solo subproceso, lo que puede limitar el rendimiento general.
- Desempaqueta los puntos en una sola matriz plana para permitir que se procesen. Si los puntos no dependen de otros puntos, el conjunto de trabajo podría ajustarse para permanecer en el núcleo. Este paso es de subprocesos múltiples.
- (No Ejecutar) Procesar los puntos.
- Los vuelve a empaquetar en bloques divididos en cubos adecuados para volver a almacenarlos en el disco. Este paso es de subprocesos múltiples.
- (No ejecutar) Vuelva a escribir los bloques en cubos en el disco.
Con la prueba de Houdini, el 910 U.2 se ubicó en el extremo medio e inferior, pero justo en línea con otros productos Memblaze con una puntuación de 3,093.8 segundos.
Análisis de carga de trabajo de VDBench
Cuando se trata de comparar dispositivos de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no es una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita la comparación de manzanas con manzanas entre las soluciones de la competencia. Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, hasta capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de cargas de trabajo vdBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran clúster de pruebas informáticas. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales. Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie del disco con datos, luego divide una sección del disco equivalente al 25% de la capacidad del disco para simular cómo el disco podría responder a las cargas de trabajo de la aplicación. Esto es diferente a las pruebas de entropía completa que usan el 100% del impulso y lo llevan al estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más altas.
perfiles:
- Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
- Escritura aleatoria 4K: 100 % de escritura, 64 subprocesos, 0-120 % de iorate
- Lectura secuencial de 64 K: 100 % de lectura, 16 subprocesos, 0-120 % de iorate
- Escritura secuencial de 64 K: 100 % de escritura, 8 subprocesos, 0-120 % de iorate
- Base de datos sintética: SQL y Oracle
- Trazas de clones vinculados y clones completos de VDI
En nuestro primer análisis de carga de trabajo de VDBench, Random 4K Read, el Memblaze PBlaze5 910 U.2 pudo permanecer por debajo de 1 ms en todo momento con un pico de 665,679 191.3 IOPS y una latencia de XNUMX μs, lo que colocó a la unidad aproximadamente en el medio.
La escritura aleatoria de 4K nuevamente vio una latencia de submilisegundos en todo momento. El 910 U.2 ocupó el penúltimo lugar con un rendimiento máximo de 296,639 429.6 IOPS y una latencia de XNUMX μs.
Cambiando a cargas de trabajo secuenciales, el 910 U.2 una vez más se ubicó penúltimo en lecturas secuenciales de 64K con un puntaje máximo de 38,472 IOPS o 2.4GB/s con una latencia de 415.3μs.
Manteniéndose en el penúltimo lugar, el 910 U.2 alcanzó su punto máximo con alrededor de 18 1.1 IOPS o 870 GB/s con una latencia de aproximadamente 64 μs en la escritura secuencial de XNUMX XNUMX.
Pasando a las cargas de trabajo de SQL, el 910 U.2 alcanzó un máximo de 243,228 130.4 IOPS con solo XNUMX μs de latencia, lo que coloca a la unidad en cuarto lugar en general.
SQL 90-10 vio al 910 retener el cuarto lugar con un puntaje máximo de 232,061 IOPS y una latencia de 136.5 μs.
Todavía en cuarto lugar, el 910 U.2 alcanzó un máximo de 220,195 144.6 IOPS con una latencia de 80 μs en el punto de referencia SQL 20-XNUMX.
Con nuestra carga de trabajo de Oracle, el 910 U.2 continuó ocupando el cuarto lugar con una puntuación máxima de 212,052 168.5 IOPS y una latencia de XNUMX μs.
Para Oracle 90-10, el 910 U.2 ocupó el tercer lugar con un pico de 180,723 121.1 IOPS y una latencia de XNUMX μs.
En Oracle 80-20, el 910 casi empató con el 900 en el tercer puesto con un rendimiento máximo de 177,143 123.5 IOPS y una latencia de XNUMX μs.
A continuación, pasamos a nuestra prueba de clonación de VDI, completa y vinculada. Para VDI Full Clone Boot, el 910 U.2 quedó en cuarto lugar con un rendimiento máximo de 176,239 197.9 IOPS y una latencia de XNUMX μs.
El inicio de sesión inicial de VDI FC vio al 910 U.2 en el cuarto lugar, pero aún más lejos de las tres unidades principales, con un rendimiento máximo de 66,925 445.1 IOPS y una latencia de XNUMX μs.
Con VDI FC Monday Login, el 910 U.2 terminó en cuarto lugar con 67,309 235.7 IOPS y una latencia de XNUMX μs.
Al cambiar a Linked Clone (LC), primero observamos la prueba de arranque. Aquí, el 910 U.2 ocupó el cuarto lugar con 83,210 191.2 IOPS y una latencia de XNUMX μs.
El inicio de sesión inicial de VDI LC hizo que el 910 U.2 se mantuviera estable en el cuarto lugar con 40,035 197.4 IOPS y una latencia de XNUMX μs.
Finalmente, VDI LC Monday Login tuvo el pico 910 U.2 en 45,349 IOPS y una latencia de 349 μs para el cuarto lugar nuevamente.
Conclusión
Memblaze PBlaze5 910 es la nueva unidad de centro de datos NVMe de la compañía que aprovecha la NAND 64D de 3 capas. La unidad viene en dos factores de forma (U.2 para esta revisión) y en capacidades de 3.84 TB, 7.68 TB y 15.36 TB. Memblaze afirma un rendimiento de hasta 3.5 GB/s de lectura, 3.5 GB/s de escritura y un rendimiento de hasta 835 150 IOPS de lectura y 256 8 IOPS de escritura. La unidad cumple con los criterios para una gran cantidad de casos de uso y viene con opciones de seguridad como el cifrado de datos AES XNUMX y admite la función TRIM de hasta XNUMX TB/s.
En cuanto al rendimiento del análisis de la carga de trabajo de la aplicación, el 910 U.2 ocupó el último lugar en nuestras pruebas comparativas de SQL Server con 12,546.5 38.8 TPS y una latencia promedio de 6,664.6 ms. En Sysbench, la unidad aterrizó un poco mejor en el medio del grupo con 19.2 TPS, una latencia media de 37.8 ms y una latencia en el peor de los casos de 910 ms. En nuestro punto de referencia de Houdini by SideFX, el 2 U.3,093.8 obtuvo una puntuación de XNUMX segundos, lo que lo coloca en el extremo inferior del campo pero en línea con otros productos Memblaze.
Para VDBench, el Memblaze PBlaze5 910 U.2 tuvo una latencia inferior al milisegundo en todas las pruebas. El impulso tendió a caer en la mitad o en la mitad de la parte inferior del paquete en todas las pruebas. Los resultados clave incluyen 666 4 IOPS en lectura 297K, 4 2.4 IOPS en escritura 64K, 1.1 GB/s en lectura 64 K y 177 GB/s en escritura 212 K. Los resultados de SQL mantuvieron alrededor de un cuarto de millón de IOPS con las pruebas de Oracle funcionando entre XNUMX XNUMX IOPS y XNUMX XNUMX IOPS.
En general, dio un buen rendimiento, pero el rendimiento comenzó a disminuir en comparación con la generación anterior PBlaze5 900.
Suscríbase al boletín de StorageReview