Inicio Empresa Revisión de SSD NVMe de la serie Memblaze PBlaze5 920

Revisión de SSD NVMe de la serie Memblaze PBlaze5 920

by Brian Beeler
Memblaze PBlaze5 926

Hemos visto numerosos SSD empresariales de Memblaze a lo largo de los años, a menudo están a la vanguardia en lo que respecta a tecnología y rendimiento. Recientemente, lanzaron un nuevo conjunto de SSD en la familia Memblaze PBlaze5, la serie Memblaze PBlaze5 920. La la Serie 916 antes, la serie PBlaze5 920 viene en factores de forma U.2 y Add-in-Card (AIC). La mayor diferencia con la Serie 920 es que utiliza un nuevo conjunto de NAND, pasando a 96D TLC NAND de 3 capas desde 64 capas en el modelo anterior. En el extremo superior, los nuevos SSD Memblaze ofrecen 5.9 GB/s y 970,000 XNUMX IOPS en el extremo superior del espectro de rendimiento.

Hemos visto numerosos SSD empresariales de Memblaze a lo largo de los años, a menudo están a la vanguardia en lo que respecta a tecnología y rendimiento. Recientemente, lanzaron un nuevo conjunto de SSD en la familia Memblaze PBlaze5, la serie Memblaze PBlaze5 920. La la Serie 916 antes, la serie PBlaze5 920 viene en factores de forma U.2 y Add-in-Card (AIC). La mayor diferencia con la Serie 920 es que utiliza un nuevo conjunto de NAND, pasando a 96D TLC NAND de 3 capas desde 64 capas en el modelo anterior. En el extremo superior, los nuevos SSD Memblaze ofrecen 5.9 GB/s y 970,000 XNUMX IOPS en el extremo superior del espectro de rendimiento.

Memblaze PBlaze5 920 926

La serie 920 viene en dos clasificaciones de resistencia, 1 escritura de disco por día (DWPD) o 3 DWPD. Esto crea cuatro unidades distintas, segmentadas en factor de forma y resistencia. Los factores de forma AIC se designan como C920 y C926, siendo el C920 la unidad más centrada en la lectura y el C926 con esa calificación de resistencia de 3 DWPD. Del mismo modo, las unidades U.2 son la D920 y la D926, que coinciden de la misma manera en cuanto a resistencia. Las unidades de menor resistencia vienen en capacidades de 3.84 TB y 7.68 TB en ambos factores de granja. Del mismo modo, los 3 SSD DWPD vienen en capacidades de 3.2 TB y 6.4 TB en ambas familias. Las unidades anteriores de la serie 916 tenían un modelo de mayor capacidad, que Memblaze ha eliminado esta vez, probablemente debido a la falta de volumen.

Memblaze PBlaze5 920 926 Parte inferior

Memblaze tiene una serie de características clave integradas en estos SSD. Uno de nuestros favoritos es la capacidad de actualizar el firmware de la unidad sin reiniciar. Esto significa que las unidades se pueden actualizar sin tener que reiniciar el servidor. Memblaze también ha agregado lo que ellos llaman "Cuota por espacio de nombres". Las unidades ahora admiten 32 espacios de nombres, cada uno con una clave AES-256 diferente para cifrar datos. Dentro de estos espacios de nombres, las aplicaciones no críticas se pueden limitar para garantizar la QoS de las aplicaciones más importantes. Las unidades también admiten una serie de funciones para garantizar la confiabilidad de los datos, que incluyen; Corrección de errores LDPC, cifrado de datos AES-256 bits, protección de ruta de datos completa, protección de extremo a extremo T10 PI y protección mejorada contra fallas de energía.

Aquí está nuestro video resumen:

Nuestro modelo de revisión es el C6.4 de 926 TB.

Especificaciones de la serie Memblaze Pblaze 920

Modelo D920 C920 D926 C926
Capacidad de usuario (TB) 3.84 7.68 3.84 7.68 3.2 6.4 3.2 6.4
Fácil de usar PCIe 3.0 x 4 PCIe 3.0 x 8 PCIe 3.0 x 4 PCIe 3.0 x 8
Factor de forma U.2.5 de 2 pulgadas HHHL AIC U.2.5 de 2 pulgadas HHHL AIC
Lectura secuencial de 128 KB (GB/s) 3.5 3.5 5.6 5.9 3.5 3.5 5.6 5.9
Escritura secuencial de 128 KB (GB/s) 3.3 3.5 3.3 3.7 3.3 3.5 3.3 3.7
IOPS de lectura aleatoria sostenida (4 KB) 825K 840K 835K 970K 825K 835K 835K 970K
Escritura aleatoria sostenida (4 KB) IOPS (estado estable) 140K 150K 140K 150K 280K 300K 280K 300K
Lectura/escritura de latencia (μs) 90 / 12
Resistencia de por vida 1DWPD 3DWPD
Tasa de error de bit no corregible <10 -17
Tiempo medio entre fallos 2 millón de horas
Protocolo NVMe 1.2a
Memoria Flash NAND NAND 3D eTLC
Sistema operativo RHEL, SLES, CentOS, Ubuntu, Windows Server, VMware ESXi
Consumo de energía 7 ~ 25w
Soporte de funciones básicas Protección contra fallas de energía, conectable en caliente, protección completa de ruta de datos, SMART, administración de energía flexible
Soporte de funciones avanzadas TRIM, espacio de nombres múltiples, cifrado de datos AES 256 y borrado criptográfico, puerto dual y reserva (solo U.2), gestión de tamaño de sector variable EUI64/NGUID y T10 PI (DIF/DIX), actualización de firmware sin reinicio, cuota por espacio de nombres
Soporte técnico Herramienta de gestión de código abierto, herramienta de depuración CLI, controlador integrado del sistema operativo (Fácil integración del sistema)

 Memblaze Pblaze5 C926 Rendimiento

Banco de pruebas

Nuestras revisiones de Enterprise SSD aprovechan un Lenovo ThinkSystem SR850 para pruebas de aplicaciones y un Dell PowerEdge R740xd para benchmarks sintéticos. El ThinkSystem SR850 es una plataforma de CPU cuádruple bien equipada que ofrece una potencia de CPU muy por encima de lo que se necesita para hacer hincapié en el almacenamiento local de alto rendimiento. Las pruebas sintéticas que no requieren muchos recursos de CPU utilizan el servidor de doble procesador más tradicional. En ambos casos, la intención es mostrar el almacenamiento local de la mejor manera posible que se alinee con las especificaciones máximas de la unidad del proveedor de almacenamiento.

Lenovo Think System SR850

  • 4 CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 DRAM ECC de 32 GB DDR4-2666 MHz
  • 2 tarjetas RAID 930-8i 12 Gb/s
  • 8 bahías NVMe
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 4 memorias ECC de 16 GB DDR4-2666 MHz
  • 1 tarjeta RAID PERC 730 de 2 GB y 12 Gb/s
  • Adaptador NVMe adicional
  • Ubuntu-16.04.3-escritorio-amd64

Antecedentes de prueba y comparables

El Laboratorio de pruebas de StorageReview Enterprise proporciona una arquitectura flexible para realizar pruebas comparativas de dispositivos de almacenamiento empresarial en un entorno comparable al que encuentran los administradores en implementaciones reales. El Enterprise Test Lab incorpora una variedad de servidores, redes, acondicionamiento de energía y otra infraestructura de red que permite a nuestro personal establecer condiciones del mundo real para medir con precisión el rendimiento durante nuestras revisiones.

Incorporamos estos detalles sobre el entorno de laboratorio y los protocolos en las revisiones para que los profesionales de TI y los responsables de la adquisición de almacenamiento puedan comprender las condiciones en las que hemos logrado los siguientes resultados. El fabricante del equipo que estamos probando no paga ni supervisa ninguna de nuestras revisiones. Detalles adicionales sobre el Laboratorio de pruebas de StorageReview Enterprise y una descripción general de sus capacidades de red están disponibles en esas respectivas páginas.

Comparables para esta revisión:

Análisis de la carga de trabajo de la aplicación

Para comprender las características de rendimiento de los dispositivos de almacenamiento empresarial, es esencial modelar la infraestructura y las cargas de trabajo de las aplicaciones que se encuentran en los entornos de producción en vivo. Nuestros puntos de referencia para el Memblaze PBlaze5 916 son, por lo tanto, el Rendimiento de MySQL OLTP a través de SysBench y Rendimiento de OLTP de Microsoft SQL Server con una carga de trabajo de TCP-C simulada. Para nuestras cargas de trabajo de aplicaciones, cada unidad ejecutará de 2 a 4 máquinas virtuales configuradas de manera idéntica.

Houdini por SideFX

La prueba de Houdini está diseñada específicamente para evaluar el rendimiento del almacenamiento en relación con la representación CGI. El banco de pruebas para esta aplicación es una variante del tipo de servidor central Dell PowerEdge R740xd que usamos en el laboratorio con dos CPU Intel 6130 y 64 GB de DRAM. En este caso, instalamos Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) ejecutando bare metal. La salida del punto de referencia se mide en segundos para completarse, cuanto menos mejor.

La demostración de Maelstrom representa una sección de la canalización de renderizado que destaca las capacidades de rendimiento del almacenamiento al demostrar su capacidad para usar de manera efectiva el archivo de intercambio como una forma de memoria extendida. La prueba no escribe los datos de los resultados ni procesa los puntos para aislar el efecto de tiempo de pared del impacto de la latencia en el componente de almacenamiento subyacente. La prueba en sí se compone de cinco fases, tres de las cuales ejecutamos como parte del benchmark, que son las siguientes:

  • Carga puntos empaquetados desde el disco. Este es el momento de leer desde el disco. Esto es de un solo subproceso, lo que puede limitar el rendimiento general.
  • Desempaqueta los puntos en una sola matriz plana para permitir que se procesen. Si los puntos no dependen de otros puntos, el conjunto de trabajo podría ajustarse para permanecer en el núcleo. Este paso es de subprocesos múltiples.
  • (No Ejecutar) Procesa los puntos.
  • Los vuelve a empaquetar en bloques divididos en cubos adecuados para volver a almacenarlos en el disco. Este paso es de subprocesos múltiples.
  • (No Ejecutar) Escribe los bloques almacenados nuevamente en el disco.

Aquí, vemos que el Memblaze PBlaze5 C926 aterriza en el tercio inferior de los artistas "medios" con una representación de 2,883 segundos, unos 44 segundos menos que el 916.

Memblaze PBlaze5 920 Houdini

Rendimiento de SQL Server

Cada máquina virtual con SQL Server está configurada con dos discos virtuales: un volumen de 100 GB para el arranque y un volumen de 500 GB para la base de datos y los archivos de registro. Desde la perspectiva de los recursos del sistema, configuramos cada VM con 16 vCPU, 64 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI. Si bien nuestras cargas de trabajo de Sysbench probadas anteriormente saturaron la plataforma tanto en E/S de almacenamiento como en capacidad, la prueba de SQL busca el rendimiento de la latencia.

Esta prueba usa SQL Server 2014 ejecutándose en máquinas virtuales invitadas de Windows Server 2012 R2 y está destacada por Benchmark Factory for Databases de Quest. Reseñas de almacenamiento Protocolo de prueba OLTP de Microsoft SQL Server emplea el borrador actual del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark de procesamiento de transacciones en línea que simula las actividades que se encuentran en entornos de aplicaciones complejos. El punto de referencia TPC-C se acerca más que los puntos de referencia de rendimiento sintéticos para medir las fortalezas de rendimiento y los cuellos de botella de la infraestructura de almacenamiento en entornos de bases de datos. Cada instancia de nuestra VM de SQL Server para esta revisión utiliza una base de datos de SQL Server de 333 GB (escala 1,500) y mide el rendimiento transaccional y la latencia bajo una carga de 15,000 XNUMX usuarios virtuales.

Configuración de prueba de SQL Server (por VM)

  • Windows Server 2012 R2
  • Huella de almacenamiento: 600 GB asignados, 500 GB utilizados
  • SQL Server 2014
    • Tamaño de la base de datos: escala 1,500
    • Carga de clientes virtuales: 15,000
    • Búfer RAM: 48GB
  • Duración de la prueba: 3 horas
    • 2.5 horas de preacondicionamiento
    • Período de muestra de 30 minutos

Para nuestro punto de referencia transaccional de SQL Server, Memblaze PBlaze5 C926 obtuvo una puntuación total de 12,644.2 3,161 TPS con máquinas virtuales individuales que oscilaron entre 3,161.09 y 916 TPS. Esto está justo por debajo del 12,645 que tenía un total de XNUMX TPS.

Memblaze PBlaze5 926 SQL

La latencia promedio hizo que el C926 tuviera 2 ms en todos los ámbitos. De nuevo, ligeramente por debajo de los 916 ms del 1.25.

Rendimiento de Sysbench

El siguiente punto de referencia de la aplicación consiste en un Base de datos OLTP MySQL de Percona medido a través de SysBench. Esta prueba mide el promedio de TPS (transacciones por segundo), la latencia promedio y también la latencia promedio del percentil 99.

Cada banco de sistema La máquina virtual está configurada con tres discos virtuales: uno para arranque (~92 GB), uno con la base de datos preconstruida (~447 GB) y el tercero para la base de datos bajo prueba (270 GB). Desde la perspectiva de los recursos del sistema, configuramos cada máquina virtual con 16 vCPU, 60 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI.

Configuración de prueba de Sysbench (por VM)

  • CentOS 6.3 de 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tablas de base de datos: 100
    • Tamaño de la base de datos: 10,000,000
    • Subprocesos de la base de datos: 32
    • Búfer RAM: 24GB
  • Duración de la prueba: 3 horas
    • 2 horas preacondicionamiento 32 hilos
    • 1 hora 32 hilos

Con el punto de referencia transaccional de Sysbench, el Memblaze PBlaze5 C926 obtuvo una puntuación total de 8,751.6 TPS en comparación con la puntuación total de 916 TPS del 9,298 anterior.

Banco de sistema Memblaze Pblaze5 926

La latencia promedio de Sysbench vio al C926 con una latencia agregada de 14.6 ms frente a los 916 ms del 13.8.

Para nuestra latencia en el peor de los casos (percentil 99), el C926 nos mostró una latencia de 26.4 ms en comparación con la latencia del 916 que fue de 25.2 ms.

Análisis de carga de trabajo de VDBench

Cuando se trata de comparar dispositivos de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no es una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita la comparación de manzanas con manzanas entre las soluciones de la competencia. Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, hasta capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de cargas de trabajo vdBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran clúster de pruebas informáticas. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales. Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie del disco con datos, luego divide una sección del disco equivalente al 25% de la capacidad del disco para simular cómo el disco podría responder a las cargas de trabajo de la aplicación. Esto es diferente a las pruebas de entropía completa que usan el 100% del impulso y lo llevan a un estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más altas.

perfiles:

  • Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
  • Escritura aleatoria 4K: 100 % de escritura, 64 subprocesos, 0-120 % de iorate
  • Lectura secuencial de 64 K: 100 % de lectura, 16 subprocesos, 0-120 % de iorate
  • Escritura secuencial de 64 K: 100 % de escritura, 8 subprocesos, 0-120 % de iorate
  • Base de datos sintética: SQL y Oracle
  • Trazas de clones vinculados y clones completos de VDI

En nuestro primer análisis de carga de trabajo de VDBench, lectura aleatoria de 4K, el Memblaze PBlaze5 C926 AIC funcionó bastante cerca del 916 en todo momento, pero terminó justo detrás con una puntuación máxima de 789,134 159.8 IOPS con una latencia de XNUMX µs.

Memblaze Pblaze5 926 4k leer

Para la escritura aleatoria de 4K nuevamente, el C926 siguió al 916 un poco antes de apagarse y alcanzar un máximo de 558,945 IOPS con una latencia de 226.3 µs.

Al cambiar a cargas de trabajo secuenciales, vemos que el C926 se ejecuta con una latencia más baja y un pico más alto que el 916 en la lectura de 64K. La puntuación máxima para el C926 fue de 61,356 3.83 IOPS o 260 GB/s con una latencia de XNUMX µs.

Memblaze Pblaze5 926 64k leer

Para 64K secuenciales, escriba el C926 nuevamente rastreado con el 916 en su mayor parte antes de alcanzar un pico más alto (a aproximadamente 43K IOPS o 2.7GB / s con una latencia de aproximadamente 200 µs) antes de caer un poco y caer por debajo de la otra unidad.

Nuestro próximo conjunto de pruebas son nuestras cargas de trabajo de SQL: SQL, SQL 90-10 y SQL 80-20. Comenzando con SQL, el Memblaze PBlaze5 C926 comenzó con una latencia un poco más alta y se mantuvo allí hasta alcanzar el segundo pico con 238,861 133.5 IOPS a una latencia de XNUMX µs.

SQL 90-10 pintó una imagen similar con el C926 nuevamente ocupando el segundo lugar después del 916 con un rendimiento máximo de 249,682 IOPS con una latencia de 127.6 µs antes de caer un poco.

Con SQL 80-20, las unidades continuaron la tendencia con el C926 alcanzando el segundo lugar con 250,990 126.7 IOPS con una latencia de XNUMX µs.

Lo siguiente son nuestras cargas de trabajo de Oracle: Oracle, Oracle 90-10 y Oracle 80-20. Comenzando con Oracle, Memblaze PBlaze5 C926 alcanzó el segundo lugar con 268,147 132.2 IOPS con una latencia de XNUMX µs.

Oracle 90-10 nos mostró más de lo anterior, el C926 corrió justo detrás del 916 y alcanzó un máximo de 190,557 114.9 IOPS XNUMX µs.

Con Oracle 80-20, el C926 superó al 916 con 197,016 111 IOPS con una latencia de XNUMX µs.

A continuación, cambiamos a nuestra prueba de clonación de VDI, completa y vinculada. Para VDI Full Clone (FC) Boot, el Memblaze PBlaze5 C926 tuvo un pico de 209,687 165.2 IOPS con una latencia de 916 µs por debajo del XNUMX.

El inicio de sesión inicial de VDI FC vio al C926 superar al 916 y terminar primero con un pico de 157,217 188.2 IOPS con una latencia de XNUMX µs.

Para VDI FC Monday Login, el C926 y el 916 corrieron codo con codo cediendo el liderazgo y recuperándolo antes de que el C926 se adelantara con un pico final de 103,780 152.8 IOPS a una latencia de XNUMX µs.

Para VDI Linked Clone (LC) Boot, el C926 retrocedió a su lugar familiar de segundo con un puntaje máximo de 96,226 IOPS con una latencia de 165.7µs.

El inicio de sesión inicial de VDI LC mostró lo mismo que la prueba de FC anterior, el C926 se adelantó para ocupar el primer lugar con una puntuación máxima de 55,977 141 IOPS a una latencia de XNUMX µs.

Finalmente, con VDI LC Monday Login, el C926 una vez más apenas se impuso con 80,393 196.6 IOPS con una latencia de XNUMX µs.

Conclusión

Memblaze amplió la línea PBlaze5 con la introducción de la Serie 920. La principal diferencia en la nueva línea de unidades es que la NAND pasa de 64 capas a 96 capas. La nueva serie se divide en dos tipos por DWPD, ya sea 1 o 3. Se subdivide además por factor de forma y capacidad. Para esta revisión en particular, analizamos el factor de forma Memblaze PBlaze5 C926 HHHL AIC destinado a aquellos que necesitan un mayor rendimiento y un almacenamiento de mayor resistencia.

En cuanto al rendimiento, comparamos la unidad con otra SSD AIC de Membalze, la Memblaze PBlaze5 916 AIC. Mientras que normalmente se espera que la unidad más nueva funcione mejor, especialmente con una empresa como Memblaze. Sin embargo, el 916 anterior superó al C926 en casi todas las categorías. No pero mucho, pero tiró adelante. Para el análisis de la carga de trabajo de la aplicación, vimos que el C926 alcanzó los 2,644.2 TPS con una latencia promedio de 2 ms en SQL Server. Justo debajo del 916 en ambos casos. Para Sysbench, la unidad alcanzó 8,751.6 TPS, una latencia media de 14.6 ms y una latencia en el peor de los casos de 26.4 ms, una vez más por detrás del 916 en cada prueba.

Nuestra prueba VDbench fue más o menos similar a la anterior. En la mayoría de los casos, pero no en todos, el C926 más nuevo quedó ligeramente por detrás del 916. Los puntos destacados incluyen: 789 4 IOPS en lectura 559K, 4 3.83 IOPS en escritura 64K, 2.7 GB/s en lectura 64 K y 239 ​​GB/s en escritura 250 K donde venció a la unidad anterior. Las cargas de trabajo de SQL registraron 90 10 IOPS, 251 80 IOPS para SQL 20-916 y 268 191 IOPS en SQL 90-10, en segundo lugar después de 197 cada vez. Se observó la misma ubicación cercana en las cargas de trabajo de Oracle con 80 20 IOPS, XNUMX XNUMX IOPS en Oracle XNUMX-XNUMX y XNUMX XNUMX IOPS en Oracle XNUMX-XNUMX. En nuestras pruebas de clonación de VDI, la unidad más nueva pudo vencer a la unidad anterior en el inicio de sesión inicial y el lunes en las pruebas de clonación completa y vinculada.

Si bien está detrás de una unidad anterior en la serie PBlaze 5, la nueva serie Memblaze PBlaze5 920 aún presenta buenos números. El modelo de tarjeta perimetral funciona bien en plataformas de servidor heredadas sin bahías NVMe de 2.5″ o servidores que necesitan el ancho de banda adicional de una sola unidad que las SSD U.2 PCIe Gen3 no pueden igualar. En general, Memblaze continúa lanzando SSD empresariales de calidad que están diseñados para satisfacer las necesidades del mercado principal.

Página del producto Memblaze

Discutir en Reddit

Interactuar con StorageReview

Boletín informativo | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed