Inicio Empresa Avanzando en el almacenamiento de alto rendimiento: DapuStor Haishen5 H5100 E3.S SSD

Avanzando en el almacenamiento de alto rendimiento: DapuStor Haishen5 H5100 E3.S SSD

by Brian Beeler

Los SSD de alto rendimiento como el DapuStore Haishen5 H5100 son cruciales para aplicaciones avanzadas como AI y HPC.

Los datos son más valiosos que nunca, por lo que la necesidad de soluciones de almacenamiento de alto rendimiento, confiables y energéticamente eficientes es fundamental. El SSD DapuStor Haishen5 H5100 E3.S aborda estas necesidades con tecnología avanzada e ingeniería bien pensada. Pusimos a trabajar 16 de los H5100 para ver qué tan rápidos y capaces son estos modernos SSD Gen5.

DapuStor Haishen5 H5100 E3.S SSD

El H5100 representa un importante avance en el rendimiento del almacenamiento, basándose en la base de los SSD Gen4 de DapuStor. Aprovechando el último controlador empresarial Marvell Bravera PCIe Gen5, KIOXIA BiCS8 3D TLC NAND y el firmware DapuStor personalizado, esta unidad ofrece el doble de rendimiento en comparación con sus contrapartes Gen4. Con velocidades de lectura secuencial de hasta 14,000 MB/s y velocidades de escritura de hasta 9,500 MB/s, el Haishen5 H5100 reduce drásticamente los tiempos de acceso a los datos y la latencia, algo fundamental para cargas de trabajo modernas como las de IA y HPC.

DapuStor Haishen5 H5100 E3.S SSD - Par

DapuStor Haishen5 H5100 E3.S SSD

Las IOPS de lectura y escritura aleatorias alcanzan hasta 2.8 millones y 380 mil, respectivamente, mientras que las latencias de lectura aleatoria 4K son inferiores a 54 microsegundos y las latencias de escritura son inferiores a 8 microsegundos. Estas mejoras de rendimiento se traducen en un procesamiento de datos más rápido, una mejor capacidad de respuesta del sistema y la capacidad de manejar cargas de trabajo más intensivas, lo que lo convierte en una opción ideal para aplicaciones que exigen transferencia de datos de alta velocidad y eficiencia de almacenamiento.

Los centros de datos y los hiperescaladores modernos enfrentan más que solo desafíos de rendimiento. La eficiencia energética es cada vez más crítica. El controlador KIOXIA BiCS8 3D NAND y Marvell Bravera SC5 se combinan para ofrecer alta capacidad y eficiencia energética. La tecnología de apilamiento vertical del BiCS8 permite hasta 32 TB con un consumo de energía reducido. Por el contrario, la administración dinámica de energía y el procesamiento de datos eficiente del Bravera SC5 garantizan un rendimiento máximo y un uso mínimo de energía, lo que lo hace ideal para aplicaciones empresariales exigentes.

La flexibilidad en el diseño también es fundamental. A medida que los nuevos servidores migran de U.2 a E3.S y a los hiperescaladores, incluso NVIDIA tiene varias aplicaciones para E1.S, los proveedores de SSD deben admitir una variedad más amplia de factores de forma. Con el H5100, es esencial tener en cuenta que DapuStor admite el factor de forma U.2 heredado en Gen5. También admiten unidades de capacidad de 3.84 TB y 7.68 TB en los factores de forma E3.S y E1.S EDFFF con varios beneficios de densidad y eficiencia en comparación con las unidades U.2.

Otro aspecto interesante del DapuStor H5100 es el diseño del firmware. Controlar su firmware facilita que DapuStor integre la forma en que interactúan todos los componentes de la unidad. Este beneficio se manifiesta de muchas maneras, desde una QoS más estricta hasta la compatibilidad con funciones avanzadas como la ubicación flexible de datos (FDP). DapuStor personalizará el firmware de una unidad para casos de uso específicos en caso de que un cliente tenga requisitos fuera del marco estándar. Las funciones personalizables incluyen ajustes de firmware, configuraciones de seguridad, ajuste del rendimiento y configuraciones de administración de energía.

El SSD H5100 incorpora funciones avanzadas de calidad de servicio (QoS) para garantizar un rendimiento constante y la integridad de los datos en diversas cargas de trabajo. Estas características de QoS permiten que la unidad administre y priorice las operaciones de E/S de manera efectiva, manteniendo una baja latencia y un alto rendimiento incluso en condiciones exigentes.

La tecnología FDP del DapuStor H5100 optimiza la gestión de datos dentro del disco. Al permitir que los datos se escriban en diferentes espacios físicos, FDP mejora el rendimiento, la resistencia y la eficiencia general del almacenamiento. Esta característica avanzada ayuda a reducir la amplificación de escritura y mejora la capacidad de la unidad para manejar cargas de trabajo mixtas de manera efectiva. Si bien en este momento solo se ve en el mundo del hiperescalador, FDP está ganando un gran impulso dentro de OCP y, gracias a los beneficios de resistencia inherentes que proporciona FDP, no pasará mucho tiempo antes de que más aplicaciones convencionales lo aprovechen.

Especificaciones del SSD DapuStor Haishen5 H5100

Especificaciones 3.84 TB (E3.S) 7.68 TB (E3.S) 3.84 TB (U.2 15 mm) 7.68 TB (U.2 15 mm) 15.36 TB (U.2 15 mm) 30.72 B (U.2 15 mm) 3.84 TB (E1.S) 7.68 TB (E1.S)
Fácil de usar
PCIe 5.0x4, NVMe 2.0
Ancho de banda de lectura (128 KB) MB/s 14000 14000 14000 14000 14000 14000 14000 14000
Ancho de banda de escritura (128 KB) MB/s 6300 8800 6300 8800 9500 9500 4800 5000
Lectura aleatoria (4KB) KIOPS 2800 2800 2800 2800 2800 2800 2800 2800
Escritura aleatoria (4KB) KIOPS 300 380 300 380 380 380 200 200
Latencia aleatoria 4K (típ.) RW µs 57/8 54/8 56/8 54/8 54/8 54/8 57/8 54/8
Latencia secuencial 4K (típ.) RW µs
Latencia de lectura 7 µs/Latencia de escritura 8 µs
Potencia típica (W) 18 18 18 19 19 19 17.5 17.5
Potencia inactiva (W) 7 7 7 5 5 5 7 7
Tipo de flash
Flash 3D eTLC NAND
Trabajadora
1
MTBF
2.5 millón de horas
UBER
1 sector por 10^17 bits leídos
Garantía
5 años

Resultados de desempeño

Para comprender mejor qué tan bien funcionan los SSD DapuStor Haishen5 H5100 E3.S, probamos 16 unidades de 7.68 TB en un servidor de almacenamiento Supermicro. Supermicro Storage A+ ASG-1115S-NE316R es un servidor de montaje en rack 1U de alto rendimiento para aplicaciones con uso intensivo de datos. Admite 16 unidades NVMe E3.S intercambiables en caliente, lo que lo convierte en un banco de pruebas ideal para estos SSD. Este servidor funciona con una única CPU AMD EPYC 9634 de 84 núcleos y 384 GB de memoria DDR5 ECC.

Usamos la solución Graid para agregar los SSD DapuStor. Las descargas graduales escriben el trabajo de cálculo de paridad en una GPU, liberando recursos del sistema para otros procesos. Para las plataformas PCIe Gen4/5, Graid utiliza actualmente la GPU NVIDIA A2000. La tarjeta estándar de doble ancho con un enfriador de aire activo en la mayoría de las plataformas será suficiente. Sin embargo, en esta plataforma Supermicro 1U con dos ranuras de ancho único, Graid tiene una solución. Tienen una versión modificada de la NVIDIA A2000 con un refrigerador pasivo delgado, lo que permite su uso en plataformas de servidores con flujo de aire pero sin espacio para algo similar a una GPU más gruesa.

Con Graid implementado, agregamos el almacenamiento en un gran grupo RAID5, combinando 16 de los SSD DapuStor Haishen7.68 H5 E5100.S de 3 TB para crear un volumen de 105 TB. El tamaño de banda predeterminado de Graid para volúmenes es 4 KB. Si bien el rendimiento flash JBOD puede proporcionar un mayor rendimiento, existe el riesgo de pérdida total de datos si falla algún SSD. Una solución RAID protege contra ese evento de pérdida de unidad y es una mejor opción para este escenario de prueba.

Con 16 SSD DapuStor Haishen5 H5100 PCIe Gen5 en un gran grupo HW RAID5 Graid, comenzamos con pruebas de ancho de banda máximo y E/S máximas. Esta es una consideración importante para los clientes. La protección de paridad es crucial para evitar la pérdida de datos en caso de falla de la unidad. Sin embargo, es esencial evitar introducir demasiada sobrecarga que pueda limitar el rendimiento del sistema.

Al observar el ancho de banda de lectura máximo centrándonos en un tamaño de transferencia de datos de 1 MB, fuimos testigos de unos increíbles 205 GB/s de este grupo RAID. Eso equivale a 12.8 GB/s por unidad para el grupo RAID16 de 5 unidades. En escritura secuencial, medimos 105 GB/s totales o 6.6 GB/s por SSD. Estos se acercan a los números de la hoja de especificaciones para los SSD de 14 GB/s de lectura y 8.8 GB/s de escritura.

We mira las velocidades de transferencia aleatoria de 4K para medir el rendimiento máximo. La lectura aleatoria de 4K alcanzó un máximo de 18.1 millones de IOPS y 74.3 GB/s, mientras que la escritura aleatoria de 4K fue de 1.873 millones de IOPS y 7.7 GB/s.

Rendimiento máximo y ancho de banda
Rendimiento RAID DapuStor de 7.68 TB x 16 HW Ancho de banda RAID DapuStor de 7.68 TB x 16 HW Latencia RAID DapuStor de 7.68 TB x 16 HW
Lectura secuencial de 1 MB (84T/16Q) 129k IOPS 205GB / s 6.9ms
Escritura secuencial de 1 MB (84T/16Q) 100k IOPS 105GB / s 13.4ms
Lectura aleatoria 4K (84T/32Q) 12.8 millón de IOPS 52.4GB / s 0.21ms
Lectura aleatoria 4K (84T/256Q) 18.1 millón de IOPS 74.3GB / s 1.184ms
Escritura aleatoria 4K (84T/32Q) 1.873 millón de IOPS 7.7GB / s 0.717ms

Si bien las pruebas estáticas de lectura o escritura son importantes al medir el ancho de banda o el rendimiento máximo, el rendimiento mixto de E/S en una amplia gama de tamaños de bloques muestra cómo se desempeña el almacenamiento en casos de uso más tradicionales.

Comenzamos con un tamaño de bloque de 4K, que oscila entre el 70% y el 90% de porcentaje de lectura. Con una carga de trabajo aleatoria de 70 % de lectura y 30 % de escritura aplicada al grupo RAID de SSD DapuStor Haishen5 H5100 16, medimos un rendimiento de 4.173 M IOPS y 17.1 GB/s. Esto mientras se mantiene una latencia promedio de solo 0.644 ms. Al aumentar la combinación de lectura al 80 %, el rendimiento aumentó a 5.762 M IOPS y 23.6 GB/s. Con una combinación de lectura del 90 %, el rendimiento continuó aumentando hasta 7.36 millones de IOPS y 30.1 GB/s.

Rendimiento y ancho de banda aleatorios mixtos de 4K
Rendimiento RAID DapuStor de 7.68 TB x 16 HW Ancho de banda RAID DapuStor de 7.68 TB x 16 HW Latencia RAID DapuStor de 7.68 TB x 16 HW
4K aleatorio 70/30 (84T/32Q) 4.173 millón de IOPS 17.1GB / s 0.644ms
4K aleatorio 80/20 (84T/32Q) 5.762 millón de IOPS 23.6GB / s 0.466ms
4K aleatorio 90/10 (84T/32Q) 7.360 millón de IOPS 30.1GB / s 0.365ms

Al aumentar el tamaño del bloque a 8K, nos acercamos a las cargas de trabajo tradicionales de bases de datos y OLTP. Aquí, el grupo 16 Gen5 SSD HW RAID continuó impresionándonos con su increíble rendimiento. Con una combinación de lectura del 70 %, medimos 2.956 M IOPS o 24.3 GB/s. Con una combinación de lectura del 80 %, el rendimiento aumentó a 4.024 M IOPS y el ancho de banda aumentó a 33 GB/s. Con una mezcla de lectura del 90%, medimos unos sólidos 5.939 millones de IOPS a 48.7 GB/s, con una latencia promedio de solo 0.452 ms.

Rendimiento y ancho de banda aleatorios mixtos de 8K
Rendimiento RAID DapuStor de 7.68 TB x 16 HW Ancho de banda RAID DapuStor de 7.68 TB x 16 HW Latencia RAID DapuStor de 7.68 TB x 16 HW
8K aleatorio 70/30 (84T/32Q) 2.956 millón de IOPS 24.3GB / s 0.909ms
8K aleatorio 80/20 (84T/32Q) 4.024 millón de IOPS 33GB / s 0.668ms
8K aleatorio 90/10 (84T/32Q) 5.939 millón de IOPS 48.7GB / s 0.452ms

El tamaño de bloque de 16K obtuvo los mejores resultados en nuestras pruebas de carga de trabajo aleatorias. Con el HW RAID acelerado por GPU reuniendo los 16 SSD H5100 Gen5 en RAID5, podríamos aumentar el ancho de banda utilizable de la plataforma. Comenzando con una combinación de lectura del 70 %, medimos 1.938 M IOPS y 31.7 GB/s. Con una lectura del 80 %, eso aumentó a 2.484 millones de IOPS y 40.6 GB/s, acercándose a solo 1 ms de latencia promedio. En el pico de lectura del 90%, el arreglo de almacenamiento pudo medir 3.63 M de IOPS y 59.4 GB/s de ancho de banda total, una cifra increíble considerando que se trata de E/S aleatorias que llegan al arreglo.

Rendimiento y ancho de banda aleatorios mixtos de 16K
Rendimiento RAID DapuStor de 7.68 TB x 16 HW Ancho de banda RAID DapuStor de 7.68 TB x 16 HW Latencia RAID DapuStor de 7.68 TB x 16 HW
16K aleatorio 70/30 (84T/32Q) 1.938 millón de IOPS 31.7GB / s 1.386ms
16K aleatorio 80/20 (84T/32Q) 2.484 millón de IOPS 40.6GB / s 1.082ms
16K aleatorio 90/10 (84T/32Q) 3.630 millón de IOPS 59.4GB / s 0.740ms

Conclusión

Los SSD de alto rendimiento como el DapuStore Haishen5 H5100 son cruciales para aplicaciones avanzadas. En inteligencia artificial y aprendizaje automático, estos SSD aceleran el procesamiento de datos, lo que permite un entrenamiento de modelos más rápido y análisis en tiempo real. Para el análisis de big data, garantizan una rápida recuperación y análisis de datos, lo que respalda decisiones comerciales informadas. En el comercio de alta frecuencia, proporcionan la baja latencia y las transacciones de alta velocidad necesarias. Además, Haishen5 H5100 E3.S ofrece acceso a datos rápido y consistente para virtualización y computación en la nube, lo cual es vital para mantener entornos virtualizados eficientes y confiables. Prácticamente todos los casos de uso pueden beneficiarse de las importantes mejoras de rendimiento y eficiencia que ofrecen los SSD Gen5.

DapuStor Haishen5 H5100 E3.S SSD SSD con Grad

En nuestras pruebas, los SSD H5100 proporcionaron un rendimiento increíble en nuestro denso servidor 1U. Es una solución versátil para diversas aplicaciones de alto rendimiento, que ayuda a las empresas a satisfacer sus necesidades cambiantes de almacenamiento de datos. Nos centramos en el rendimiento RAID HW acelerado por GPU con una configuración Graid SupremeRAID. Esto nos permitió mantener el sólido rendimiento de 16 SSD PCIe Gen5 en este servidor sin comprometer la integridad del almacenamiento en una configuración JBOD o RAID0. Esta configuración vio aspectos destacados como un increíble ancho de banda secuencial de lectura de 205 GB/s y escritura de 105 GB/s con un tamaño de transferencia de 1 MB. El rendimiento de E/S aleatoria también fue sólido, midiendo una impresionante lectura de 18.1 millones de IOPS y escritura de 1.9 millones de IOPS en una prueba de transferencia de 4K.

Lo que es tan emocionante como el rendimiento de la bandeja de entrada es la posibilidad de compartir datos a través de la red. Aunque aún es temprano, estamos experimentando con esta configuración de DapuStor y NIC OCP Broadcom 400GbE. Con dos de estas NIC en la caja de 1U, esperamos lograr aproximadamente 80 GB/s de rendimiento de almacenamiento compartido. Para tareas como el entrenamiento de IA o la visualización de datos en tiempo real, una red rápida y un almacenamiento rápido son clave para maximizar la utilización de la GPU. Anticipamos más desarrollos con esta impresionante plataforma.

Página del producto DapuStor

Interactuar con StorageReview

Boletín informativo | Canal de YouTube | Podcast iTunes/Spotify | @Instagram | Twitter | @TikTok | RSS Feed