Graid Technology establece nuevos estándares de rendimiento y protección de datos con SupremeRAID, especialmente para cargas de trabajo de IA y HPC.
SupremeRAID de Graid Technology continúa redefiniendo el panorama del almacenamiento al establecer nuevos estándares de rendimiento y protección de datos, en particular para cargas de trabajo modernas como IA y computación de alto rendimiento (HPC). Las configuraciones RAID tradicionales a menudo tienen dificultades para satisfacer las demandas de estos entornos con uso intensivo de datos, especialmente cuando dependen de tarjetas RAID de hardware limitadas por las limitaciones del bus PCIe. Al aprovechar la aceleración de la GPU, Graid supera estas barreras y ofrece un rendimiento excepcional con un impacto mínimo en los recursos de la CPU, al tiempo que garantiza una protección RAID sólida.

Servidor Gigabyte S183-SH0-AAV1
En cargas de trabajo avanzadas como IA y HPC, también se emplean comúnmente configuraciones alternativas como JBOD (Just a Bunch of Disks) y RAID de software (mdadm). Si bien es práctico cuando se combina con puntos de control para evitar la pérdida de datos, JBOD introduce más puntos de falla y sobrecarga a los administradores de TI con procesos de recuperación desafiantes. El RAID de software ofrece resiliencia de datos, pero agota valiosos recursos de CPU para administrar datos de paridad RAID y tiene un rendimiento inferior en muchas áreas. Por el contrario, SupremeRAID de Graid proporciona una solución optimizada y de alto rendimiento que simplifica la administración de datos sin comprometer la velocidad ni la confiabilidad.

Tarjeta RAID Graid Supreme
En este artículo se explorará una comparación de rendimiento entre SupremeRAID, JBOD y RAID de software de Graid, ilustrando por qué Graid surge como la mejor opción para entornos de TI donde el rendimiento y la protección de datos son primordiales.
Banco de pruebas de rendimiento
Se utilizó el Gigabyte S183-SH0-AAV1 Servidor dual Intel 5th Gen Scalable 1U para este banco de pruebas. Queríamos encontrar un servidor compacto con mucha potencia informática y resultó que el servidor admite 32 SSD E1.S, el máximo de lo que admite un solo Graid SupremeRAID SR-1010. El servidor Gigabyte tiene 32 ranuras DIMM, con soporte para RDIMM de 96 GB y RDIMM 256DS de 3 GB. Esta plataforma ofrece tres ranuras FHHL PCIe Gen5 en la parte trasera, lo que brinda muchas opciones para conectividad de red de alta velocidad. Además, la placa base proporciona red dual 1GbE integrada y un puerto de administración 1GbE.

Memoria DDR96-5 ECC de 5600 GB de Kingston
El servidor admite 32 ranuras DIMM, pero en este caso, las hemos llenado con 16 DIMM Kingston, 1 DIMM por canal (1DPC) para lograr la máxima velocidad de DRAM. Si la carga de trabajo requiere un espacio mayor, es posible cambiar a DIMM de mayor densidad o a una configuración 2DPC, pero esta última reduce la velocidad de DRAM a 4400 MT/s. La Memorias RDIMM DDR96-5 ECC de 5600 GB de Kingston En este servidor, se ofrece una excelente combinación de rendimiento por dólar, lo que los convierte en una opción atractiva para cargas de trabajo que necesitan DRAM de alta velocidad y un espacio de memoria DRAM razonable sin el costo adicional de los DIMM de 128 GB. Estos módulos ofrecen lo mejor de ambos mundos para cargas de trabajo intensivas de HPC y AI.

Unidades SSD KIOXIA XD7.68P de 7 TB
Las 32 bahías SSD E1.S están ocupadas por SSD XD7.68P de 7 TB de KIOXIA. Las unidades utilizan una interfaz PCIe Gen4 x2 y ofrecen un ancho de banda máximo de 7.2 GB/s de lectura y 4.8 GB/s de escritura. KIOXIA ha diseñado estas unidades específicamente para cargas de trabajo intensivas de hiperescala y HPC, donde las ventajas de densidad de los SSD E1.S son beneficiosas. Es importante destacar que KIOXIA se ha asegurado de que el diseño térmico del XD7P esté listo para seguir el ritmo de este diseño de servidor denso, incluso bajo cargas pesadas.

E/S trasera del servidor Gigabyte S183-SH0-AAV1
Especificaciones del sistema de prueba
- Servidor Gigabyte S183-SH0-AAV1
- 2 CPU Intel Xeon Platinum 8592+ (64 núcleos, 1.9 GHz)
- 16 memorias Kingston DDR96-5 de 5600 GB
- 32 unidades SSD KIOXIA XD7P de 7.68 TB E1.S
- Graid SupremeRAID SR-1010
- Servidor Ubuntu 22.04.4
Resultados de pruebas de rendimiento
Las cargas de trabajo de HPC pueden funcionar durante días, semanas o meses seguidos y, sin un almacenamiento de backend resistente, una falla de una sola unidad puede obligar a estos trabajos a volver al punto de partida. Para evaluar el impacto de Graid tanto en la resiliencia como en el rendimiento de las cargas de trabajo de HPC y Ai, analizamos el rendimiento del punto de referencia de almacenamiento interno de y-cruncher. El objetivo es comparar una variedad de configuraciones de almacenamiento, JBOD, RAID de software y Graid SupremeRAID, para comprender su impacto en las cargas de trabajo intensivas en CPU.
Configuración RAID
Sabemos que el software RAID de mdadm registra un impacto sustancial en la escritura de datos de paridad. Si bien RAID10 lograría un mayor rendimiento, también reduciría significativamente la capacidad utilizable. Para optimizar mejor el rendimiento del software RAID5, configuramos dos grupos RAID5, divididos entre los SSD 0-15 y 16-31. Esto los equilibró entre ambas CPU.
La comparación de Graid también se ajustó para utilizar dos grupos RAID5, con una división uniforme de la mitad de los SSD en la CPU0 y la otra mitad en la CPU1 para equilibrar NUMA. Realizamos pruebas con un solo volumen en cada grupo RAID5, así como con dos volúmenes por grupo RAID5.
Cada unidad se asigna individualmente en la configuración JBOD, lo que garantiza un equilibrio NUMA uniforme.
No pudimos incluir el RAID de hardware en este informe porque la forma en que están conectadas las unidades en este servidor hace que las tarjetas RIAD de hardware tradicionales no sean compatibles. Sin embargo, vale la pena señalar que, incluso si pudiéramos, el mejor escenario sería alcanzar el límite de ancho de banda de una ranura PCIe Gen4 x16 para una sola tarjeta, alrededor de 28 GB/s.
Configuración del software
Para estos diversos escenarios de almacenamiento, utilizamos trituradoraHerramienta de prueba de rendimiento interna de . Los resultados de la prueba se dividen en rendimiento de lectura y escritura secuencial, velocidad de E/S de cálculo, velocidad de E/S de disco y la relación entre la velocidad de E/S de disco y la velocidad de cálculo. Seleccionamos esta herramienta porque estresa simultáneamente la CPU, la memoria y la E/S de la unidad. Aunque no representa ninguna carga de trabajo específica, hemos descubierto que los datos que genera se correlacionan estrechamente con el rendimiento general del sistema en aplicaciones con gran cantidad de E/S. En particular, la prueba de E/S incluye el procesamiento de datos reales en lugar de simplemente enviar bits a través de una interfaz lo más rápido posible, lo que la convierte en un reflejo más preciso del rendimiento del sistema bajo una carga del mundo real.
El rendimiento de lectura y escritura secuencial indica la velocidad bruta de la matriz de discos. La velocidad de cómputo es la velocidad a la que la CPU procesa los datos, mientras que la velocidad de E/S del disco es la velocidad a la que los datos pueden transmitirse a la CPU a medida que se realiza el trabajo de cómputo. Las cargas de trabajo que van al disco necesitan que la velocidad de E/S del disco sea mayor que la velocidad de cómputo para no verse ralentizadas. Si esta relación es inferior a 1.0, el disco es un cuello de botella, mientras que si es superior a 1.0, la CPU es un cuello de botella. y-cruncher para cargas de trabajo grandes funciona mejor cuando la relación es de 2.0 o superior.
Configuración de almacenamiento | Lectura secuencial GB/s | Escritura secuencial GB/s | Cálculo GB/s | GB/s de E/S de disco | Proporción |
---|---|---|---|---|---|
JBOD directo | 102 | 102 | 18.4 | 81.5 | 4.42 |
RAID 5 de grado x 2 2 VD | 64.3 | 43.8 | 23.1 | 70.4 | 3.05 |
RAID 5 de grado x 2 4 VD | 85.2 | 73.7 | 22.1 | 69.4 | 3.14 |
RAID 5 de software x 2 | 122 | 3.6 | 25.7 | 10.9 | 0.42 |
Con JBOD directo a 32 SSD E1.S individuales, y-cruncher vio un rendimiento de 102 GB/s de lectura y 102 GB/s de escritura con su proceso de striping interno. Este es generalmente el rendimiento más alto que y-cruncher verá para esta plataforma, aunque la contrapartida es que no hay paridad de datos. Cuando la configuración se cambió a volúmenes RAID5 de software (distribuidos entre ambas CPU) con mdadm, el rendimiento secuencial se desplomó a solo 3.6 GB/s de escritura y 122 GB/s de lectura. Graid con dos grupos RAID5 y dos volúmenes midió 64.3 Gb/s de lectura con un rendimiento de escritura de 43.8 GB/s. Al dividir eso en dos grupos RAID5 pero con cuatro volúmenes, Graid vio un aumento en el ancho de banda a 85.2 GB/s de lectura y 73.7 GB/s de escritura.
Una vez que se abordaron los números de ancho de banda y se entendió el espectro de opciones de configuración de almacenamiento, analizamos en profundidad el impacto de esta decisión en la aplicación. La relación entre el ancho de banda de E/S de disco y el de computación registró la relación más alta de 4.43 en la configuración JBOD. El RAID5 de software fue de apenas 0.42, mientras que el RAID5 de Graid fue de 3.05 con 2 VD y de 3.14 con 4 VD.
En este ejemplo de y-cruncher, que incluye todas las capacidades de rendimiento del servidor, se requiere una relación de 2.0 o superior para un rendimiento óptimo. Si bien la configuración JBOD ofrece los mejores resultados generales, lo hace a costa de los datos de paridad, lo que significa que una falla de cualquier unidad, incluso por un momento, significa pérdida de datos. Por otro lado, el RAID de software puede ofrecer disponibilidad de datos y una mayor velocidad de lectura que JBOD, pero las escrituras se ven tan afectadas que la E/S del disco no puede seguir el ritmo de la CPU, lo que genera el terrible resultado de 42.
Estos dos puntos de datos son fundamentales para comprender el beneficio que Graid SupremeRAID ofrece a estas cargas de trabajo. Para este caso de uso, las cifras de rendimiento total se encuentran entre JBOD y RAID de software, pero la E/S sin procesar no es la historia completa. Este ejemplo muestra que Graid puede ofrecer más que el rendimiento de la aplicación requerida y, al mismo tiempo, proporcionar disponibilidad de datos. Esta combinación significa que las organizaciones que utilizan Graid pueden esperar protección RAID, almacenamiento y rendimiento de la aplicación con una arquitectura sin bloqueos que supera con creces lo que podría proporcionar una tarjeta RAID tradicional.
Conclusión
SupremeRAID de Graid Technology supera constantemente los límites de la protección y el rendimiento de los datos, y establece un nuevo estándar en la industria. Al aprovechar el poder de la aceleración de la GPU, Graid ofrece una velocidad y una eficiencia inigualables en las configuraciones RAID, lo que reduce significativamente la carga de la CPU y maximiza el rendimiento.
Los datos que recopilamos para este informe demuestran la capacidad de Graid para garantizar una protección de datos sólida y, al mismo tiempo, cumplir con los exigentes requisitos de las cargas de trabajo modernas de inteligencia artificial y computación de alto rendimiento, áreas en las que las soluciones RAID tradicionales y RAID de software suelen ser insuficientes. Esta eficiencia permite que los recursos críticos del sistema, como la CPU, la DRAM y el almacenamiento, contribuyan plenamente al rendimiento de las aplicaciones a las que están diseñados para dar soporte, lo que mejora el valor y la eficacia generales del sistema.
Este informe está patrocinado por Graid Technology. Todas las opiniones y puntos de vista expresados en este informe se basan en nuestra opinión imparcial sobre el producto o productos en cuestión.
Interactuar con StorageReview
Boletín informativo | Canal de YouTube | Podcast iTunes/Spotify | @Instagram | Twitter | @TikTok | RSS Feed