Es evidente que los últimos SSD Gen5, como el Western Digital SN861, están influyendo en los resultados comerciales. Si necesita pruebas, no busque más allá de su impacto en la revolución de la IA.
Patrocinado por Western Digital
El SSD Western Digital Ultrastar® DC SN861 está diseñado para satisfacer las necesidades de alto rendimiento tanto de los centros de datos de hiperescala como de los entornos empresariales. El SN861 admite una interfaz PCIe® Gen5 y viene en varios factores de forma, incluidos U.2 y E1.S, lo que le permite adaptarse a múltiples escenarios de implementación. Sin embargo, no es tan simple como fabricar el SN861 en diferentes factores de forma; Western Digital ha diseñado sabiamente el conjunto de funciones SN861 para alinearse con sus mercados objetivo.
La interfaz Gen5 le da al SN861 un aumento inmediato de rendimiento con respecto a la generación anterior. SN655. Los beneficios de la nueva unidad son mucho más profundos, con capacidades como la ubicación flexible de datos (FDP) en el factor de forma E1.S. FDP reduce la amplificación de escritura y optimiza la ubicación de los datos. El SN861 incluye funciones de seguridad avanzadas como protección de datos de extremo a extremo, cifrado AES-XTS y TCG OPAL 2.01. El controlador también ayuda a reducir el consumo de energía de la SSD, con un promedio inferior a 5 vatios en inactivo. Además, la unidad admite múltiples estándares como NVMe® 2.0 y OCP Cloud Spec 2.0.
Si bien las funciones de seguridad y eficiencia son fundamentales, cada actualización generacional incluye un aumento significativo en el rendimiento, y el SN861 no es diferente. La unidad ofrece velocidades de lectura secuencial de hasta 13,700 MB/s y IOPS de lectura aleatoria de hasta 3.3 millones, esenciales para aplicaciones como AI/ML y análisis de big data. Ambas versiones del SN861 consumen un promedio de 20 vatios durante el funcionamiento y menos de 5 vatios en inactivo. La energía se puede ajustar, por lo que es fácil ajustar el perfil de energía de la unidad para que coincida con la carga de trabajo esperada. Los hiperescaladores, por ejemplo, a menudo ejecutan sus unidades E1.S en estados de energía mucho más bajos.
Curiosamente, si bien los dos factores de forma del SN861 son técnicamente muy similares en diseño, Western Digital ha ajustado cada unidad para cargas de trabajo específicas. En la versión E1.S, por ejemplo, esto significa características como FDP y rendimiento optimizado para cargas de trabajo en la nube. La unidad U.2, por otro lado, se abrirá camino en cargas de trabajo empresariales de alto rendimiento y, sin duda, en cargas de trabajo emergentes como la IA que pueden beneficiarse del enorme salto en el rendimiento de la unidad.
EDSFF y FDP
FDP proporciona importantes beneficios para hiperescaladores como Meta al optimizar el rendimiento y la confiabilidad de sus SSD en cargas de trabajo como CacheLib. FDP reduce el factor de amplificación de escritura (WAF), lo que conduce a velocidades de escritura mejoradas y una vida útil extendida del SSD, lo cual es crucial para manejar tareas masivas de procesamiento de datos.
La tecnología mejora la organización de los datos al agrupar inteligentemente datos similares, minimizando el aprovisionamiento excesivo y reduciendo la necesidad de una recolección intensiva de basura. FDP también admite múltiples espacios de nombres, lo que garantiza un rendimiento constante en diferentes cargas de trabajo. Esta optimización mejora el rendimiento y la resistencia de las aplicaciones y reduce significativamente el costo total de propiedad (TCO) para infraestructuras de almacenamiento a gran escala.
La compatibilidad con FDP en la versión E1.S del Ultrastar SN861 afirma que la unidad está lista para las necesidades de los hiperescaladores, pero FDP es solo una parte de la ecuación. La versión E1.S de la unidad debe cumplir con los requisitos de rendimiento a hiperescala, específicamente QoS en torno al rendimiento de lectura.
U.2 Para empresas
Por muy interesante que sea la unidad E1.S para casos de uso a hiperescala, la U.2 SN861 es la unidad que adoptarán la mayoría de las empresas. Sometimos la unidad a una serie de pruebas para medir el rendimiento general en nuestro conjunto de pruebas estándar.
Hoja de datos del SSD Western Digital Ultrastar DC SN861
1.60TB | 1.92TB | 3.20TB | 3.84TB | 6.40TB | 7.68TB | |
---|---|---|---|---|---|---|
Trabajadora | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD |
Seguridad | ||||||
Factor de forma | ||||||
Fácil de usar | ||||||
Especificación NVMe | ||||||
Rendimiento (proyectado) | 1.60TB | 1.92TB | 3.20TB | 3.84TB | 6.40TB | 7.68TB |
Rendimiento de lectura (MB/s máx., secuencia 128 KB) | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 |
Rendimiento de escritura (GB/s máx., secuencia 256 KB) | 3,600 | 3,600 | 7,200 | 7,200 | 7,500 | 7,500 |
Leer IOPS (máx., Rnd 4KiB) | 2,100K | 2,100K | 3,300K | 3,300K | 3,300K | 3,300K |
Escribir IOPS (máx., Rnd 4KiB) | 350K | 165K | 665K | 330K | 800K | 430K |
Lectura de latencia (μS) | 65 | 65 | 65 | 65 | 65 | 65 |
Latencia de escritura (μS) | 8 | 8 | 8 | 8 | 8 | 8 |
Fiabilidad | ||||||
MTTF (horas, proyectadas) | ||||||
Tasa de error de bit incorregible (UBER) | ||||||
Tasa de fracaso anualizada (AFR, proyectada) | ||||||
Garantía limitada (años) | ||||||
Gestión de energía (proyectada) | ||||||
Requisito (CC, +/- 10%) | ||||||
Modos de funcionamiento (promedio, máximo) | ||||||
Inactivo (promedio) | ||||||
Tamaño físico | ||||||
altura z (mm) | ||||||
Dimensiones (ancho x largo, mm) | ||||||
Medio ambiente | ||||||
Temperatura de funcionamiento (ambiente) | ||||||
Temperatura de almacenamiento |
Para medir el rendimiento de las SSD NVMe® Gen5 empresariales utilizadas en esta comparación, aprovechamos un conjunto de pruebas de fio para cargas de trabajo de cuatro esquinas y Vdbench para cargas de trabajo mixtas. El paquete de secuencias de comandos fio que utilizamos es una secuencia de comandos automatizada configurada para precondicionar y probar ligeramente las unidades de manera consistente, encontrado aquí en github. Usamos esto para realizar pruebas de lectura y escritura secuenciales de 256K para un ancho de banda máximo y pruebas de lectura y escritura aleatorias de 4K para un rendimiento máximo.
Rendimiento máximo y ancho de banda |
Western Digital SN861 7.68 TB | KIOXIA CM7-R 7.68TB | Samsung PM1743 7.68TB | Samsung PM9A3 7.68TB |
Lectura secuencial de 256K (1T/64Q) | 13,283MB / s | 12,092MB / s | 14,495MB / s | 6,751MB / s |
Escritura secuencial de 256K (1T/64Q) | 7,696MB / s | 5,796MB / s | 6,052MB / s | 4,055MB / s |
Lectura aleatoria 4K (8T/32Q) | 2,108,065 IOPS | 1,963,066 IOPS | 1,900,838 IOPS | 1,068,508 IOPS |
Escritura aleatoria 4K (8T/32Q) | 473,658 IOPS | 301,061 IOPS | 319,758 IOPS | 206,660 IOPS |
Cuando observamos las cifras de rendimiento de primera línea del Western Digital SN861, hace un buen uso de su interfaz Gen5. En lectura secuencial, midió 13.3 GB/s, que quedó en segundo lugar en comparación con el Samsung PM1743, que midió 14.5 GB/s. En escritura secuencial, el SN861 quedó primero, arrasando con los otros dos modelos Gen5 comparables, con una velocidad de 7.7 GB/s, con 6.1 GB/s del Samsung PM1743 como el siguiente más cercano.
El rendimiento de lectura aleatoria de 4K fue notablemente sólido, midiendo 2.11 millones de IOPS, con 1.96 millones de IOPS del KIOXIA CM7-R como el siguiente más cercano. Cuando analizamos el rendimiento de escritura aleatoria en 4K, el Western Digital SN861 también quedó en primer lugar, con una velocidad de 474K IOPS, con el Samsung PM1743 con 320K IOPS como el siguiente modelo más cercano. En nuestras cargas de trabajo de cuatro esquinas, el Western Digital SN861 obtuvo la cifra más alta en tres de las cuatro pruebas.
Para probar el SSD SN861 Gen5, aprovechamos el Dell® PowerEdge® R760 en nuestro laboratorio de pruebas. Es un servidor de montaje en rack de 2U muy versátil que admite dos procesadores Intel Xeon de cuarta generación y tiene configuraciones que admiten hasta 4 unidades NVMe. Este servidor está diseñado para cargas de trabajo mixtas, bases de datos y VDI. Cabe señalar que la versión del CM24-R que estamos probando en esta revisión proviene de un servidor Dell con la versión de firmware de Dell. Esta unidad puede funcionar de manera diferente con el firmware original de KIOXIA.
Configuración de Dell PowerEdge R760:
- Intel® Xeon® Gold 6430 dual (32 núcleos/64 subprocesos, base de 1.9 GHz)
- Memoria RAM DDR1 de 5 TB
- Ubuntu 22.04
Para lograr la máxima flexibilidad, también trabajamos con Serial Cables, que nos proporcionó un JBOF PCIe Gen8 de 5 bahías para pruebas de SSD U.2/U.3, M.2 y EDSFF. Esto nos permite probar todos los tipos de unidades actuales y emergentes en el mismo hardware de prueba. VDbench también se aprovechó para comparar el rendimiento escalado en nuestra selección de SSD en diferentes tipos de cargas de trabajo. Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie de la unidad con datos y luego divide una sección de la unidad equivalente al 25 % de la capacidad de la unidad para simular cómo la unidad podría responder a las cargas de trabajo de las aplicaciones. Esto difiere de las pruebas de entropía completa, que utilizan el 100 por ciento del disco y lo llevan a un estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más sostenidas.
perfiles:
- Lectura secuencial de 16 K: 100 % de lectura, 32 subprocesos, 0-120 % de iorate
- Escritura secuencial de 16 K: 100 % de escritura, 16 subprocesos, 0-120 % de iorate
- Mezcla aleatoria 4K, 8K y 16K 70R/30W, 64 subprocesos, 0-120 % de iorata
- Base de datos sintética: SQL y Oracle
- Trazas de clones vinculados y clones completos de VDI
Nuestra primera prueba de Vdbench midió el rendimiento de lectura secuencial de 16K con una carga de 32 subprocesos. Aquí, medimos un rendimiento máximo de 325K IOPS y 5.1 GB/s a 98 μs del Western Digital SN861, que estaba codo a codo con el KIOXIA CM7-R, midiendo 329K IOPS. El PCIe Gen5 Samsung PM1743 midió 289K IOPS, y el Samsung PM9A3 que trajimos como referencia Gen4 SSD midió 227K IOPS.Al centrarnos en el rendimiento de escritura con la misma carga de trabajo secuencial de 16K, el Western Digital SN861 ofreció una gran ventaja frente a los otros SSD U.2 PCIe Gen5 con los que lo comparamos. El SN861 midió un pico de 200K IOPS y 3.1 GB/s a 78 μs, con una buena ventaja sobre el KIOXIA CM7-R y el Samsung PM1743. En comparación con el panorama Gen4, todos tenían una fuerte ventaja sobre el Samsung PM9A3, que midió 131K IOPS.
Nuestras siguientes tres pruebas analizan el tamaño de los bloques en una prueba de transferencia aleatoria con una mezcla 70/30 R/W. La primera prueba midió un tamaño de bloque de 4K. Aquí, encontramos que Western Digital SN861 y KIOXIA CM7-R tienen un rendimiento muy similar, con el SN861 midiendo 903K IOPS a 70 μs versus 881K IOPS del CM7-R. El Samsung PM1743 le siguió con una velocidad máxima de 521K IOPS, mientras que el Gen4 PM9A3 midió 396K IOPS.
Al pasar a un tamaño de bloque de 8K con nuestra prueba aleatoria 70/30 R/W, el Western Digital SN861 superó al KIOXA CM7-R, midiendo un pico de 682K IOPS a 93 μs, frente al CM7-R con 599K IOPS. El Samsung PM1743 quedó atrás con 414K IOPS, mientras que el Gen4 PM9A3 midió 301K IOPS.
Nuestra prueba final aleatoria 70/30 R/W analiza un tamaño de bloque de 16K. El Western Digital SN861 continúa su fuerte liderazgo aquí, midiendo un pico de 434K IOPS a 143 μs, mientras que el CM7-R mide 337K IOPS. El Samsung PM1743 continuó a la zaga, midiendo 231K IOPS, mientras que el Gen4 PM9A3 midió 183K IOPS.
Nuestro próximo grupo de pruebas se centra en una carga de trabajo de SQL sintético. En esta primera prueba, encontramos que el Western Digital SN861 supera al KIOXIA CM7-R, con una velocidad máxima de 407K IOPS a 78 μs frente a los 396K IOPS del CM7-R. El Samsung PM1743 quedó atrás con un pico de 340K IOPS, mientras que el Gen4 PM9A3 midió 310K IOPS.
Con la carga de trabajo SQL en una combinación 80/20 R/W, Western Digital SN861 continúa liderando al KIOXIA CM7-R, midiendo un pico de 424K IOPS a 75 μs versus 407K del CM7-R. El Samsung PM1743 quedó detrás de esos dos con una velocidad máxima de 322K IOPS, mientras que el Gen4 PM9A3 midió 281K IOPS.
Al aumentar la extensión de lectura a una división de lectura/escritura de 90/10 en nuestra carga de trabajo SQL, Western Digital SN861 continuó manteniendo su ventaja sobre el KIOXIA CM7-R, midiendo 411 77 IOPS a 398 μs frente a 7 328 IOPS del CM4-R. El Samsung todavía estaba detrás de esos dos con una velocidad máxima de 9K IOPS, y el Gen3 PM297AXNUMX midió XNUMXK IOPS.
Después de nuestras pruebas de SQL, cambiamos el enfoque a una carga de trabajo sintética de Oracle. Aquí, nuestros tres SSD Gen5 muestran fuertes mejoras con respecto al Samsung PM4A9 Gen3. El Western Digital SN861 mantuvo su liderazgo con una velocidad máxima de 445K IOPS a 80 μs, por delante del KIOXIA CM7-R con 417K IOPS. El Samsung PM1743 quedó detrás de ellos, midiendo 317K IOPS, y el PM9A3 con 267K IOPS.
Al cambiar la distribución de R/W de nuestra carga de trabajo sintética de Oracle a 80/20, la distribución entre Western Digital SN861 y KIOXIA CM7-R se redujo, con el SN861 midiendo un pico de 309 71 IOPS a 7 μs y el CM304-R midiendo 1743 252 IOPS . El Samsung PM4 midió un pico de 9K IOPS, y el Gen3 PM228AXNUMX alcanzó un pico de XNUMXK IOPS.
Nuestra carga de trabajo sintética final de Oracle con una combinación 90/10 R/W vio una brecha similar entre Western Digital SN861 y KIOXIA CM7-R. El SN861 tenía una velocidad máxima de 296K IOPS a 74 μs, mientras que el CM7-R midió 292K IOPS. El Samsung PM1743 estaba más atrás con una velocidad máxima de 250K IOPS, mientras que el Gen4 PM9A3 midió 231K IOPS.
Nuestras últimas seis cargas de trabajo se centran en seguimientos VDI de máquinas virtuales de clonación completa y clonación vinculada. Estos cubren tres escenarios cada uno: inicio, inicio de sesión inicial e inicio de sesión del lunes. Nuestra prueba cubre un escenario de arranque de clon completo, donde el Western Digital SN861 midió 370K IOPS a 94 μs frente al KIOXIA CM7-R con 348K IOPS. El Samsung PM1743 quedó atrás con 263K IOPS y el Gen4 PM9A3 con 227K IOPS.
En nuestro escenario de inicio de sesión inicial, el KIOXIA CM7-R tomó ventaja sobre el Western Digital SN861, midiendo 196 163 IOPS a 861 μs frente al SN181 con 1743 157 IOPS. El Samsung PM4 midió un pico de 9K IOPS, mientras que el Gen3 PM117AXNUMX llegó con XNUMXK IOPS.
En el perfil de inicio de sesión del lunes, Western Digital SN861 y KIOXIA CM7-R estuvieron codo a codo. El SN861 midió un pico de 158 IOPS a 99 μs, mientras que el CM7-R midió 160 IOPS. El Samsung PM1743 midió 126K IOPS y el Gen4 PM9A3 llegó con 83K IOPS.
En nuestras últimas tres pruebas, analizamos esos mismos perfiles en una configuración de clon vinculado VDI, comenzando con un arranque. El KIOXIA CM7-R quedó primero, midiendo 161K IOPS, frente al Western Digital SN861 con 156K IOPS a 102 μs. El Samsung PM1743 luego midió 138K IOPS, con el Gen4 PM9A3 detrás con 110K IOPS.
En nuestra prueba que midió un perfil de inicio de sesión inicial, el KIOXIA CM7-R tuvo la velocidad más alta de 89K IOPS, seguido de cerca por el Western Digital SN861 con 85K IOPS a 102 μs. El Samsung PM1743 quedó atrás con 70K IOPS, con su hermano Gen4 detrás con 53K IOPS.
En nuestra última carga de trabajo de VDI que cubrió un perfil de inicio de sesión del lunes, el Western Digital SN861 tomó la delantera con una velocidad máxima de 122K IOPS a 129 μs, con el KIOXIA CM7-R detrás midiendo 115K IOPS. El Samsung PM1743 midió 95K IOPS, seguido por el Gen4 PM9A3 con una velocidad máxima de 64K IOPS.
Western Digital SN861 e IA
En un camino algo relacionado con el trabajo con el SN861 en este informe, también hemos estado trabajando con la generación anterior. Western Digital Ultrastar DC SN655 dentro de la plataforma OpenFlex™ Data24 que proporciona el grupo de sistemas Western Digital. En una demostración de FMS '24, mostramos una demostración de IA con un servidor GPU, la plataforma Data24 NVMe-oF™ y SSD Gen4 SN655.
Nuestras pruebas con NVIDIA® IndeX® se centraron en aprovechar sus capacidades avanzadas de visualización volumétrica para manejar conjuntos de datos masivos con alta fidelidad. IndeX utiliza aceleración de GPU para proporcionar visualización interactiva en tiempo real de datos volumétricos 3D, lo cual es fundamental para industrias como la exploración de petróleo y gas, imágenes médicas e investigación científica.
Para lograr un rendimiento óptimo, especialmente en entornos con uso intensivo de GPU, es necesario garantizar un intercambio de datos de alta velocidad entre las GPU y el almacenamiento. Por ejemplo, para saturar completamente el ancho de banda de una GPU NVIDIA H100, necesitábamos alcanzar aproximadamente 64 GB/s de rendimiento, lo que implica el uso de tecnologías y soluciones de almacenamiento NVMe de alto rendimiento como NVIDIA GPUDirect™. Esta integración reduce la latencia y maximiza el rendimiento de los datos, lo que garantiza una utilización eficiente de la GPU para un procesamiento más rápido y eficaz de conjuntos de datos a gran escala.
Cuando observamos las diferencias de ancho de banda en lo que el Gen4 SN655 puede hacer a un máximo de 6.8 GB/s frente a los 13.7 GB/s del SN861, es obvio ver las ventajas de pasar a un Gen5 SSD. Para alcanzar los 64 GB/s con el modelo de la generación anterior, se necesitan diez SSD, mientras que el SN861 podría alcanzar ese objetivo con sólo cinco. Esta diferencia podría permitirle aumentar el número de unidades para obtener ancho de banda o capacidad adicional.
El rendimiento y la capacidad serán fundamentales para que el almacenamiento se adapte a las necesidades de la IA y otras aplicaciones avanzadas. La interfaz Gen5 y el aumento de rendimiento general que ofrece el SN861 sobre las unidades Gen4 son muy convincentes en este sentido, lo que significa que estas unidades pueden admitir más GPU dentro de un único sistema de almacenamiento y garantizar que esas GPU se alimenten a una velocidad lo suficientemente rápida como para garantizar una utilización completa.
Conclusión
El SN861 marca un importante avance para Western Digital. La unidad viene en factores de forma para admitir clientes empresariales y de hiperescala por igual, con funciones de unidad como FDP en la unidad E1.S ajustadas para sus posibles casos de uso. Sin embargo, la interfaz Gen5 es el beneficio más evidente para las unidades, ya que ofrece un impresionante perfil de rendimiento general.
El Western Digital SN861 ofreció un rendimiento sólido desde el principio, ocupando tres primeros lugares en nuestras cargas de trabajo iniciales de cuatro esquinas que midieron el ancho de banda secuencial máximo y el rendimiento aleatorio. Los aspectos más destacados incluyen un rendimiento de lectura aleatoria de 4K de 2.11 M IOPS y un rendimiento de escritura aleatoria de 4K que mide 474 K IOPS. El rendimiento de lectura secuencial fue sólido, quedando en segundo lugar en comparación con el Samsung PM1743 con 13.3 GB/s, aunque pudo tomar el liderazgo en ancho de banda de escritura secuencial con 7.7 GB/s.
En nuestras cargas de trabajo de VDbench, que se centraron principalmente en cargas de trabajo mixtas o transferencias de bloques más pequeños, el SN861 siguió funcionando excepcionalmente bien. Medimos una sólida velocidad de escritura secuencial de 16K de 200K IOPS y fuertes ventajas en las pruebas combinadas 70/30 R/W que cubren tamaños de transferencia de 4K, 8K y 16K. En nuestras cargas de trabajo VDI, el SN861 intercambió el primer lugar con el KIOXIA CM7-R, que estaban codo a codo en algunas áreas. En general, el Western Digital SN861 tuvo un buen desempeño en nuestra línea de pruebas.
Es evidente que los últimos SSD Gen5, como el Western Digital SN861, están influyendo en los resultados comerciales. Si necesita pruebas, no busque más allá de su impacto en la revolución de la IA. Lo hemos visto en nuestras pruebas; Los sistemas de IA necesitan un almacenamiento rápido para mantener las GPU en funcionamiento, ya sea en una caché como el ejemplo de NVIDIA IndeX anterior o dentro de matrices de almacenamiento compartido o servidores de GPU. Western Digital lo ha hecho muy bien al posicionar el SN861 para estas cargas de trabajo avanzadas y al mismo tiempo ofrece SKU habilitados para FDP para hiperescaladores.
Almacenamiento del centro de datos de Western Digital
Interactuar con StorageReview
Boletín informativo | Canal de YouTube | Podcast iTunes/Spotify | @Instagram | Twitter | @TikTok | RSS Feed