Inicio Empresa Revisión de ScaleFlux CSD 2000

Revisión de ScaleFlux CSD 2000

by Adam Armstrong

ScaleFlux es una empresa que se centra únicamente en el almacenamiento computacional, más específicamente en el almacenamiento computacional a escala. La compañía está haciendo esto principalmente con sus unidades de almacenamiento computacional (CSD) ScaleFlux. Como habrá adivinado por su nombre, el CSD es un SSD NVMe integrado con motores de cómputo que pueden mejorar el rendimiento de la unidad y el sistema. Pero el almacenamiento computacional significa muchas cosas diferentes, dependiendo de con quién estés hablando. En esta revisión, tenemos una idea de la perspectiva de ScaleFlux, con ScaleFlux CSD 2000.

ScaleFlux es una empresa que se centra únicamente en el almacenamiento computacional, más específicamente en el almacenamiento computacional a escala. La compañía está haciendo esto principalmente con sus unidades de almacenamiento computacional (CSD) ScaleFlux. Como habrá adivinado por su nombre, el CSD es un SSD NVMe integrado con motores de cómputo que pueden mejorar el rendimiento de la unidad y el sistema. Pero el almacenamiento computacional significa muchas cosas diferentes, dependiendo de con quién estés hablando. En esta revisión, tenemos una idea de la perspectiva de ScaleFlux, con ScaleFlux CSD 2000.

ScaleFlux CSD 2000

¿Qué es el almacenamiento computacional?

De hecho, hemos estado escribiendo sobre el almacenamiento computacional durante varios años aquí en StorageReview. En pocas palabras, el almacenamiento computacional toma recursos de cómputo (que no son la arquitectura de cómputo y/o memoria del sistema) y los coloca dentro del propio almacenamiento.

A veces, estos recursos informáticos también se colocan entre el host y el almacenamiento. Esto puede reducir el movimiento de datos, aliviar la carga de los recursos informáticos de los sistemas y aumentar potencialmente el rendimiento o, al menos, la coherencia del rendimiento. Sin embargo, hay muchos proveedores que participan en el almacenamiento computacional, por lo que es importante comprender que el término "almacenamiento computacional" puede significar cosas muy diferentes, según el producto.

ScaleFlux CSD 2000 y almacenamiento computacional

ScaleFlux CSD se distingue por la introducción de motores de compresión/descompresión de ruta de datos. Según la compañía, esto puede efectivamente cuadruplicar la capacidad y duplicar el rendimiento. Eso sí, esto supone que los datos son comprimibles, algo fundamental para que esta plataforma funcione bien. Suponiendo que las condiciones sean las correctas, la capacidad efectiva se convierte en un punto fuerte de venta.

ScaleFlux CSD 2000 atrás

También hay que hacer un argumento de costo y densidad. Al comprimir datos y obtener una capacidad más efectiva, ScaleFlux calcula que las organizaciones pueden ahorrar hasta un 50 % en el costo de flash. También pueden ofrecer “más” flash en la misma ranura gracias a la compresión.

El costo y la eficiencia significan poco sin el rendimiento, ¿qué afirma ScaleFlux que se puede duplicar con respecto a los SSD tradicionales? La unidad viene en una versión de centro de datos y escala de datos, pero veamos los números principales aquí. El número superior con una compresión de datos 1:1 es 750 4 IOPS en lectura 490K y 4 2 IOPS en escritura 1K para una compresión de datos 3:2.3. Para velocidades secuenciales, se dice que la unidad alcanza los 1 GB/s en cualquier compresión y hasta 1 GB/s de escritura en compresión XNUMX:XNUMX.

Algunas otras diferencias con el CSD son que tiene FTL/FM sintonizable que permite a los usuarios optimizar el rendimiento y el precio por GB. Ejecutar un alto rendimiento puede generar problemas de energía y temperatura, aunque estos pueden reducirse para evitar el sobrecalentamiento. La protección de datos parece estar siempre en las noticias y, en ese sentido, el CSD reclama protección de datos de extremo a extremo y ECC en todas las memorias internas en la ruta de datos, así como protección contra pérdida de energía.

Para participar en esta acción de CSD con ScaleFlux, hay un par de inconvenientes. Una es que la unidad que estamos revisando es Gen 3, en un momento en que los SSD tradicionales migraron a PCIe Gen 4. Este es un problema solucionable. Otro éxito es que actualmente la compatibilidad con los controladores está limitada a Linux. Windows y VMware están fuera. La virtualización localizada sería un caso de uso interesante y maduro para los beneficios de reducción de datos. Con suerte, vendrá un apoyo más amplio.

Especificaciones clave de ScaleFlux CSD 2000

Factores de forma AIC PCIe y U.2.5 de 2”
Fácil de usar Dispositivo de almacenamiento en bloque de baja latencia PCIe Gen3 x4
Medios NAND TLC 3D y QLC 3D
Protección de pérdida de potencia
Protección de Datos
  • Protección de extremo a extremo
  • ECC en todas las memorias
  • CRC de ruta de datos completa
  • LDPC y protección RAID de nivel die
Potencia
  • Activo típico de 18 vatios
  • 25W máximo
  • 12W att inactivo (latencia de salida cero)
Temperatura de Funcionamiento 50°C a 200 LFM (AIC) 35°C a 200 LFM (U.2)
Protección de la temperatura Regulación térmica habilitada
MTTF 2 millones de horas
Capacidad de cómputo
  • Compresión de ruta de datos transparente
  • Rendimiento acelerado
  • Capacidad extendida
Compatibilidad de software Linux OS 2.6 Kernel o posterior solamente

  • Compatibilidad con repositorios: Ubuntu 16/18/20, RedHat/CentOS 6/7/8

Compresión con ScaleFlux

Desde el principio, queríamos tener una idea de cómo se implementa la compresión. Para comenzar a usar Linux, debe cargar su controlador personalizado para ver e interactuar con la unidad, que es una rama del conjunto de herramientas común nvme-cli. Esto le permite ver la unidad tal como está, formatearla, así como interactuar y/o modificar la capacidad utilizable en función del conjunto de datos actual. A continuación se muestra un ejemplo rápido de la salida antes y después de nuestra prueba de carga de trabajo. El primer comando de "sfx-nvme list" muestra la unidad instalada.

root@storagereview:~# lista sfx-nvme
Nodo SN Modelo Espacio de nombres Uso Formato FW Rev BUS:slot:func
/dev/sfdv0n1 UC1945A7112M CSDU3RF040B1 1 3.20 TB/3.20 TB 512 B + 0 B 4870 0000:d8:00.0

Después de nuestra primera ronda de puntos de referencia con datos totalmente incompresibles (nuestro conjunto de datos de trabajo normal), vemos que la unidad muestra una relación de compresión de 1.00.

root@revisión de almacenamiento:~# cat /sys/block/sfdv*/sfx_smart_features/sfx_capacity_stat
espacio_libre tamaño_físico tamaño_lógico relación_comp capacidad_aprovisionada bandera_espacio
2736 6251231232 6251231312 1.00 6251233968 0

A continuación, cambiamos el nivel de compresión de vdbench a 4x, lo que permitió que la unidad hiciera algo de su magia entre bastidores. Después de que se completó y volvimos a consultar el SSD, vemos el tamaño aumentado y la relación de compresión de 4.10. Entonces, la buena noticia es que con esta reorganización básica, las unidades hacen lo que dicen hacer, en términos de funcionalidad de compresión.

root@revisión de almacenamiento:~# cat /sys/block/sfdv*/sfx_smart_features/sfx_capacity_stat
espacio_libre tamaño_físico tamaño_lógico relación_comp capacidad_aprovisionada bandera_espacio
4728607824 1522626144 6251231312 4.10 6251233968 0

Rendimiento de ScaleFlux CSD 2000

Análisis de carga de trabajo de VDBench

Cuando se trata de comparar dispositivos de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no son una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita las comparaciones de manzanas con manzanas entre las soluciones de la competencia.

Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, hasta capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de cargas de trabajo vdBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran clúster de pruebas informáticas. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales.

Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie del disco con datos, luego divide una sección del disco equivalente al 25% de la capacidad del disco para simular cómo el disco podría responder a las cargas de trabajo de la aplicación. Esto es diferente a las pruebas de entropía completa, que utilizan el 100 % del impulso y lo llevan a un estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más altas.

perfiles:

  • Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
  • Escritura aleatoria 4K: 100 % de escritura, 64 subprocesos, 0-120 % de iorate
  • Lectura secuencial de 64 K: 100 % de lectura, 16 subprocesos, 0-120 % de iorate
  • Escritura secuencial de 64 K: 100 % de escritura, 8 subprocesos, 0-120 % de iorate
  • Base de datos sintética: SQL y Oracle
  • Trazas de clones vinculados y clones completos de VDI

A modo de comparación, veremos el SSD ScaleFlux con VDBench que envía datos incompresibles y datos comprimibles 4x. En 4K aleatorio, el CSD incompresible comenzó por debajo de los 100 µs y alcanzó un máximo de 588,893 216 IOPS con una latencia de 573,460 µs. Con la compresión, la unidad fue solo un poco más lenta con un pico de 222 XNUMX IOPS a una latencia de XNUMX µs.

ScaleFlux CSD 2000 4k de lectura

La escritura aleatoria de 4K vio el pico de la unidad incompresible en alrededor de 355K IOPS a aproximadamente 325 µs antes de dejar algunos. Con compresión, la unidad se mantuvo por debajo de los 100 µs en su mayor parte con un pico de alrededor de 572 168 IOPS con XNUMX µs de latencia.

Cambiando a cargas de trabajo secuenciales de 64K, para leer, la unidad incompresible alcanzó un pico de 33,785 2.11 IOPS o 473 GB/s con una latencia de 47,489 µs. Con la compresión, vimos que la unidad alcanzaba 2.97 336 IOPS o XNUMX GB/s con una latencia más baja de XNUMX µs.

ScaleFlux CSD 2000 64k de lectura

En escritura de 64K, ambas configuraciones se ejecutaron por debajo de 100 µs durante una gran parte de la prueba. La configuración incompresible alcanzó un máximo de 24,074 1.5 IOPS o 643 GB/s con una latencia de 4 µs. Con compresión 36,364x, vimos un pico de 2.27 397 IOPS o XNUMX GB/s con una latencia de XNUMX µs.

ScaleFlux CSD 2000 sql

Nuestro próximo conjunto de pruebas son nuestras cargas de trabajo de SQL: SQL, SQL 90-10 y SQL 80-20. Comenzando con SQL, ambas configuraciones de datos eran muy similares. El incompresible alcanzó un máximo de 188,269 167 IOPS y 190,370 µs de latencia, mientras que los datos comprimidos que van a la unidad alcanzaron un máximo de 167 XNUMX IOPS con una latencia de también XNUMX µs.

En SQL 90-10, el ScaleFlux CSD 2000 incompresible alcanzó un pico de 185,310 172 IOPS con una latencia de 4 µs. Con una compresión 220,615x en la unidad, alcanzó un pico de 144 XNUMX IOPS y una latencia de XNUMX µs.

SQL 80-20 tuvo el pico de la unidad incompresible en 179,482 177 IOPS con una latencia de 221,851 µs. En cuanto a la compresión que va al CSD, vimos un pico de 143 XNUMX IOPS con una latencia de XNUMX µs.

Lo siguiente son nuestras cargas de trabajo de Oracle: Oracle, Oracle 90-10 y Oracle 80-20. A partir de Oracle, el incompresible alcanzó un máximo de 184,048 194 IOPS y una latencia de 245,385 µs. Mirando la unidad con compresión, vimos un pico de 135 IOPS y una latencia de XNUMXµs.

ScaleFlux CSD 2000 oráculo

Oracle 90-10 tuvo un comienzo similar en rendimiento y latencia. La versión incompresible alcanzó un máximo de 155,641 141 IOPS con una latencia de 175,681 µs. Con la versión de compresión alcanzando un pico de 125 XNUMX IOPS con una latencia de XNUMX µs.

Las configuraciones de unidades de cabina Oracle 80-20 comenzaron por debajo de los 100 µs. Con datos incompresibles, el pico fue de 151,983 144 IOPS a 182,640 µs de latencia. Con datos comprimidos, vimos un rendimiento máximo de 120 XNUMX IOP con una latencia de XNUMX µs.

A continuación, cambiamos a nuestra prueba de clonación de VDI, completa y vinculada. Para el arranque VDI Full Clone (FC), ScaleFlux CSD 2000 sin datos incompresibles, la unidad alcanzó un pico de 127,616 263 IOPS con una latencia de 4 µs. El envío de la compresión 161,543x aumentó el rendimiento hasta 216 XNUMX IOPS con XNUMX µs de latencia.

Bota ScaleFlux CSD 2000 vdi fc

El inicio de sesión inicial de VDI FC nos proporcionó picos de 78,125 379 IOPS a 154,077 µs con datos incompresibles y 189 XNUMX IOPS a XNUMX µs con datos comprimidos.

Para VDI FC el lunes, la unidad incompresible alcanzó un máximo de 62,922 251 IOPS con una latencia de 4 µs. Con la compresión 100,680x, hubo un pico mucho más alto de 156 XNUMX IOPS con una latencia de solo XNUMX µs.

Para VDI Linked Clone (LC) Boot, los datos incompresibles de la unidad alcanzaron un máximo de 58,705 271 IOPS con una latencia de 4 µs. Cuando enviamos una compresión 81,137x a la unidad, alcanzó un máximo de 196 XNUMX IOPPS y una latencia de XNUMX µs.

Bota ScaleFlux CSD 2000 vdi lc

El inicio de sesión inicial de VDI LC tenía la unidad con datos incompresibles que alcanzaban un rendimiento máximo de 36,537 215 IOPS con una latencia de 4 µs. Cuando los datos comprimidos 56,739x llegaron a la unidad, alcanzaron un máximo de 137 XNUMX IOPS y una latencia de XNUMX µs.

Finalmente, con VDI LC Monday Login, la unidad incompresible alcanzó un máximo de 48,814 323 IOPS con una latencia de 81,799 µs. Con compresión, la SSD alcanzó un pico de 192 XNUMX IOPS con una latencia de XNUMX µs.

Conclusión

ScaleFlux se enfoca únicamente en el almacenamiento computacional. Esto se hace principalmente a través de sus SSD, conocidas como unidades de almacenamiento computacional (CSD) ScaleFlux. Estos son SSD PCIe Gen3 con motores de cómputo para mejorar el rendimiento y la eficiencia de los datos. La compañía tiene un puñado de unidades diferentes, pero para esta revisión, analizamos ScaleFlux CSD 2000.

El diferenciador principal entre la unidad ScaleFlux y otro almacenamiento computacional es el motor de compresión/descompresión de la ruta de datos. ScaleFlux afirma cuadruplicar la capacidad y duplicar el rendimiento, gracias a su tecnología computacional. Esto no solo influye en el rendimiento, sino que también podría reducir el costo por TB de almacenamiento SSD dadas las eficiencias de almacenamiento cuando los datos son altamente comprimibles.

Entonces, la principal preocupación es si funciona el motor de compresión. Eso fue un sí fácil, ya que manipulamos la compresión en nuestras pruebas desde el principio. Comenzamos con datos totalmente incompresibles y, como era de esperar, vimos una proporción de la unidad de 1:1. Al cambiar a una relación de compresión 4X, obtuvimos una tasa de compresión de 4.1:1 en la unidad. El primer paso crítico se cumplió con una marca de verificación antes de analizar el rendimiento.

Primero, echemos un vistazo a la unidad sin que se le envíen datos incompresibles. Los puntos destacados incluyen 589 4 IOPS en lectura 355K, 4 2.11 IOPS en escritura 64K, 1.5 GB/s en lectura 64 K y 188 GB/s en escritura 185 K. En SQL vimos picos de 90 10 IOPS, 179 80 IOPS en SQL 20-184 y 156 90 IOPS en SQL 10-152. Para nuestras cargas de trabajo de Oracle, vimos picos de 80 20 IOPS, 2000 128 IOPS en Oracle 78-63 y 59 37 IOPS en Oracle 49-XNUMX. Con nuestras pruebas de VDI Clone, el CSD XNUMX sin compresión nos dio XNUMX XNUMX IOPS en el arranque, XNUMX XNUMX IOPS en el inicio de sesión inicial y XNUMX XNUMX IOPS en el inicio de sesión del lunes para el clon completo. Para Linked Clone, la unidad nos proporcionó XNUMX XNUMX IOPS en el arranque, XNUMX XNUMX IOPS en el inicio de sesión inicial y XNUMX XNUMX IOPS en el inicio de sesión del lunes.

Una vez que enviamos datos comprimidos 4X, nos sorprendió gratamente ver el aumento de rendimiento en cada prueba, excepto en la lectura 4K, donde no hubo tanta diferencia. Los puntos destacados incluyen 573 4 IOPS en lectura 572K, 4 2.97 IOPS en escritura 64K, 2.27 GB/s en lectura 64 K y 190 GB/s en escritura 221 K. En SQL vimos picos de 90 10 IOPS, 222 80 IOPS en SQL 20-245 y 176 90 IOPS en SQL 10-183. Para Oracle, vimos picos de 80 20 IOPS, 162 154 IOPS en Oracle 101-81 y 57 82 IOPS en Oracle XNUMX-XNUMX. Con nuestras pruebas de VDI Clone, ScaleFlux con compresión nos brindó XNUMX XNUMX IOPS en el arranque, XNUMX XNUMX IOPS en el inicio de sesión inicial y XNUMX XNUMX IOPS en el inicio de sesión del lunes para el clon completo. Para Linked Clone, la unidad nos proporcionó XNUMX XNUMX IOPS en el arranque, XNUMX XNUMX IOPS en el inicio de sesión inicial y XNUMX XNUMX IOPS en el inicio de sesión del lunes.

El ScaleFlux CSD 2000 es realmente un producto interesante y apunta a una posible reorganización en el espacio SSD tradicional a medida que el almacenamiento computacional gana terreno. CSD existe desde hace muchos años, por lo que el concepto no es nuevo. Lo que probablemente falta es ejecución. Por su parte, ScaleFlux es el primero de cualquiera de los chicos de CSD en obtener algo en nuestro laboratorio. Aunque la confianza por sí sola no triunfa, la unidad tiene que funcionar.

En este caso, el rendimiento no son solo los números que ve en nuestros gráficos, aunque funcionó bien allí. La prueba en este pudín de SSD es su capacidad para funcionar bien contra datos comprimibles. Hace esto exactamente como se esperaba en nuestras pruebas, incluso ofrece un pequeño aumento de rendimiento en todos los perfiles de prueba menos uno. Para que este SSD tenga sentido, el caso de uso solo necesita alineación. Los datos comprimibles se beneficiarán enormemente de la tecnología ScaleFlux, sin duda. Siempre que no necesite soporte de virtualización de VMware o Windows en este momento, definitivamente vale la pena explorar el CSD 2000 en una prueba de concepto para ver cuánto se puede beneficiar su carga de trabajo.

Escala de flujo

Programe un PoC con ScaleFlux

Interactuar con StorageReview

Boletín informativo | Canal de YouTube | LinkedIn | @Instagram | Twitter | Facebook | @TikTokRSS Feed