Datrium ofrece "convergencia abierta", que es lo que ellos llaman la próxima generación de infraestructura convergente. Puede haber tantos cambios en la convergencia como proveedores en el espacio de TI empresarial y, por su parte, Datrium no tiene reparos en promover su visión de cómo puede ser la infraestructura. La visión de Datrium ve la computación, el almacenamiento primario, el almacenamiento secundario y la nube unidos en una configuración altamente resistente que es escalable y fácil de administrar sin un silo para cada clase de almacenamiento. Además, debido a que la mayoría de las llamadas de datos llegarán a los nodos de cómputo con memoria caché flash integrada, Datrium puede ofrecer un rendimiento tremendo sin tener que ir a los nodos de datos en casi todos los casos. Esto se traduce en 200 GB/s y 16 GB/s en un ancho de banda máximo de lectura y escritura de 32K y lectura aleatoria de 18M IOPS 4K.
Datrium ofrece "convergencia abierta", que es lo que ellos llaman la próxima generación de infraestructura convergente. Puede haber tantos cambios en la convergencia como proveedores en el espacio de TI empresarial y, por su parte, Datrium no tiene reparos en promover su visión de cómo puede ser la infraestructura. La visión de Datrium ve la computación, el almacenamiento primario, el almacenamiento secundario y la nube unidos en una configuración altamente resistente que es escalable y fácil de administrar sin un silo para cada clase de almacenamiento. Además, debido a que la mayoría de las llamadas de datos llegarán a los nodos de cómputo con memoria caché flash integrada, Datrium puede ofrecer un rendimiento tremendo sin tener que ir a los nodos de datos en casi todos los casos. Esto se traduce en 200 GB/s y 16 GB/s en un ancho de banda máximo de lectura y escritura de 32K y lectura aleatoria de 18M IOPS 4K.
Fundamentalmente, Datrium está compuesto por nodos de cómputo y nodos de almacenamiento que conforman el sistema DVX. Los nodos de cómputo pueden ser suministrados por Datrium, o los clientes pueden aprovechar su propia infraestructura de servidor existente. Los nodos de cómputo manejan el procesamiento de IO, manteniendo un caché localmente en flash. Flash puede ser casi cualquier cosa, desde unidades SATA de alta capacidad y bajo costo hasta NVMe de alto rendimiento. La decisión sobre flash depende completamente de la carga de trabajo y se puede ajustar para satisfacer las necesidades del cliente. Debido a que los datos persistentes residen en los nodos de datos, los nodos de cómputo no tienen estado y pueden desconectarse sin riesgo de pérdida o corrupción de datos, manteniendo la disponibilidad n-1. Datrium es compatible con una variedad de entornos, incluidos vSphere 5.5-6.5, Red Hat 7.3, CentOS 7 1611 y bare metal Docker 1.2.
Los nodos de datos mantienen copias persistentes de los datos y están disponibles en configuraciones de disco o flash. Dentro de Datrium DVX, los datos siempre se comprimen, se deduplican globalmente y se codifican con borrado con doble tolerancia a fallas. Datrium también ofrece cifrado, instantáneas y replicación dentro de DVX. Los nodos de datos se basan en los nodos de cómputo para todo el procesamiento, lo que mantiene el sistema de almacenamiento libre para entregar IO a través de controladores duales intercambiables en caliente. Los nodos de datos incluyen NVRAM duplicada respaldada por batería para escrituras rápidas y redes Ethernet de alta velocidad con equilibrio de carga y conmutación por error de ruta. Los nodos más recientes de Datrium incluyen DVX con Flash de extremo a extremo. Esto significa que hay flash en los nodos de cómputo, junto con nodos de datos DVX all-flash. El nodo de datos F12X2 tiene 16 TB de almacenamiento utilizable (12 SSD de 1.92 TB), con una capacidad efectiva de hasta 32-96 TB con una reducción de datos de 2-6x y soporte para redes de 25 GbE. El último nodo de cómputo, CN2100, agrega nuevas CPU Skylake, compatibilidad con NVMe y redes de hasta 25 GbE.
Esta revisión es única en el sentido de que tuvimos acceso a un entorno de prueba de Datrium de forma remota, configurado con 32 nodos de cómputo Dell PowerEdge C6320 y 10 nodos de datos all-flash Datrium DVX.
- 32 servidores Dell PowerEdge C6320
- VMware ESXi 6.0 Update3 instalado
- CPU Dual Xeon E5-2697 v4 CPU
- memoria 128GB
- 4 SSD Samsung PM1.92a de 863 TB como caché de datos
- 2 NIC de 10 Gb/s (administración/datos)
- Configuración de red
- 10 F12X2 Nodos de datos en el conmutador principal
- 32 nodos de computación en 8 conmutadores TOR
- Cada conmutador TOR tiene un enlace ascendente de 160 Gbps al conmutador central
Gestionamiento
El DVX se administra con una interfaz de usuario basada en HTML5 a través del navegador o como un complemento de VMware vCenter. Toda la premisa de la interfaz de usuario de DVX se basa en la simplicidad, lo que elimina la necesidad de administrar el almacenamiento de la manera tradicional. Todo sucede desde la misma interfaz de usuario, desde el aprovisionamiento de almacenamiento hasta la administración de replicaciones.
De un vistazo rápido, los usuarios pueden encontrar información de rendimiento con respecto al IOPS de la máquina virtual del clúster, el rendimiento, las velocidades de transferencia de la red, así como la latencia promedio de lectura/escritura de Datrium junto con las tasas de aciertos del flash del host. Dada la estructura en niveles de la plataforma Datrium DVX, es útil verificar los niveles de rendimiento entre los hosts y los nodos de datos subyacentes para medir el rendimiento general. Además de las métricas de rendimiento, se proporciona la capacidad utilizable total que muestra la huella total de datos junto con el espacio de instantáneas, así como las métricas actuales de reducción de datos.
Un elemento interesante a tener en cuenta en las capturas de pantalla anteriores es el tráfico de red (donde uno muestra actividad de escritura aleatoria de 4K y el otro actividad de lectura). Dado que Datrium DVX aprovecha el flash del lado del host para la actividad de lectura y compromete la actividad de escritura en los nodos de datos, puede verlo representado en las velocidades de la red. En nuestra prueba aleatoria de 4K, la actividad de la red se midió a 7.3 GB/s, mientras que en nuestra prueba de lectura en la que los datos se extrajeron de la memoria flash del host interno, el tráfico de la red fue inexistente.
Puntos de referencia de rendimiento
Para medir el rendimiento de un clúster tan grande, elegimos HCIBench de VMware por su facilidad de implementación y capacidad para agregar datos de rendimiento en cientos de máquinas virtuales vdbench. Para un clúster grande, esta herramienta nos permitió aumentar rápidamente las cargas de trabajo comúnmente utilizadas para medir el almacenamiento empresarial, así como también permitirnos trabajar con datos que tienen un patrón repetitivo definido por el usuario. Para las plataformas que ofrecen servicios de reducción de datos, brinda a los usuarios la oportunidad de mostrar el rendimiento en situaciones más cercanas al mundo real. En este caso, usamos una configuración de compresión 2:1 para cada una de nuestras cargas de trabajo. Debe tenerse en cuenta que se estaban ejecutando todos los puntos de referencia, la compresión, la deduplicación y la codificación de borrado en línea. En otras palabras, todos los puntos de referencia se realizaron en condiciones operativas reales.
En nuestro HCIbench 4K, analizamos el rendimiento aleatorio máximo con un perfil de carga de trabajo 4K completamente aleatorio. El Datrium DVX pudo alcanzar 9.5725 GB/s de lectura y 2.524 GB/s de escritura.
A continuación, observamos el pico de E/S en el mismo perfil 4K. Aquí, el Datrium DVX tuvo otra actuación impresionante con más de 2.45 millones de IOPS de lectura y 646,162 XNUMX IOPS de escritura.
La siguiente métrica analiza la latencia promedio del perfil de carga de trabajo 4K completamente aleatorio. Si bien la latencia no es del todo inferior a un milisegundo, el DVX aún pudo alcanzar una lectura impresionante de 1.05 ms y una escritura de 3.96 ms.
Nuestra próxima prueba analiza un perfil de datos aleatorios de 8K más grande con una combinación de 70 % de actividad de lectura y 30 % de actividad de escritura. El rendimiento del DVX aquí fue de 9,229.5 GB/s. En cuanto a la E/S máxima, el DVX pudo alcanzar más de 1.18 millones de IOPS. La latencia de 8K 70/30 resultó ser de solo 2.17 ms.
La última carga de trabajo cambia a un enfoque de ancho de banda máximo, que consiste en un perfil de lectura y escritura secuencial de 32K. Aquí, el DVX pudo alcanzar una lectura masiva de 42.16 GB/s y una escritura de 13.26 GB/s.
En cuanto a la E/S máxima para la misma carga de trabajo, el DVX continúa presentando números impresionantes con más de 1.349 millones de IOPS de lectura y 424,282 XNUMX IOPS de escritura.
Con todos los números altos que DVX presentó en la prueba de 32K, superó todo con una latencia bastante baja de 1.9 ms de lectura y 6.02 ms de escritura.
Al ser una plataforma convergente, la utilización de la CPU es un factor importante a tener en cuenta, ya que parte de la sobrecarga de almacenamiento proviene de los mismos sistemas aprovechados para operar las cargas de trabajo. Mientras monitoreábamos la plataforma durante cada carga de trabajo, analizamos el rendimiento total del clúster (ambos lados de la ecuación), incluidos los trabajadores de HCIbench que aprovechan vdbench, repartidos por todo el clúster combinado con la sobrecarga de las máquinas virtuales de almacenamiento.
Durante la gran actividad de escritura secuencial (donde gran parte del trabajo se descarga directamente a los nodos flash), vimos menos del 40 % del total de recursos del sistema utilizados. Durante la actividad de lectura intensa, como en la carga de trabajo de lectura aleatoria de 4K, esta métrica aumentó a poco más del 60 %. Entonces, incluso con el sistema sirviendo la carga de trabajo y las máquinas virtuales consumiendo la carga de trabajo, nos quedó el 60 % de los recursos de la CPU para otras aplicaciones y cargas de trabajo, y en el peor de los casos se redujo al 40 %. Por lo tanto, con el modo insano en ejecución (40 % de utilización máxima del host frente al 20 % normal) en el peor de los casos con servicios de datos en línea completos, a la plataforma Datrium aún le sobraban muchos recursos del sistema.
Conclusión
La familia Datrium DVX se ha actualizado para admitir la última generación de recursos informáticos y de almacenamiento. En este caso, echamos un vistazo a la configuración flash de un extremo a otro, que incluye un caché flash en los nodos de cómputo, junto con nodos de datos all-flash para almacenamiento persistente. La plataforma de "convergencia abierta" de Datrium también incluye los servicios de datos que generalmente se encuentran en productos más maduros; con Datrium DVX, los datos siempre se comprimen, se deduplican globalmente y se codifican con borrado con doble tolerancia a fallas. Los clientes pueden optar por usar los nodos de cómputo de Datrium, pero como es el caso en esta revisión, eso no es obligatorio (nuestra prueba aprovechó 32 nodos Dell PowerEdge). Estos nodos de cómputo manejan el procesamiento de E/S y la memoria caché con una sobrecarga mínima de hasta el 20 %. Sin embargo, para instancias que exigen un mayor rendimiento de almacenamiento, DVX se puede poner en modo insano, donde DVX puede utilizar hasta el 40 % de los recursos informáticos.
Por el lado del rendimiento, optamos por los puntos de referencia de HCIbench, ya que reflejarían mejor lo que Datrium DVX es realmente capaz de hacer en un entorno de mayor escala. Desde el principio, el DVX all-flash estaba logrando cifras impresionantes. En los puntos de referencia de 4K, el DVX alcanzó un rendimiento de más de 9.57 GB/s y 2.45 millones de IOPS de lectura y más de 2.52 GB/s y 646 1.05 IOPS de escritura. El DVX logró estos números con una latencia tan baja como 3.96 ms de lectura y 8 ms de escritura. Cambiando a 70K 30% lectura 9.2% escritura, el DVX impresionó una vez más con un rendimiento de más de 1.18 GB/s, más de 2.17 millones de IOPS, todo con una latencia de 32 ms. En nuestra prueba secuencial de 42.16K, el DVX alcanzó una sorprendente lectura de 1.349 GB/s y más de 1.9 millones de IOPS, con una latencia de XNUMX ms.
Claramente, el giro de Datrium sobre la convergencia es único. Aprovechar la CPU "sobrante" de los nodos de cómputo con flash localizado tiene mucho sentido, al mismo tiempo que se puede mantener el flash para el almacenamiento persistente para todos los beneficios del TCO. Un factor clave para que esto funcione son las eficiencias de almacenamiento que ofrece el sistema DVX, que son fundamentales para aprovechar al máximo la memoria flash en los nodos de datos. Para aquellos que necesitan aún más rendimiento, es bastante fácil colocar almacenamiento NVMe en los nodos de cómputo, aunque claramente lo hicimos muy bien con una opción de menor costo. Sin embargo, nada de rendimiento significa mucho sin resiliencia. Con DVX, los nodos de cómputo no tienen estado y admiten un modelo de tolerancia a fallas del servidor N-1. Eso significa que podríamos perder 31 de los 32 servidores en nuestra configuración de prueba y todos los datos permanecen disponibles. Incluso si se perdieron todos los servidores, DVX no perderá datos, ya que la copia autorizada de los datos se almacena y protege en los nodos de datos, no en los nodos de cómputo.
En última instancia, hay pocas cosas tan emocionantes en la TI empresarial en este momento como la infraestructura convergente. Si bien hay muchas maneras de ejecutar esa visión, Datrium ha elaborado su presentación para DVX que incluye servicios de gestión de datos profundos combinados con un excelente perfil de rendimiento. Sin embargo, pocos en el espacio de convergencia se han ejecutado tanto en rendimiento como en funciones, lo que convierte a DVX de Datrium en una oferta bien armada que se destaca claramente entre la multitud.
Suscríbase al boletín de StorageReview