Inicio Empresa Revisión de la serie Discovery de DataGravity

Revisión de la serie Discovery de DataGravity

Hay varias opciones disponibles para el almacenamiento en el mercado hoy en día. La mayoría de los diferenciadores que existen implican diferentes velocidades, más 9s en disponibilidad o soporte de GUI variable. En general, las matrices son muy similares; simplemente ofrecen diferentes precios y soporte o características que están dirigidas a un grupo determinado de clientes. DataGravity ha entrado en escena ofreciendo algo que realmente es diferente. El enfoque de DataGravity no está en qué tan rápido se pueden almacenar o recuperar los datos, ni se enfoca en cuántas unidades puede caber en un factor de forma de 2U; Al menos no todavía. DataGravity se trata de poder comprender sus datos y ayudar a los clientes a encontrarlos fácilmente, informar sobre ellos y garantizar el cumplimiento de las políticas internas o de la industria.


Hay varias opciones disponibles para el almacenamiento en el mercado hoy en día. La mayoría de los diferenciadores que existen implican diferentes velocidades, más 9s en disponibilidad o soporte de GUI variable. En general, las matrices son muy similares; simplemente ofrecen diferentes precios y soporte o características que están dirigidas a un grupo determinado de clientes. DataGravity ha entrado en escena ofreciendo algo que realmente es diferente. El enfoque de DataGravity no está en qué tan rápido se pueden almacenar o recuperar los datos, ni se enfoca en cuántas unidades puede caber en un factor de forma de 2U; Al menos no todavía. DataGravity se trata de poder comprender sus datos y ayudar a los clientes a encontrarlos fácilmente, informar sobre ellos y garantizar el cumplimiento de las políticas internas o de la industria.

Comprender el matiz de dónde encaja DataGravity es importante. Dentro de la empresa, a menudo hay equipos de seguridad y análisis de big data que se encargan de encontrar y proteger los datos, pero ese no es el mercado al que se dirige DataGravity. DataGravity está dirigido al mercado de rango medio que, en la mayoría de los casos, tiene un personal de TI limitado, pero los mismos desafíos de datos que las grandes empresas. ¿Por qué DataGravity enfocaría un proceso tan complicado en alguien que parece mal equipado para usarlo? Porque como afirma la fundadora de DataGravity, Paula Long, si puede navegar por la web, puede usar este producto. La automatización es la clave para resolver estos problemas.

La familia DataGravity Discovery Series funciona mediante la comprensión de los datos dentro de los archivos. Al poder sondear un documento de Word, por ejemplo, para comprobar los números de la seguridad social, la matriz DataGravity ofrece una visibilidad inmediata de los archivos que almacena una empresa. Luego, DataGravity puede comprender estos datos, informar sobre ellos y asegurarse de que la información confidencial no se comparta con partes inapropiadas. Además de comprender los datos almacenados en la matriz, se auditan todos los accesos a los archivos y la actividad de los usuarios, lo que ayuda a las empresas a cumplir con sus requisitos de cumplimiento y seguridad. Esta es una distinción importante para comprender qué es DataGravity y qué no es. DataGravity está muy enfocado en este caso de uso de datos no estructurados, que es un campo de juego común para los NAS y similares. Si bien son compatibles con iSCSI, NFS y SMB, el caso de uso principal de DataGravity no son los casos de uso de aplicaciones comerciales convencionales como el correo electrónico, la base de datos transaccional y demás. La plataforma puede llegar allí eventualmente, y probablemente lo hará, pero hoy su objetivo está muy bien definido. 

Datos como números de seguridad social, identificaciones de pacientes, números de teléfono, números de tarjetas de crédito y demás son fáciles de definir y comprender. De hecho, DataGravity admite muchas etiquetas de cumplimiento comunes listas para usar. Sin embargo, no se limita a esos. Para las organizaciones que tienen necesidades únicas, como muchas empresas, DataGravity ofrece un editor que permite a las organizaciones establecer sus propias etiquetas. Esto garantiza que los usuarios de la plataforma puedan responder rápidamente a los requisitos de seguridad, cumplimiento y eDiscovery que son específicos de su industria. La visibilidad de los datos almacenados también proporciona un mejor valor comercial al hacer que todo se pueda buscar, según las reglas de acceso, por supuesto. 

DataGravity ofrece arreglos en varias configuraciones que aprovechan los discos duros nearline para capacidad y flash como caché de lectura. Las unidades son de doble controlador, con cada controlador "activo" y haciendo un trabajo específico en el que profundizaremos más a continuación. El DG1100 viene con una capacidad de disco sin procesar de 18 TB y el DG1200 viene con 36 TB sin procesar. El DG2200 ofrece 48 TB y el DG2400 trae 96 TB a la mesa. Actualmente, estos no son ampliables, sin embargo, DataGravity ve claramente la necesidad de abordar esto; probablemente con estantes de expansión y/o una interfaz de administración que federa múltiples sistemas en una sola vista de administración. Nuestras pruebas para esta revisión se centran completamente en la usabilidad; pasamos dos días con DataGravity en su oficina de Nashua, NH y concluimos el trabajo de seguimiento de forma remota. Esto nos dio algo de tiempo práctico con una unidad DG1100. 

Arquitectura

DataGravity tiene controladores duales activo-activo con un giro. Normalmente, un controlador dual activo-activo significa que ambos controladores están activos con procesamiento de E/S. Sin embargo, con DataGravity, la arquitectura imita activo-pasivo, con el nodo principal sirviendo datos y el nodo de inteligencia manejando análisis de datos. DataGravity llama a esto "activo-proactivo". La configuración básica se ve así: varios GB de DRAM, NVRAM respaldada por batería, SSD para los metadatos y el caché, y luego discos duros nearline.

Con una cantidad no tan insignificante de datos que fluyen a través de la DRAM y la NVRAM respaldada por batería, DataGravity duplica las escrituras entre el nodo principal y el nodo de inteligencia como primera orden del día. Esto se hace a través de un puente PCIe interno, que ofrece un alto ancho de banda y una comunicación de baja latencia. Este enlace rápido se aprovecha en la arquitectura DataGravity para su protección y análisis de datos continuos. Los datos en tránsito se reflejan hasta que el nodo principal pueda confirmarlos en el disco. Al poner ambos controladores a trabajar, la serie Discovery aprovecha un nodo de almacenamiento principal para E/S de producción y pone el nodo secundario normalmente inactivo para trabajar como un nodo de inteligencia. El nodo de inteligencia aprovecha los metadatos y las escrituras de grano fino reflejadas en este controlador para una protección continua y un procesamiento analítico consciente de los datos.

Si bien activo-activo (o activo-proactivo en este caso) tiene la ventaja de usar lo que se ha pagado (frente a activo-pasivo donde el segundo nodo permanece inactivo hasta que falla el principal), una pregunta que siempre tiende a surgir: ¿Qué Qué sucede con el rendimiento si un nodo falla? Si DataGravity necesita dos nodos para hacer funcionar su magia y uno se pierde, ¿dónde deja eso a los clientes? En el caso de que falle un nodo, el nodo restante se encarga de lo básico para la producción. Los usuarios aún podrán acceder a los archivos y utilizarlos como lo harían en sus operaciones diarias normales. Sin embargo, la mayor parte de los análisis se suspenden hasta que se restaura el nodo fallido. En otras palabras, la disponibilidad permanece pero las características centradas en metadatos se reducen hasta la restauración del nodo. 

usabilidad

La GUI de DataGravity está basada en HTML 5 y presenta un diseño muy simple y útil. La pestaña de inicio tiene solo tres opciones para elegir: Descubrir, Almacenamiento o Sistema. A lo largo de la parte superior derecha, vemos el Panel de acceso global, que contiene íconos para el tablero del sistema y alertas, espacio de trabajo, perfil y ayuda en línea.

El panel del sistema brinda a los usuarios un vistazo rápido a las estadísticas, como la cantidad de puntos de montaje, el total de archivos protegidos, la asignación de grupos y las estadísticas de uso de datos.

La pestaña de alarmas del sistema es como suena, brindando a los usuarios una lista de alarmas y dónde ocurrieron dentro del sistema.

A la derecha de la pestaña de alarma se encuentra la pestaña Área de trabajo. Aquí los usuarios pueden cambiar el nombre o agregar espacios de trabajo. Los espacios de trabajo permiten a los usuarios configurar y administrar su vista privada del sistema. Los usuarios pueden configurar múltiples espacios de trabajo según sus necesidades. 

El siguiente ícono es el ícono de Perfiles. Al hacer clic en el ícono de Perfiles, un usuario autorizado tiene la capacidad de administrar su perfil; suscripciones de correo electrónico para búsquedas guardadas y puede cerrar sesión en el sistema. Al iniciar sesión, la GUI proporciona varios mosaicos que muestran información como el resumen de uso a lo largo del tiempo y la actividad reciente (cada uno desglosado por lecturas, actualizaciones, eliminaciones y, en el caso de uso, crea). También hay un diagrama de acordes que muestra quién es cada usuario. está colaborando y en qué capacidad.

Volviendo a la pestaña de inicio, el ícono más a la izquierda es el pan y la mantequilla de DataGravity, la pestaña Descubrir. Al hacer clic en la pestaña, los usuarios tienen opciones como búsqueda, tendencias, análisis de archivos, seguimiento de actividad y alertas de contenido.

La búsqueda es como suena. Aparece una barra de búsqueda y los usuarios solo necesitan ingresar la palabra clave o el nombre del archivo que están buscando. Antes de buscar, los usuarios deben seleccionar el punto de montaje en el que desean buscar. En la imagen a continuación, la búsqueda es "proyecto Woodstock". Esto devolvió todos los archivos en el punto de montaje público que contenían esos términos. Los filtros de la izquierda permiten ajustar aún más los resultados.

Las tendencias son similares a la búsqueda, solo que aquí los usuarios ingresan la palabra clave o la etiqueta que están buscando y la solución les dará una representación gráfica de los datos. Esto permite a las empresas ver cómo se accede a los datos en archivos activos y eliminados a lo largo del tiempo. En la tapa de pantalla debajo de la etiqueta de la tarjeta de crédito (CC) se ingresó en tendencia. Los resultados muestran la tendencia de los números de tarjetas de crédito a lo largo del tiempo en el punto de montaje público.

File Analytics es otro lugar donde DataGravity se separa del resto de los proveedores de almacenamiento. A través de este tablero, los usuarios pueden ver fácilmente los archivos compartidos y las máquinas virtuales representadas por bloques de colores en el lado derecho. Cuanto mayor sea la cuota, en cuanto a la capacidad que se consume, mayor será el bloque de color. Los usuarios también pueden ver los 10 usuarios principales por espacio consumido en un gráfico de barras, los usuarios más activos (cuanto más activo es el usuario, más grande aparece su nombre) y los datos inactivos y cuánto tiempo han estado inactivos agrupados por 1, 3, 6 , categorías de 9 y 12 meses.

Al hacer clic en un recurso compartido de archivos individual o en una máquina virtual, se desglosa aún más esta información. A la izquierda hay información sobre los usuarios más activos (medidos por las operaciones de lectura/escritura/eliminación) y los principales usuarios por espacio dentro del recurso compartido o VM. También hay una lista de datos inactivos. A la derecha hay cuatro mosaicos adicionales: distribución de etiquetas, recuento de archivos por categoría, distribución de archivos por tamaño y categorías de archivos a lo largo del tiempo. Al hacer clic en cada mosaico se proporcionan más detalles. 

La siguiente pestaña en la sección de descubrimiento es Seguimiento de actividad. Como su nombre lo indica, los administradores y los usuarios de seguridad pueden ver rápidamente qué usuario realizó qué actividad durante un período de tiempo específico. Los administradores solo necesitan elegir qué punto de montaje buscar y el usuario y el intervalo de fechas. 

La pestaña final en la sección Descubrir permite a los administradores administrar alertas de contenido. En el siguiente ejemplo, el administrador configuró alertas para recibir notificaciones cuando los números de la seguridad social o de las tarjetas de crédito se encuentran en formato de texto abierto, sin cifrar y en lugares a los que no pertenecen. Esto brinda a las empresas la capacidad de encontrar y mover rápidamente datos críticos que se han colocado en ubicaciones no seguras. 

La siguiente pestaña principal es la pestaña Almacenamiento. Aquí hay 8 subpestañas: Puntos de montaje, VM, Programación de DiscoveryPoint, Administración de inteligencia, Crear CIFS/SMB, Crear almacén de datos, Crear iSCSI y Crear NFS.

La pestaña Administrar puntos de montaje permite a los usuarios ver la configuración de cada punto de montaje, así como crear otros nuevos. Aquí los usuarios pueden ver la capacidad de cada punto de montaje (así como la cantidad utilizada), una breve descripción de cada uno, su política de protección y su estado. Cada nuevo punto de montaje creado aquí puede tener estas configuraciones ajustadas según sea necesario.

La pestaña Administrar máquinas virtuales es similar a la anterior. Aquí es posible ver y configurar información sobre las máquinas virtuales. Se muestra el nombre de la VM, así como su ubicación, sistema operativo, capacidad utilizada, política de protección, perfil de inteligencia y si la VM está en ejecución o apagada. Al hacer clic en una máquina virtual, se proporcionan detalles adicionales. 

La pestaña Gestión de inteligencia permite a los administradores configurar perfiles de inteligencia para casos de uso específicos y aplicarlos a puntos de montaje y máquinas virtuales. El botón Etiquetas permite a los administradores definir patrones o frases de contenido que contienen datos confidenciales mediante un editor de expresiones regulares integrado. 

Las siguientes cuatro pestañas se ocupan de la creación de un punto de montaje y su protocolo de acceso, ya sea CIFS/SMB, NFS DataStore compatible con VM, iSCSI o NFS (en la imagen a continuación). Los administradores agregan un nombre para el punto de montaje, agregan una descripción si así lo desean, seleccionan la capacidad, establecen la política de seguridad, definen la programación de DiscoveryPoint y eligen el perfil de inteligencia. 

La última sección principal es la pestaña Sistema. Al hacer clic en él, aparecen cuatro subpestañas: Administración del sistema, Acceso de usuarios, Políticas de notificación y Credenciales de VMware.

La pestaña System Mgmt tiene varias opciones, incluido System Health, que ofrece una vista del estado del sistema físico. A la izquierda hay una lista de todos los componentes de la solución. A la derecha hay una representación gráfica que le dará al usuario más información al pasar el cursor sobre ella.

También dentro de System Mgmt se encuentra la sección Storage Pools, que ofrece una vista de tres pools diferentes en el sistema DataGravity: el pool principal o el pool que se asigna para el uso diario, el pool de inteligencia y el pool libre para almacenamiento que tiene aún por asignar. Desde esta pantalla, los usuarios pueden cambiar el tamaño de los grupos según sea necesario.

También hay una opción para ver el rendimiento del sistema. La vista de rendimiento muestra la E/S de lectura y escritura y proporciona detalles como el rendimiento en MB/s, IOPS, latencia y profundidad de la cola. Los usuarios pueden ver el rendimiento durante un período de tiempo o ver una lectura del rendimiento en tiempo real.

Y finalmente, en System Mgmt, los administradores pueden ver los registros de auditoría. No solo pueden ver quién inició sesión y qué estaban haciendo, sino que los registros se pueden filtrar para facilitar el acceso a la visualización y reenviarlos a otro sistema para su posterior procesamiento.

DataGravity también se integra con VMware vRealize Operations Manager (vROPS) para mostrar los análisis del sistema DataGravity en la consola centralizada que proporciona vROPS. DataGravity no tiene una presencia virtual per se, por lo que esta integración le permite al administrador de virtualización ver el sistema sin iniciar sesión en la interfaz de usuario de DataGravity. Si bien toda la información está presente, las visualizaciones de datos son limitadas en comparación con la GUI de DataGravity.

La integración de vROPS muestra vistas resumidas de Discovery Series, DataStore o VM. A continuación se muestra una vista del panel de resumen de Discovery Series que muestra la capacidad y el rendimiento generales del sistema, así como la latencia de los almacenes de datos y las máquinas virtuales almacenadas en el sistema con la puntuación de riesgo de cada uno.

Al visualizar el panel Resumen del almacén de datos de DataGravity, se muestran métricas similares para los almacenes de datos NFS con reconocimiento de datos de DataGravity.

La integración de vROPS también muestra mapas de "calor" que muestran posibles áreas problemáticas basadas en valores predefinidos para la utilización del espacio y etiquetas de inteligencia crítica que se encuentran dentro de las máquinas virtuales, los almacenes de datos y el sistema Discovery Series.

Y los administradores de virtualización pueden ver qué datos en qué VM están en riesgo. A través del sistema de etiquetado, incluso pueden ver más específicamente el tipo de datos que están en riesgo.

Conclusión

Discovery Series de DataGravity es una matriz de almacenamiento que cambia el enfoque del rendimiento puro y las ventanas de copia de seguridad y recuperación para ser consciente de los datos. En otras palabras, DataGravity ha creado un sistema que brinda a los usuarios visibilidad de todos sus datos a través de una GUI fácil de usar. No solo permite a los usuarios ver dónde residen sus datos en el sistema, sino que les brinda un método detallado para rastrear los datos, quién accede a ellos y si los datos confidenciales pueden estar expuestos. DataGravity permite a los usuarios etiquetar la mayoría de los tipos de archivos, lo que ayuda a localizar y monitorear rápidamente archivos de datos específicos. Esto no solo puede hacer que los datos de una empresa sean más seguros al encontrar problemas (ya sean involuntarios o maliciosos), sino que también permite a una empresa utilizar por completo todos sus datos almacenados al comprender la ubicación de los datos, el acceso, las necesidades de retención y el cumplimiento. 

Normalmente, en StorageReview observamos el hardware subyacente y probamos su rendimiento a través de una serie de puntos de referencia. En el caso de DataGravity, el software es el punto de venta más fuerte. Si bien la empresa ofrece múltiples capacidades de 18 TB a 96 TB, y tienen una combinación de RAM, NVRAM, SSD y HDD nearline en su solución, el hardware subyacente existe para admitir la plataforma de análisis DataGravity. Por supuesto, todo el hardware existe para respaldar el software, sin embargo, la mayoría de los proveedores usan los dos en conjunto para brindar capacidades de almacenamiento clásicas. DataGravity no afirma ser el de mayor rendimiento o el de menor latencia. En cambio, el enfoque de DataGravity está en el conocimiento de los datos y la facilidad de uso. En este punto, la empresa se destaca claramente. 

El equipo de StorageReview fue al sitio para probar la solución. Dado que nuestro enfoque esta vez estaba en la usabilidad, no necesitábamos un dispositivo físico en nuestro laboratorio para ejecutar nuestras pruebas de rendimiento. Antes de que llegáramos, DataGravity ingirió una gran parte del contenido de nuestro sitio web en su matriz, brindándonos datos para buscar con los que estábamos íntimamente familiarizados. Con solo una descripción general básica del sistema, pudimos comenzar a usar la solución de manera intuitiva para buscar palabras clave en varios tipos de archivos, crear recursos compartidos, reasignar grupos de datos y ver cómo se rastreaba nuestro uso de la solución. 

En última instancia, lo que está haciendo DataGravity es excepcionalmente diferente del resto de la industria del almacenamiento. El equipo de veteranos decidió ir primero después de resolver problemas comerciales legítimos, utilizando la visibilidad del cumplimiento del almacenamiento como gancho. Este énfasis en la inteligencia es fundamental para lo que es DataGravity, que varía enormemente de las compras de almacenamiento tradicionales que se basan en una necesidad de capacidad o rendimiento. Si bien el enfoque de DataGravity tiene mucho sentido en las industrias reguladas, incluso nuestro caso de uso de pequeñas empresas vio beneficios inmediatos una vez que pudimos tener una visión detallada de incluso una parte de nuestro contenido externo. Combine esa información con la misma para los directorios de inicio de los usuarios, las carpetas compartidas para grupos de trabajo y el resto de los activos comerciales y los beneficios se acumulan rápidamente. También es muy intuitivo de usar, lo que hace que DataGravity sea una buena opción para tiendas de TI pequeñas o sobrecargadas.

Lo más importante es...

Discovery Series de DataGravity permite a las empresas hacer un uso completo de todos sus datos mientras los mantiene seguros y procesables a través de una interfaz fácil de usar. El énfasis en el análisis y la visibilidad de los datos es verdaderamente único en la industria del almacenamiento, lo que le da a DataGravity un importante punto de diferenciación en una industria que a menudo carece de creatividad.

Sitio de gravedad de datos

Discutir esta revisión

Suscríbase al boletín de StorageReview