Home Empreendimento Revisão completa do Datrium DVX com Flash

Revisão completa do Datrium DVX com Flash

by Laboratório StorageReview Enterprise

A Datrium oferece “convergência aberta”, que é como eles chamam a próxima geração de infraestrutura convergente. Pode haver tantos riffs de convergência quanto fornecedores no espaço corporativo de TI e, por sua vez, a Datrium não tem vergonha de promover sua visão de como pode ser a infraestrutura. A visão da Datrium vê computação, armazenamento primário, armazenamento secundário e nuvem reunidos em uma configuração altamente resiliente que é escalável e fácil de gerenciar sem um silo para cada classe de armazenamento. Além disso, como a maioria das chamadas de dados atingirá os nós de computação com cache flash integrado, o Datrium pode oferecer um desempenho tremendo sem precisar ir aos nós de dados em quase todos os casos. Isso se traduz em 200 GB/s e 16 GB/s no pico de largura de banda de leitura e gravação de 32K e leitura aleatória de 18M IOPS 4K.


A Datrium oferece “convergência aberta”, que é como eles chamam a próxima geração de infraestrutura convergente. Pode haver tantos riffs de convergência quanto fornecedores no espaço corporativo de TI e, por sua vez, a Datrium não tem vergonha de promover sua visão de como pode ser a infraestrutura. A visão da Datrium vê computação, armazenamento primário, armazenamento secundário e nuvem reunidos em uma configuração altamente resiliente que é escalável e fácil de gerenciar sem um silo para cada classe de armazenamento. Além disso, como a maioria das chamadas de dados atingirá os nós de computação com cache flash integrado, o Datrium pode oferecer um desempenho tremendo sem precisar ir aos nós de dados em quase todos os casos. Isso se traduz em 200 GB/s e 16 GB/s no pico de largura de banda de leitura e gravação de 32K e leitura aleatória de 18M IOPS 4K.

Fundamentalmente, o Datrium é feito de nós de computação e nós de armazenamento que compõem o sistema DVX. Os nós de computação podem ser fornecidos pela Datrium ou os clientes podem aproveitar sua própria infraestrutura de servidor existente. Os nós de computação lidam com o processamento de E/S, mantendo um cache localmente em flash. Flash pode ser praticamente qualquer coisa, desde unidades SATA de alta capacidade e baixo custo até NVMe de alto desempenho. A decisão sobre flash depende inteiramente da carga de trabalho e pode ser ajustada para atender às necessidades do cliente. Como os dados persistentes residem nos nós de dados, os nós de computação não têm estado e podem ficar offline sem risco de perda ou corrupção de dados, mantendo a disponibilidade n-1. O Datrium oferece suporte a uma variedade de ambientes, incluindo vSphere 5.5-6.5, Red Hat 7.3, CentOS 7 1611 e bare metal Docker 1.2.

Os nós de dados mantêm cópias persistentes de dados e estão disponíveis em configurações de disco ou flash. No Datrium DVX, os dados são sempre compactados, desduplicados globalmente e codificados para eliminação com dupla tolerância a falhas. A Datrium também oferece criptografia, instantâneos e replicação no DVX. Os nós de dados contam com os nós de computação para todo o processamento, mantendo o sistema de armazenamento livre para fornecer E/S por meio de controladores duplos de troca a quente. Os nós de dados incluem NVRAM espelhada com bateria para gravações rápidas e rede Ethernet de alta velocidade com balanceamento de carga e failover de caminho. Os nós mais recentes da Datrium incluem DVX com Flash de ponta a ponta. Isso significa que há flash nos nós de computação, juntamente com nós de dados DVX totalmente flash. O nó de dados F12X2 tem armazenamento utilizável de 16 TB (12 × 1.92 TB SSDs), com capacidade efetiva de até 32-96 TB com redução de dados de 2 a 6 vezes e suporte para rede de 25 GbE. O nó de computação mais recente, CN2100, adiciona novas CPUs Skylake, suporte a NVMe e rede de até 25 GbE.

Esta análise é um tanto única porque tivemos acesso a um ambiente de teste Datrium remotamente, configurado com 32 nós de computação Dell PowerEdge C6320 e 10 nós de dados totalmente flash Datrium DVX.

  • 32 servidores Dell PowerEdge C6320
    • VMware ESXi 6.0 Update3 instalado
    • CPUs Dual Xeon E5-2697 v4
    • memória 128GB
    • 4 x SSD Samsung PM1.92a de 863 TB como cache de dados
    • 2 x NIC de 10 Gb/s (gerenciamento/dados)
  • Configuração de Rede
    • 10 nós de dados F12X2 no switch principal
    • 32 nós de computação em 8 switches TOR
    • Cada switch TOR tem uplink de 160 Gbps para o switch principal

Gestão de Sistemas

O DVX é gerenciado com uma interface de usuário baseada em HTML5 por meio do navegador ou como um plug-in do VMware vCenter. Toda a premissa da interface do usuário do DVX depende da simplicidade, eliminando a necessidade de gerenciar o armazenamento da maneira tradicional. Tudo acontece na mesma interface do usuário, desde o provisionamento de armazenamento até o gerenciamento de replicações.

Com uma rápida olhada, os usuários podem encontrar informações de desempenho sobre cluster VM IOPS, taxa de transferência, velocidades de transferência de rede, bem como a latência média de leitura/gravação do Datrium juntamente com as taxas de acerto do flash do host. Dada a estrutura em camadas da plataforma Datrium DVX, verificar os níveis de desempenho entre os hosts e os nós de dados subjacentes é útil para medir o desempenho geral. Além das métricas de desempenho, é fornecida a capacidade total utilizável que mostra a pegada de dados total junto com o espaço de instantâneo, bem como as métricas atuais de redução de dados.

Um item interessante a ser observado nas capturas de tela acima é o tráfego de rede (onde um mostra a atividade de gravação aleatória de 4K e a outra atividade de leitura). Como o Datrium DVX aproveita o flash do lado do host para atividade de leitura e confirma a atividade de gravação nos nós de dados, você pode ver isso representado nas velocidades da rede. Em nosso teste aleatório de 4K, a atividade de rede foi medida em 7.3 GB/s, enquanto em nosso teste de leitura, onde os dados foram extraídos do flash do host interno, o tráfego de rede era inexistente.

Benchmarks de desempenho

Para medir o desempenho de um cluster tão grande, escolhemos o HCIBench da VMware por sua facilidade de implantação e capacidade de agregar dados de desempenho em centenas de VMs vdbench. Para um cluster grande, essa ferramenta nos permitiu aumentar rapidamente as cargas de trabalho comumente usadas para medir o armazenamento corporativo, além de nos permitir trabalhar com dados que possuem um padrão de repetição definido pelo usuário. Para plataformas que oferecem serviços de redução de dados, ele oferece aos usuários a chance de mostrar o desempenho em situações mais próximas do mundo real. Nesse caso, usamos uma configuração de compactação 2:1 para cada uma de nossas cargas de trabalho. Deve-se observar que todos os benchmarks, compactação, desduplicação e codificação de eliminação em linha estavam em execução. Em outras palavras, todos os benchmarks foram conduzidos em uma condição operacional completa no mundo real.

Em nosso HCIbench 4K, observamos o pico de taxa de transferência aleatória com um perfil de carga de trabalho 4K totalmente aleatório. O Datrium DVX foi capaz de atingir 9.5725 GB/s de leitura e 2.524 GB/s de gravação.

Em seguida, examinamos o pico de E/S no mesmo perfil 4K. Aqui, o Datrium DVX teve outra exibição impressionante com mais de 2.45 milhões de IOPS lidos e 646,162 IOPS gravados.

A próxima métrica analisa a latência média do perfil de carga de trabalho 4K totalmente aleatório. Embora não seja uma latência abaixo de milissegundos, o DVX ainda foi capaz de atingir impressionantes 1.05 ms de leitura e 3.96 ms de gravação.

Nosso próximo teste analisa um perfil de dados aleatórios de 8K maior com uma mistura de 70% de leitura e 30% de atividade de gravação. A taxa de transferência do DVX aqui foi de 9,229.5 GB/s. Olhando para o pico de I/O, o DVX foi capaz de atingir mais de 1.18 milhões de IOPS. A latência 8K 70/30 acabou sendo de apenas 2.17ms.

A última carga de trabalho alterna para um foco de largura de banda de pico, consistindo em um perfil sequencial de leitura e gravação de 32K. Aqui, o DVX foi capaz de atingir 42.16 GB/s de leitura e 13.26 GB/s de gravação.

Observando o pico de E/S para a mesma carga de trabalho, o DVX continua apresentando números impressionantes com mais de 1.349 milhão de IOPS lidos e 424,282 IOPS gravados.

Com todos os números altos que o DVX estava apresentando no teste de 32K, ele superou tudo com uma latência bastante baixa de 1.9ms de leitura e 6.02ms de gravação.

Por ser uma plataforma convergente, a utilização da CPU é um fator importante a ser considerado, pois parte da sobrecarga de armazenamento vem dos mesmos sistemas aproveitados para operar as próprias cargas de trabalho. Ao monitorar a plataforma durante cada carga de trabalho, analisamos o desempenho total do cluster (ambos os lados da equação), incluindo os trabalhadores do HCIbench que utilizam o vdbench, espalhados pelo cluster combinado com a sobrecarga das próprias VMs de armazenamento.

Durante a pesada atividade de gravação sequencial (onde grande parte do trabalho é descarregada diretamente para os nós flash), vimos menos de 40% do total de recursos do sistema usados. Durante a atividade de leitura pesada, como na carga de trabalho de leitura aleatória de 4K, essa métrica aumentou para pouco mais de 60%. Portanto, mesmo com o sistema atendendo à carga de trabalho e as VMs consumindo a carga de trabalho, tínhamos 60% dos recursos da CPU sobrando para outros aplicativos e cargas de trabalho e, no pior dos casos, caiu para 40%. Portanto, com o Modo Insano em execução (utilização máxima do host de 40% contra 20% normalmente) em um cenário de pior caso com serviços completos de dados em linha funcionando, a plataforma Datrium ainda tinha muitos recursos de sistema sobrando.

Conclusão

A família Datrium DVX foi atualizada para suportar a última geração de armazenamento e recursos de computação. Nesse caso, analisamos a configuração flash de ponta a ponta, que inclui um cache flash nos nós de computação, juntamente com nós de dados totalmente flash para armazenamento persistente. A plataforma de “convergência aberta” da Datrium também inclui os serviços de dados geralmente encontrados em produtos mais maduros; com o Datrium DVX, os dados são sempre compactados, desduplicados globalmente e codificados para eliminação com dupla tolerância a falhas. Os clientes podem optar por usar os nós de computação da Datrium, mas, como é o caso desta análise, isso não é necessário (nossos testes utilizaram 32 nós Dell PowerEdge). Esses nós de computação lidam com o processamento de E/S e o cache com sobrecarga mínima de até 20%. No entanto, para instâncias que exigem mais desempenho de armazenamento, o DVX pode ser colocado no modo insano, no qual o DVX pode utilizar até 40% dos recursos de computação.

Do lado do desempenho, optamos pelos benchmarks HCIbench, pois eles refletiriam melhor o que o Datrium DVX é realmente capaz de fazer em um ambiente de grande escala. Logo de cara, o DVX totalmente flash estava apresentando números impressionantes. Em benchmarks de 4K, o DVX atingiu uma taxa de transferência de mais de 9.57 GB/s e 2.45 milhões de IOPS de leitura e mais de 2.52 GB/s e gravação de 646 K IOPS. O DVX conseguiu esses números com latência tão baixa quanto 1.05 ms de leitura e 3.96 ms de gravação. Mudando para 8K 70% leitura 30% gravação, o DVX mais uma vez impressionou com uma taxa de transferência acima de 9.2 GB/s, mais de 1.18 milhão de IOPS, tudo com uma latência de 2.17 ms. Em nosso teste sequencial de 32K, o DVX atingiu incríveis 42.16 GB/s de leitura e mais de 1.349 milhão de IOPS, com uma latência de 1.9 ms.

Claramente, a rotação de Datrium na convergência é única. Aproveitar a CPU “sobra” dos nós de computação com flash localizado faz muito sentido, enquanto ainda é possível manter o flash para armazenamento persistente para todos os benefícios de TCO. Um fator-chave para fazer isso funcionar são as eficiências de armazenamento que o sistema DVX oferece, que são essenciais para obter o máximo do flash nos nós de dados. Para aqueles que precisam de ainda mais desempenho, é fácil colocar o armazenamento NVMe nos nós de computação, embora tenhamos nos saído muito bem com uma opção de custo mais baixo. No entanto, nenhum desempenho significa muito sem resiliência. Com o DVX, os nós de computação não têm estado e oferecem suporte a um modelo de tolerância a falhas de servidor N-1. Isso significa que podemos perder 31 dos 32 servidores em nossa configuração de teste e todos os dados permanecem disponíveis. Mesmo se todos os servidores forem perdidos, o DVX não perderá dados, pois a cópia autoritativa dos dados é armazenada e protegida nos nós de dados, não nos nós de computação.

Em última análise, há pouco mais empolgante na TI corporativa agora do que a infraestrutura convergente. Embora existam muitas maneiras de executar essa visão, a Datrium elaborou sua proposta para DVX, que inclui serviços de gerenciamento de dados profundos combinados com um excelente perfil de desempenho. No entanto, poucos no espaço de convergência executaram desempenho e recursos, tornando o DVX da Datrium uma oferta bem armada que se destaca distintamente da multidão.

Local de Datrium

Discuta esta avaliação

Inscreva-se no boletim informativo StorageReview