Home Empreendimento Análise totalmente flash do VMware VSAN 6.2

Análise totalmente flash do VMware VSAN 6.2

by Laboratório StorageReview Enterprise

No ano passado publicamos um série detalhada de análises sobre o Virtual SAN 6.0 em uma configuração híbrida. Em fevereiro deste ano, VMware lançou o VSAN 6.2, que trouxe redução de dados via desduplicação e compactação, além de vários outros recursos para o mercado. A redução de dados é um grande avanço para o Virtual SAN, pois ele pega carona no grande aumento na adoção do flash, graças em grande parte à queda de preços e às opções de alta qualidade. Quando o Virtual SAN é ativado em uma configuração totalmente flash, os usuários que aproveitam a redução de dados podem efetivamente triplicar (ou mais) sua capacidade, dependendo das cargas de trabalho, o que realmente traz o valor do flash para todos, desde o ROBO até a empresa. 


No ano passado publicamos um série detalhada de análises sobre o Virtual SAN 6.0 em uma configuração híbrida. Em fevereiro deste ano, VMware lançou o VSAN 6.2, que trouxe redução de dados via desduplicação e compactação, além de vários outros recursos para o mercado. A redução de dados é um grande avanço para o Virtual SAN, pois ele pega carona no grande aumento na adoção do flash, graças em grande parte à queda de preços e às opções de alta qualidade. Quando o Virtual SAN é ativado em uma configuração totalmente flash, os usuários que aproveitam a redução de dados podem efetivamente triplicar (ou mais) sua capacidade, dependendo das cargas de trabalho, o que realmente traz o valor do flash para todos, desde o ROBO até a empresa. 

À medida que continuamos em nossa análise do VSAN, aproveitamos o mesmo cluster Dell PowerEdge R730xd que usamos na análise híbrida anterior. Fizemos atualizações na plataforma, incluindo BIOS, firmware e ESXi para torná-la compatível com VSAN 6.2. Uma das maiores mudanças, no entanto, é substituir nossos HDDs e SSDs existentes por uma nova configuração totalmente flash, cortesia da Toshiba. Aproveitando alguns dos SSDs SAS3 mais rápidos do mercado, podemos colocar toda a nossa atenção no próprio VSAN, sem que o hardware o impeça.

Dell PowerEdge R730xd VMware All-Flash VSAN Especificações

  • Servidores Dell PowerEdge R730xd (x4)
  • CPUs: Oito Intel Xeon E5-2697 v3 2.6GHz (14C/28T)
  • Memória: 64 x 16 GB DDR4 RDIMM
  • SSD:
    • Cache: 16 x 400 GB Toshiba PX04 SAS3 de gravação intensiva
    • Capacidade: 80 x 960 GB Toshiba PX04 SAS3 de leitura intensiva
  • Rede: 4 x Intel X520 DP 10 Gb DA/SFP+, + I350 DP 1 Gb Ethernet
  • Capacidade de armazenamento: 69.86 TB

As unidades Toshiba usadas para esta análise foram as Modelos Toshiba PX04S. Em nossa análise anterior, descobrimos que os modelos PX04S eram os SSDs corporativos SAS mais rápidos que testamos até agora. O PX04S também foi o SSD SAS de porta dupla de maior capacidade quando foi analisado. A série PX04S vem em vários níveis de resistência, variando de alta resistência a baixa resistência com modelos de resistência média e econômica também. Para esta análise, preenchemos o Dell PowerEdge R730xd com dezesseis unidades de gravação intensiva de 400 GB (PX04SHB040) e oitenta unidades de resistência de valor de 960 GB (PX04SVB096). As unidades de gravação intensiva possuem até 25DWPD e as unidades de resistência de valor até 3DWPD. Em comparação, na configuração híbrida com os mesmos servidores, a camada de cache era composta por quatro SSDs Toshiba PX02 de 800 GB por host, obtendo o dobro da capacidade da camada de cache.

Especificações da unidade de gravação intensiva de 04 GB PX040SHB400:

  • Desempenho
    • Leitura sequencial sustentada de 64 KiB: 1,900 MiB/s
    • Gravação sequencial sustentada de 64 KiB: 850 MiB/s
    • Leitura aleatória sustentada de 4KiB: 270K IOPS
    • Gravação aleatória sustentada de 4KiB: 125K IOPS
  • DWDP: 25

Especificações da unidade PX04SVB096 960GB de valor e resistência:

  • Desempenho
    • Leitura sequencial sustentada de 64 KiB: 1,900 MiB/s
    • Gravação sequencial sustentada de 64 KiB: 850 MiB/s
    • Leitura aleatória sustentada de 4KiB: 270K IOPS
    • Gravação aleatória sustentada de 4KiB: 60K IOPS
  • DWDP: 3

Análise de carga de trabalho do aplicativo

Para esta revisão, repovoamos o Dell PowerEdge R730xd VMware VSAN com todos os SSDs Toshiba PX04 SAS3. Os primeiros benchmarks consistem no Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TPC-C simulada.

Cada VM do SQL Server é configurada com dois vDisks, um de 100 GB para inicialização e outro de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Esses testes são projetados para monitorar o desempenho de um aplicativo sensível à latência no cluster com uma carga de computação e armazenamento moderada, mas não excessiva.

Configuração de teste do SQL Server (por VM)

  • Windows Server 2012 R2
  • Ocupação de armazenamento: 600 GB alocados, 500 GB usados
  • SQL Server 2014
    • Tamanho do banco de dados: escala 1,500
    • Carga de cliente virtual: 15,000
    • Memória RAM: 48 GB
  • Duração do teste: 3 horas
    • 2.5 horas de pré-condicionamento
    • período de amostra de 30 minutos

No teste TPC-C do SQL Server em plataformas hiperconvergentes, analisamos o equilíbrio da carga de trabalho no cluster no modo híbrido, no modo totalmente flash (AF) e na redução de dados totalmente flash (AF DR). A versão AF apresentou um desempenho um pouco mais forte em relação ao híbrido, com VMs individuais rodando de 3,112.4 TPS a 3,130.4 TPS, com uma pontuação agregada de 12,472.8 TPS, a maior pontuação geral. A configuração de DR estava na extremidade inferior das configurações de teste, com VMs individuais rodando de 2,982.1 TPS a 3,009.6 TPS, com uma pontuação agregada de 11,969.1 TPS.

Para o teste SQL Server TPC-C, a variável à qual prestamos mais atenção é a latência média. Pequenas lacunas no desempenho transacional não mostrarão a história completa. Em nosso teste de latência média, vimos que a pontuação mais alta da versão AF, 64ms, era igual à pior pontuação da versão híbrida. A AF também teve uma pontuação média de 53ms. Mais uma vez, a configuração DR ficou na parte inferior do pacote, com um mínimo de 236ms, um máximo de 278ms e uma média de 261ms.

Desempenho do Sysbench

Cada VM do Sysbench é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (400 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.

Configuração de teste do Sysbench (por VM)

  • CentOS 6.3 64 bits
  • Pegada de armazenamento: 1 TB, 800 GB usados
  • Percona XtraDB 5.5.30-rel30.1
    • Tabelas de banco de dados: 100
    • Tamanho do banco de dados: 10,000,000
    • Segmentos de banco de dados: 32
    • Memória RAM: 24 GB
  • Duração do teste: 12 horas
    • 6 horas de pré-condicionamento 32 tópicos
    • 1 hora 32 tópicos
    • 1 hora 16 tópicos
    • 1 hora 8 tópicos
    • 1 hora 4 tópicos
    • 1 hora 2 tópicos

Com o Sysbench OLTP, examinamos a configuração 8VM para cada um. O AF saiu por cima, ligeiramente, ultrapassando o híbrido com 4,273 TPS para 4,259 TPS. A configuração DR marcou 3,625 TPS. 

Olhando para a latência média, é uma surpresa ver que o AF não foi consideravelmente maior do que o híbrido, 60.1ms a 60.3ms, respectivamente. O DR pontuou muito mais alto com latência de 71 ms. 

A latência média do percentil 99 novamente mostrou uma pequena diminuição na latência para o AF versus o híbrido, 126ms para 131ms, respectivamente. O DR teve latência muito maior em 212ms.

Análise de desempenho VMmark

Assim como em todas as nossas análises de desempenho de aplicativos, tentamos mostrar como os produtos funcionam em um ambiente de produção ao vivo em comparação com as reivindicações da empresa sobre o desempenho. Entendemos a importância de avaliar o armazenamento como um componente de sistemas maiores, mais importante, como o armazenamento responde ao interagir com os principais aplicativos corporativos. Neste teste usamos o Benchmark de virtualização VMmark da VMware em um ambiente multi-servidor.

O VMmark, por seu próprio design, é um benchmark altamente intensivo em recursos, com uma ampla combinação de cargas de trabalho de aplicativos baseados em VM que enfatizam as atividades de armazenamento, rede e computação. Quando se trata de testar o desempenho da virtualização, quase não há benchmark melhor para isso, já que o VMmark analisa muitas facetas, abrangendo E/S de armazenamento, CPU e até desempenho de rede em ambientes VMware. 

Aqui, analisamos o detalhamento do desempenho geral e do aplicativo VMmark em nossas configurações VSAN híbridas e totalmente flash com redução de dados.

Com capacidade para 18 blocos com compactação e desduplicação ativadas, o Virtual SAN é o sistema de armazenamento de mais alto desempenho com redução de dados que testamos até o momento. Em benchmarks anteriores, chegamos a 8 blocos com um dispositivo de desduplicação dedicado na frente de uma matriz totalmente em flash.

Observando os recursos da CPU em um dos hosts durante essa execução do VSAN totalmente em flash de 18 blocos, o sistema oscilou em torno de 80 a 85% de uso da CPU. Portanto, embora o aspecto do armazenamento não pudesse aumentar, o cluster ainda tinha alguns recursos sobrando.

Configuração de Teste HCIbench

  • 16 VMs
  • 10 VMDK por VM
    • VMDK de 10 GB (pegada de 1.6 TB)
    • VMDK de 50 GB (pegada de 8 TB)
    • VMDK de 100 GB (pegada de 16 TB)
  • Inicialização de armazenamento de gravação completa
  • Intervalos de teste de 1.5 horas (pré-condicionamento de 30 minutos, período de amostra de teste de 60 minutos)

Para testar as configurações híbridas e AF DR de nosso VMware VSAN, implantamos duas configurações diferentes para nossos perfis de carga de trabalho. Isso incluiu um espaço de 1.6 TB (totalmente em cache para o híbrido), 800 GB (totalmente em cache para o AF DR) e 16 TB (derramando fora do cache) para mostrar como a plataforma responde à medida que os dados quentes aumentam. Esses tamanhos podem ser ajustados para cada plataforma, dependendo de quanto flash é provisionado para cache ou classificação.

Perfis de carga de trabalho HCIbench do StorageReview

O primeiro teste HCIbench analisa a taxa de transferência aleatória de pico da plataforma VMware VSAN com um perfil de carga de trabalho 4K totalmente aleatório. Totalmente aquecido com dados movidos para o cache, o híbrido nos deu 888 MB/s de leitura e 249 MB/s de gravação com um espaço de 1.6 TB no cache. O AF DR, com um espaço de 800 GB no cache, nos deu 1,414 MB/s de leitura e 160 MB/s de gravação. Com o conjunto de dados de até 16 TB (transbordando para fora do cache), o híbrido nos deu 26 MB/s de leitura e 56 MB/s de gravação, enquanto o AF DR teve um desempenho surpreendentemente mais forte de 423 MB/s de leitura e 151 MB/s de gravação. 

Em seguida, examinamos o pico de E/S no mesmo perfil de 4k e aqui vimos resultados semelhantes. O conjunto de dados de 1.6 TB no cache teve o híbrido mostrando resultados de 227,342 IOPS lidos e 63,868 IOPS gravados, enquanto o conjunto de dados de 800 GB para AF DR no cache apresentou resultados de 361,923 IOPS lidos e 41,031 IOPS gravados. O conjunto de dados de 16 TB teve o híbrido nos dando 6,747 IOPS de leitura e 14,404 IOPS de gravação e o AF DR teve 108,365 IOPS de leitura e 38,778 IOPS de gravação.

A próxima métrica analisa a latência média do perfil de carga de trabalho 4K totalmente aleatório. A pegada de 1.6 TB no cache para o híbrido tinha uma latência de leitura de 1 ms e uma latência de gravação de 4 ms. A pegada de 800 GB no cache para o AF DR teve uma latência de leitura de 0.88 ms e uma latência de gravação de 8.29 ms. Com o conjunto de dados de 16 TB saindo do cache, obviamente haverá uma discrepância muito maior nos resultados, pois o híbrido será derramado em discos giratórios de 10K, que sempre têm latência mais alta, em comparação com o AF DR que permanece em unidades flash. Aqui, o híbrido nos deu latências de 47ms de leitura e 23ms de gravação, enquanto o AF DR nos deu latências de 1.65ms de leitura e 4.66ms de gravação.

Nosso próximo teste analisa um perfil de dados 8K maior com uma mistura de 70% de leitura e 30% de atividade de gravação. Aqui, o híbrido no cache (com 1.6 TB de área ocupada) atingiu 947.9 MB/s. O AF DR em cache (com 800GB) teve um desempenho de 631.5MB/s. Com o conjunto de dados maior de 16 TB saindo do cache, o desempenho do híbrido caiu para 67 MB/s, enquanto o AF DR caiu para 530 MB/s.

A seguir, veremos o desempenho de E/S da mesma carga de trabalho 8k 70/30. A pegada híbrida de 1.6 TB registrou 121,329 IOPS, enquanto o AF DR registrou 80,834 IOPS. Depois que o conjunto de dados de 16 TB saiu do cache, ambas as configurações tiveram uma queda no desempenho com o híbrido agora registrando 8,584 IOPS e o AF DR registrando 67,882 IOPS.

Olhando para a latência média de 8k 70/30, vimos um posicionamento semelhante ao acima. Dentro do cache, o híbrido tinha uma latência de 2ms e o AF DR tinha uma latência de 3.94ms. Com o grande conjunto de dados saindo do cache, o híbrido saltou para 37 ms, enquanto o AF DR caiu para 2.63 ms.

A última carga de trabalho alterna para um foco de largura de banda de pico, consistindo em um perfil sequencial de leitura e gravação de 32K. O desempenho em cache do híbrido mostrou 2,699 MB/s de leitura e 1,193 MB/s, e o desempenho em cache do AF DR mostrou 1,971 MB/s de leitura e 1,353 MB/s de gravação. Com o conjunto de dados maior de 16 TB, vimos 2,490 MB/s de leitura e 1,082 MB/s de gravação com o híbrido e 975 MB/s de leitura e 495 MB/s de gravação com o AF DR.

O desempenho de E/S mostrou resultados semelhantes, com o híbrido apresentando um desempenho melhor do que o AF DR. No cache, o híbrido teve desempenho de 86,379 IOPS de leitura e 38,184 IOPS de gravação, enquanto o AF DR teve desempenho de 63,068 IOPS de leitura e 43,302 IOPS de gravação. Com o conjunto de dados maior fora do cache, vimos que o híbrido tinha 79,703 IOPS de leitura e 34,611 IOPS de gravação, enquanto o AF DR tinha 31,205 IOPS de leitura e 15,830 IOPS de gravação.

Com latência média, o híbrido nos deu 3 ms de leitura e 8 ms de gravação no cache e 4 ms de leitura e 9 ms de gravação saindo do cache. O AF DR, por outro lado, nos deu 5.29ms de leitura e 7.46ms de gravação no cache e 5.78ms e 11.47ms de gravação saindo do cache.

Conclusão

O VMware VSAN 6.2 oferece às organizações a chance de aproveitar o flash de maneiras novas e empolgantes, gerando ganhos de eficiência e desempenho. Os destaques da nova versão incluem codificação de eliminação, suporte a RAID5, desduplicação e compactação, todos os quais levam claramente a obter o máximo do flash do ponto de vista da capacidade. Embora os benefícios da redução de dados variem com base na carga de trabalho e na configuração, é razoável esperar um ganho de capacidade de 3 a 6 vezes. Isso basicamente significa que uma unidade de 1 TB relativamente acessível é efetivamente capaz de fornecer de 3 a 6 TB. Esse benefício por si só torna o 6.2 uma atualização digna e dá ao flash um ótimo lugar para se destacar. 

Ao abordar o desempenho, a configuração totalmente em flash precisa de algumas nuances para explicar corretamente. O Virtual SAN 6.2 não oferece ganhos exponenciais quando comparado à configuração híbrida que testamos anteriormente. Existem algumas razões fundamentais para isso. Em primeiro lugar, o Virtual SAN é de thread único por grupo de discos, o que limita sua capacidade de aproveitar todas as unidades flash da maneira mais eficaz possível. Esta é uma decisão de projeto, pois a ênfase da VMware é minimizar a sobrecarga do Virtual SAN no nível do sistema; esta pode ser a área que a VMware opta por reequilibrar em versões futuras. Em segundo lugar, quando habilitamos os recursos de redução de dados, vemos um desempenho inferior na configuração totalmente flash do que na híbrida. Superficialmente, isso pode parecer um problema, mas para quem tem experiência com redução de dados, há uma grande perda de desempenho em todos os casos que vimos. Muitas vezes vimos mais de 80% de sobrecarga com soluções de HCI competitivas. Este contexto é importante; já que o VSAN all-flash com redução de dados habilitada realmente fez um trabalho muito bom a esse respeito, correspondendo à pontuação VMmark de 18 ladrilhos que nossa configuração híbrida mais antiga era capaz. Além disso, a VMware indica que a maioria dos clientes que compram configurações totalmente flash executam com recursos de redução de dados ativados, tornando a eficiência do Virtual SAN muito importante.

Atualmente, a redução de dados é uma configuração de tudo ou nada, onde se aplica a todo o armazenamento de dados; A VMware faz isso para maximizar a eficácia da desduplicação. O impacto dos recursos do servidor de redução de dados é compensado pela expansão da capacidade, que é um ponto de venda crítico neste caso. Em nossa configuração de quatro nós e 24 unidades por servidor (o que é muito comum para o Virtual SAN), isso significa que SSDs menores/menos podem ser usados ​​para corresponder ou exceder a capacidade do HDD. Isso, é claro, é um acréscimo a todos os outros benefícios que os SSDs oferecem, como menor consumo de energia, necessidades de resfriamento reduzidas ou tolerâncias operacionais mais amplas.

Para testes, executamos nossa variedade de testes de aplicativos, incluindo desempenho de MySQL e Microsoft SQL Server OLTP, bem como benchmark de virtualização VMmark da VMware e HCIbench. Com o SQL Server, a versão totalmente flash teve o melhor desempenho, com uma pontuação agregada de 12,472.8 TPS. O all-flash (AF) com redução de dados (AF DR) também teve um bom desempenho com uma pontuação agregada de 11,969.1 TPS. Com a latência do SQL Server, o AF VSAN teve a menor latência geral com uma pontuação agregada de 53 ms, aproximadamente 30% menor que a versão híbrida. Sem surpresa, o AF DR VSAN teve uma latência muito maior com um agregado de 261 ms. Com nosso teste SysBench, é interessante notar aqui que o AF teve desempenho apenas um pouco melhor do que a versão híbrida (4,273 a 4,259 TPS, latência média escalonada de 60.1ms a 60.3ms e latência de pior caso de 126ms a 131ms). Com a redução de dados habilitada, o AF DR VSAN teve uma queda de desempenho, mas ainda teve uma escala de transações por segundo de 3,625, uma latência média escalada de 71 ms e uma latência de pior caso de 212 ms.

Com o VMmark e a redução de dados ativados, o AF DR VSAN conseguiu atingir 18 blocos (o melhor sistema de redução de dados anterior atingiu apenas 8 blocos). Isso torna o AF DR VSAN a matriz de armazenamento de maior desempenho com redução de dados em nosso teste VMmark. O teste final que analisamos foi o HCIbench que, embora não mostre as capacidades máximas de um sistema, nos fornece uma boa métrica para comparar o AF DR VSAN com o híbrido VSAN. Em nosso teste 4k HCIbench, o AF DR VSAN superou a versão híbrida nos testes dentro do cache e fora do cache, principalmente em leituras. O AF DR foi capaz de atingir números de leitura de 4k de até 1,1414 MB/s, 361,923 IOPS e uma latência média de 0.9 ms. Olhando para nossos testes 8k 70/30, o híbrido teve um desempenho melhor no cache e o AF DR teve um desempenho dramaticamente melhor quando saiu do cache. Em nossos testes sequenciais de 32k, o VSAN híbrido teve um desempenho melhor dentro e fora do cache do que o AF DR VSAN.

Fizemos muitas comparações entre nossa configuração inicial de VSAN híbrida e uma implantação totalmente flash nesta análise. O híbrido resistiu bem nos testes iniciais e ainda hoje mostra força. Se as camadas de cache forem as mesmas em uma configuração híbrida e todas as configurações de flash e conjuntos de trabalho permanecerem dentro do cache, o desempenho dos dois será relativamente próximo. No entanto, a configuração totalmente flash se beneficia de todos os novos recursos da versão 6.2, além dos benefícios abrangentes que o flash oferece. Além disso, a pressão de redução de preço nos SSDs combinada com a redução de dados pode até mesmo tornar o Flash VSAN mais econômico por TB do que o híbrido. 

Vantagens

  • Plataforma de desempenho mais forte com redução de dados que testamos até o momento
  • O Virtual SAN 6.2 traz um conjunto de novos recursos que aproveitam os benefícios do flash
  • Muito fácil de configurar; confortável para os administradores de virtualização gerenciarem

Desvantagens

  • O Virtual SAN separa as unidades para cache e camadas de capacidade; uma arquitetura de camada única para flash pode ser valiosa
  • Grupos de discos de encadeamento único dentro do Virtual SAN limitam o potencial de desempenho superior

ponto de partida

O VMware VSAN 6.2 adiciona uma série de recursos de eficiência de dados à plataforma, permitindo que todas as implementações Flash VSAN forneçam uma combinação atraente de recursos, desempenho e capacidade, ao mesmo tempo em que se beneficiam de todos os benefícios periféricos que o flash traz para a mesa.

Página do produto VMware VSAN

Discuta esta avaliação

Inscreva-se no boletim informativo StorageReview