Scaled Sysbench é o teste de desempenho final do nó EMC ScaleIO VxRack totalmente flash configurado na HCI. Em duas camadas, nós pressionou o sistema para 99.2% da capacidade e obtive uma taxa de transferência fenomenal com os quatro servidores Dell atuando como geradores de carga. Desta vez, com a computação e o armazenamento juntos no chassi 2U, executamos o mesmo teste para ver o que acontece. Esperávamos ver mais peso nas CPUs como fator limitante, já que o sistema tem mais trabalho, mas até agora no teste de HCI, o ScaleIO provou ser extremamente eficiente e leve do ponto de vista da sobrecarga; algo que geralmente é o inverso em outras soluções HCI.
Scaled Sysbench é o teste de desempenho final do nó EMC ScaleIO VxRack totalmente flash configurado na HCI. Em duas camadas, nós pressionou o sistema para 99.2% da capacidade e obtive uma taxa de transferência fenomenal com os quatro servidores Dell atuando como geradores de carga. Desta vez, com a computação e o armazenamento juntos no chassi 2U, executamos o mesmo teste para ver o que acontece. Esperávamos ver mais peso nas CPUs como fator limitante, já que o sistema tem mais trabalho, mas até agora no teste de HCI, o ScaleIO provou ser extremamente eficiente e leve do ponto de vista da sobrecarga; algo que geralmente é o inverso em outras soluções HCI.
Especificações do nó VCE VxRack (computação de desempenho totalmente Flash PF100)
- Chassis – Nº de nós: 2U-4 nós
- Processadores por nó: Dual Intel E5-2680 V3, 12c, 2.5 GHz
- Chipset: Intel 610
- Memória DDR4 por nó: 512 GB (16 x 32 GB)
- NIC incorporada por nó: portas Ethernet duplas de 1 Gbps + 1 porta de gerenciamento 10/100
- Controlador RAID por nó: 1x LSI 3008
- SSDs por nó: 4.8 TB (6 x eMLC de 2.5 GB de 800 polegadas)
- SATADOM por nó: 32GBSLC
- Porta de 10 GbE por nó: 4 portas de 10 Gbps SFP+
- Fonte de alimentação: PSU AC de platina dupla de 1600 W
- Roteador: Cisco Nexus C3164Q-40GE
Desempenho do Sysbench
Aplicamos a mesma configuração ao nosso teste VxRack Node HCI que fizemos com duas camadas, com exceção de onde as VMs estavam operando. Em nossa camada dupla, hospedamos o armazenamento no VxRack Node, mas a computação foi fornecida por meio de quatro a oito servidores Dell PowerEdge R730 13G. Nesta iteração de teste, os próprios VxRack Nodes executaram as cargas de trabalho. Em um determinado ponto, independentemente de quão rápido o ScaleIO seja, veremos uma troca entre duas camadas e HCI, onde ficaremos sem ciclos de CPU devido ao peso adicional das VMs de computação na configuração de HCI e uma discrepância de CPU. No caso da HCI, temos oito CPUs Intel E5-2680 v3. Na configuração de duas camadas, escalamos até oito servidores na extremidade superior, executando dezesseis CPUs Intel E5-2690 v3. Isso se traduz em uma discrepância de 240 GHz versus 499.2 GHz na carga de trabalho máxima para referência.
Configuração de teste do Sysbench (por VM)
- CentOS 6.3 64 bits
- Pegada de armazenamento: 1 TB, 800 GB usados
- Percona XtraDB 5.5.30-rel30.1
- Tabelas de banco de dados: 100
- Tamanho do banco de dados: 10,000,000
- Segmentos de banco de dados: 32
- Memória RAM: 24 GB
- Duração do teste: 3 horas
- 2 horas de pré-condicionamento 32 tópicos
- 1 hora 32 tópicos
Estaremos comparando o nó EMC VxRack em HCI com o nó EMC VxRack em duas camadas, referindo-se aos resultados como HCI e 2L, respectivamente. Em 4 VMs, o HCI nos deu 5,664.9 TPS em comparação com os 2 TPS do 3,979.4L. À medida que continuamos a escalar, o HCI ficou à frente do 2L até atingirmos 24 VMs; aqui, o HCI nos deu 12,817.3 TPS enquanto o 2L nos deu 13,858.3 TPS. Embora a configuração HCI ainda tenha aumentado ligeiramente seu desempenho agregado geral, depois que o desempenho de 20 VMs foi diminuindo e em 32 VMs, vimos o desempenho começar a cair. Este foi um sinal de que as CPUs atingiram seu ponto de inflexão.
Observando o impacto do armazenamento por meio da GUI do ScaleIO com 32 VMs funcionando, vemos cerca de 2.6 GB/s de tráfego e um pouco mais de 143 mil IOPs no nível do sistema.
A latência média escalada pinta um quadro um tanto semelhante, com o HCI mostrando latência mais baixa que o 2L no início. Em 4 VMs, o HCI teve uma latência de apenas 22.6 ms em comparação com os 2 ms do 32.16L. À medida que aumentamos, vimos lentamente as marés virarem com o 2L com latência mais baixa a partir de 24VMs. Ainda assim, em 32 VMs, o HCI teve uma latência média de apenas 78.4 ms.
Mudando nosso foco para perfis de latência de pico com a latência do percentil 99, aqui o HCI começou com latência mais baixa (45.33ms em 4VMs) e mais uma vez perdeu seu lugar de vitória para o 2L em 24VMs. No entanto, quando atingimos 32 VMs, o HCI teve uma latência de 179.26 ms, superando os 2 ms do 197.01L.
Conclusão
Novamente, o EMC VxRack Node se saiu extremamente bem neste teste. Embora esperássemos alguma sobrecarga de gerenciamento na configuração de HCI, realmente não vimos nenhum impacto adverso. Na verdade, a configuração HCI superou a configuração de duas camadas até um ponto em que a CPU se torna o fator limitante. Isso também se reflete em nosso artigo recente sobre testes do SQL Server executados em HCI, onde superou o desempenho de duas camadas com métricas de latência mais baixas. De qualquer forma, porém, o desempenho foi excelente, provando mais uma vez que o ScaleIO é a solução definida por software líder no mercado em termos de desempenho e flexibilidade.
Mergulhando nos detalhes, o ScaleIO não teve problemas para equilibrar a sobrecarga do trabalhador SDS operando no mesmo sistema que as cargas de trabalho do MySQL. Com uma velocidade de clock menor da plataforma em comparação com nossos testes de duas camadas (2.5 GHz x 2.6 GHz), observamos melhor latência e maior desempenho transacional em execução em um ambiente HCI, com as cargas de trabalho mais próximas do próprio armazenamento. Embora isso possa parecer intuitivo a princípio, nunca vimos isso acontecer com nenhum outro ambiente HCI, pois eles sempre foram mais lentos do que uma matriz de armazenamento externo conectada a servidores de computação dedicados. O ponto de ruptura aconteceu quando nossos trabalhadores do Sysbench consumiram todos os recursos de CPU disponíveis no cluster, perdendo sua vantagem em 20 VMs em execução em comparação com duas camadas.
O interessante a apontar, porém, é que ainda havia E/S de armazenamento inexplorado, que ainda pode ser apresentado fora do cluster ScaleIO HCI. Isso significa que, além da carga de HCI, você também pode compartilhar o armazenamento no modo de duas camadas simultaneamente. Isso é fundamental para a proposta de valor que o ScaleIO oferece, que permite que uma organização adapte o sistema às suas necessidades. Por ser tão flexível e eficiente quanto é, o ScaleIO realmente nunca mostrou nenhuma fraqueza além de esgotar a capacidade ou esgotar os ciclos de CPU disponíveis nos próprios hosts.
Revisão do nó EMC VxRack: visão geral
Nó EMC VxRack desenvolvido com ScaleIO: análise de desempenho OLTP do Sysbench dimensionado (2 camadas)
Nó EMC VxRack desenvolvido com ScaleIO: análise de desempenho do SQL Server (2 camadas)
Nó EMC VxRack desenvolvido com ScaleIO: análise de desempenho sintético (2 camadas)
Nó EMC VxRack desenvolvido com ScaleIO Review: Synthetic Performance Review (HCI)
Nó EMC VxRack desenvolvido com ScaleIO: SQL Server Performance Review (HCI)
Nó EMC VxRack desenvolvido com ScaleIO: VMmark Performance Review (HCI)
Inscreva-se no boletim informativo StorageReview