Home Empreendimento Análise Toshiba KumoScale NVMe-oF (Newisys NSS-1160G-2N)

Análise Toshiba KumoScale NVMe-oF (Newisys NSS-1160G-2N)

Clone de Instantâneos do KumoScale

No Open Compute Project deste ano, a Toshiba anunciou o lançamento de seu novo software baseado em NVMe sobre Fabrics (NVMe-oF), KumoScale. O KumoScale foi projetado para maximizar os benefícios de desempenho das unidades NVMe conectadas diretamente na rede do data center por meio de desagregação, abstração e integração de gerenciamento. O software traz os SSDs NVMe de alto desempenho, permitindo que os nós de computação sem disco (com apenas uma unidade de inicialização) acessem esse armazenamento flash por meio da conectividade de rede de malhas de alta velocidade. Esse tipo de conexão levará o armazenamento em rede a um desempenho quase máximo. 


No Open Compute Project deste ano, a Toshiba anunciou o lançamento de seu novo software baseado em NVMe sobre Fabrics (NVMe-oF), KumoScale. O KumoScale foi projetado para maximizar os benefícios de desempenho das unidades NVMe conectadas diretamente na rede do data center por meio de desagregação, abstração e integração de gerenciamento. O software traz os SSDs NVMe de alto desempenho, permitindo que os nós de computação sem disco (com apenas uma unidade de inicialização) acessem esse armazenamento flash por meio da conectividade de rede de malhas de alta velocidade. Esse tipo de conexão levará o armazenamento em rede a um desempenho quase máximo. 

Embora este software possa ser usado em qualquer plataforma de sistema x86 padrão, para nossa análise, estamos aproveitando o servidor de nó duplo Newisys NSS-1160G-2N. A plataforma Newisys NSS-1160G-2N é otimizada para modelo de serviço de hiperescala com hot swap de unidades NVMe, taxa de transferência balanceada de rede para unidades, manutenção baseada em FRU de corredor frio, energia e resfriamento redundantes, bem como outros recursos importantes de escala. requisitos do centro de dados. Nosso servidor apresenta armazenamento por meio de dois cartões Mellanox 100G com 8x Toshiba NVMe SSDs em um nó, o segundo nó é usado para fins de gerenciamento. A geração de carga virá de um único Dell PowerEdge R740xd que está diretamente conectado ao Newisys através de NICs 100G Mellanox ConnectX-5 duplos. O Newisys pode acomodar até 16 placas de servidor NVMe e dual Xeon em seu formato compacto de 1U e é otimizado para menor latência e maior desempenho com unidades de conexão direta, embora o servidor seja um pouco mais longo do que estamos acostumados em nossos racks . 

O KumoScale possui vários outros benefícios em relação aos SSDs de conexão direta tradicionais. Aproveitando o NVMe-oF, os usuários precisam de menos nós para atingir um poder de computação e armazenamento ainda maiores. Ter menos nós significa que eles podem ser gerenciados melhor e reduzir custos. Parte da redução de custos seria por meio da eliminação do armazenamento ocioso e do poder de computação. O KumoScale usa APIs restful para integração com várias estruturas de orquestração; o mais interessante é que funciona com o Kubernetes. Isso permitirá que aqueles que utilizam o Kubernetes para armazenamento de contêiner façam isso com desempenho muito maior, com a quantidade certa de armazenamento provisionado. Além do Kubernetes, o KumoScale também funciona com OpenStack, Lenovo XClarity e Intel RSD.

Gestão de Sistemas

Como destaque, o KumoScale vem com uma GUI bastante enxuta e intuitiva. Normalmente, este tipo de solução é controlado através do CLI (e de fato, vários aspectos ainda o serão). Na guia do painel, os usuários podem ver facilmente o desempenho do armazenamento, a capacidade do sistema e o status do hardware e podem detalhar um pouco o status individual do SSD. 

A próxima guia é a guia de rede que mostra a disponibilidade e o status do link do(s) controlador(es), juntamente com o tipo, velocidade, endereço MAC e MTU.

A guia de armazenamento é dividida em quatro subguias. A primeira subguia são os SSDs físicos. Aqui os usuários podem ver as unidades por seu nome, se estão disponíveis ou não, seus números de série, sua capacidade, seu uso de grupo e a porcentagem de vida restante. 

A próxima subguia em grupos de armazenamento virtualizados. Essa subguia é semelhante à anterior com nome, disponibilidade, capacidade, bem como espaço disponível, o SSD físico do qual é virtualizado e seu destino. 

A próxima subguia, Destinos, expande os destinos acima e mostra o armazenamento virtualizado exposto ao host, incluindo volumes de grupo. 

A subguia final em armazenamento é a guia de iniciadores. Essa guia fornece o nome do iniciador, alias (neste caso, Dell) e contagem de acesso. O usuário pode conceder Controle de Acesso (ACL) para o par alvo-iniciador.

A próxima guia principal é Desempenho de armazenamento. Aqui, os usuários podem ver uma leitura da taxa de transferência, IOPS e latência para um determinado período de tempo. 

E, finalmente, chegamos ao desempenho da rede, que também fornece aos usuários um detalhamento das métricas de desempenho, largura de banda e pacotes por um determinado período.

Desempenho

Análise de Carga de Trabalho do VDBench

Quando se trata de matrizes de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes de tamanho de transferência de banco de dados comuns, bem como capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. No lado da matriz, usamos nosso cluster de servidores Dell PowerEdge R740xd:

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

No desempenho de leitura de pico de 4K, o Newisys com KumoScale (referido como "o nó de armazenamento" para o restante desta análise, pois é o único dispositivo analisado) teve desempenho inferior a milissegundos durante todo o teste, chegando a 2,981,084 IOPS com um latência de 260μs.

No desempenho máximo de gravação de 4K, o nó de armazenamento atingiu o pico de 1,926,637 IOPS com uma latência de 226μs.

Mudando para leitura de pico de 64K, o nó de armazenamento teve um desempenho máximo de 213,765 IOPS ou 13.36 GB/s com uma latência de 441 μs.

Para gravação de pico sequencial de 64K, o nó de armazenamento atingiu 141,454 IOPS ou 8.83 GB/s com uma latência de 432 μs.

Em nossa carga de trabalho SQL, o nó de armazenamento atingiu o pico de 1,361,815 IOPS com uma latência de 179μs.

No benchmark SQL 90-10, vimos o desempenho máximo de 1,171,467 IOPS com uma latência de apenas 210μs.

O benchmark SQL 80-20 mostrou que o nó de armazenamento atingiu um desempenho máximo de 987,015 IOPS com uma latência de 248 μs.

Com o Oracle Workload, o nó de armazenamento teve desempenho máximo de 883,894 IOPS com latência de 280μs.

O Oracle 90-10 apresentou desempenho máximo de 967,507 IOPS com latência de 176μs.

No Oracle 80-20, o nó de armazenamento conseguiu atingir 829,765 IOPS com latência de 204μs.

Em seguida, mudamos para nosso teste de clone VDI, Full and Linked. Para VDI Full Clone Boot, o nó de armazenamento atingiu o pico de 889,591 IOPS com uma latência de 261 μs.

O login inicial do VDI Full Clone viu o nó de armazenamento atingir um pico de 402,840 IOPS com uma latência de 562 μs. 

O login VDI Full Clone Monday mostrou um desempenho máximo de 331,351 IOPS e uma latência de 369μs.

Passando para VDI Linked Clone, o teste de inicialização mostrou um desempenho máximo de 488,484 IOPS e uma latência de 234 μs.

No perfil Linked Clone VDI medindo o desempenho de Login inicial, o nó de armazenamento atingiu o pico de 194,781 IOPS com uma latência de 318 μs.

Em nosso último perfil, analisamos o desempenho do VDI Linked Clone Monday Login. Aqui, o nó de armazenamento atingiu o pico de 247,806 IOPS com latência de 498μs.

Conclusão

Projetado para maximizar o desempenho do armazenamento em bloco, o software KumoScale agrupa SSDs NVMe para fornecer a quantidade certa de capacidade e IOPS que pode ser compartilhada por milhares de instâncias de trabalho em NVMe-oF. Isso oferece aos usuários da nuvem mais flexibilidade, escalabilidade e eficiência. Embora o KumoScale possa ser usado em várias opções de hardware diferentes para criar o nó de armazenamento (a Toshiba recomenda Intel Xeon CPU E5-2690 v4 @2.30 GHz ou equivalente e 64 GB de DRAM), usamos o servidor de nó duplo Newisys NSS-1160G-2N. O NVMe-oF não apenas levará o armazenamento a um desempenho próximo ao pico, como o KumoScale também funcionará com várias estruturas de orquestração, incluindo Kubernetes, OpenStack, Lenovo XClarity e Intel RSD.

O sistema Newisys alimentado por Toshiba KumoScale certamente pode trazer o trovão em termos de desempenho. Em nenhum lugar o nó de armazenamento chegou perto de quebrar 1ms, a maior latência foi de 562μs no login inicial do VDI FC. Alguns destaques incluem quase 3 milhões de IOPS em leitura 4K, quase 2 milhões em gravação 4K, 1.3 milhão de IOPS na carga de trabalho SQL, 1.1 milhão de IOPS no SQL 90-10 e quase 1 milhão no SQL 80-20. Para desempenho sequencial de 64K, o nó de armazenamento atingiu 13.36 GB.s de leitura e 8.83 GB/s de gravação.

Embora não haja dúvida de que o desempenho é astronômico, colocar o KumoScale no contexto realmente o faz brilhar. A latência e o desempenho são drasticamente melhores nessa plataforma do que em outras plataformas não NVMe-oF. A latência está mais próxima do desempenho do armazenamento local, que é exatamente o que o NVMe-oFprotocol busca e o que os aplicativos em que esses sistemas estão posicionados exigem. O desempenho em escala deste sistema é o que realmente importa. Observamos o desempenho de 8 SSDs em um nó de armazenamento, onde os sistemas de produção teriam vários nós de armazenamento, cada um com seus próprios pools de armazenamento. O desempenho nesse cenário pretendido supera as métricas tradicionais de storage array com facilidade, tornando o KumoScale uma virada de jogo quando se trata de arrays NVMe-oF. A Toshiba tem se saído extremamente bem no fornecimento de eficiências de desempenho com o KumoScale e ainda possui uma GUI para avaliação e desenvolvimento. Emparelhado com o chassi Newisys, esta solução certamente terá sucesso em grandes datacenters que podem fazer uso dos benefícios de taxa de transferência e latência oferecidos pelo software Toshiba KumoScale.

Toshiba KumoScale

Newisys 

Discutir esta revisão

Inscreva-se no boletim informativo StorageReview