Inicio Empreendimento Desempenho e resiliência: Graid SupremeRAID para cargas de trabalho de IA e HPC

Desempenho e resiliência: Graid SupremeRAID para cargas de trabalho de IA e HPC

by Kevin O'Brien

A Graid Technology define novos padrões de proteção de dados e desempenho com o SupremeRAID, especialmente para cargas de trabalho de IA e HPC.

O SupremeRAID da Graid Technology continua redefinindo o cenário de armazenamento ao definir novos padrões de proteção de dados e desempenho, particularmente para cargas de trabalho modernas, como IA e Computação de Alto Desempenho (HPC). As configurações RAID tradicionais geralmente têm dificuldade para atender às demandas desses ambientes com uso intensivo de dados, especialmente quando dependem de placas RAID de hardware restringidas pelas limitações do barramento PCIe. Aproveitando a aceleração da GPU, a Graid rompe essas barreiras, oferecendo desempenho excepcional com impacto mínimo nos recursos da CPU, ao mesmo tempo em que garante proteção RAID robusta.

Graid SupremeRAID para IA e HPC

Servidor Gigabyte S183-SH0-AAV1

Em cargas de trabalho avançadas como IA e HPC, configurações alternativas como JBOD (Just a Bunch of Disks) e RAID de software (mdadm) também são comumente empregadas. Embora prático quando acoplado com checkpointing para evitar perda de dados, o JBOD introduz mais pontos de falha e sobrecarrega os administradores de TI com processos de recuperação desafiadores. O RAID de software oferece resiliência de dados, mas drena recursos valiosos da CPU para gerenciar dados de paridade RAID e tem desempenho inferior em muitas áreas. Em contraste, o SupremeRAID da Graid fornece uma solução otimizada e de alto desempenho que simplifica o gerenciamento de dados sem comprometer a velocidade ou a confiabilidade.

Placa Graid SupremeRAID

Este artigo explorará uma comparação de desempenho entre o SupremeRAID, o JBOD e o RAID de software da Graid, ilustrando por que a Graid surge como a melhor escolha para ambientes de TI onde o desempenho e a proteção de dados são fundamentais.

Banco de testes de desempenho

Utilizou-se o Gigabyte S183-SH0-AAV1 servidor dual Intel 5th Gen Scalable 1U para este banco de testes. Queríamos encontrar um servidor compacto com bastante poder de computação, e aconteceu que o servidor suporta 32 SSDs E1.S, o máximo do que é suportado com um único Graid SupremeRAID SR-1010. O servidor Gigabyte tem 32 slots DIMM, com suporte para 96 ​​GB RDIMM e 256 GB 3DS RDIMM. Esta plataforma oferece três slots FHHL PCIe Gen5 na parte traseira, dando muitas opções para conectividade de rede de alta velocidade. Além disso, a placa-mãe fornece rede onboard dual 1GbE e uma porta de gerenciamento de 1GbE.

DRAM HPC Gradiente

Kingston 96 GB DDR5-5600 ECC RDIMM

O servidor suporta 32 slots DIMM, mas neste caso, nós o preenchemos com 16 DIMMs Kingston, 1 DIMM por canal (1DPC) para velocidade máxima de DRAM. Se a carga de trabalho exigir uma pegada maior, mudar para DIMMs de maior densidade ou uma configuração 2DPC é possível, mas a última reduz a velocidade de DRAM para 4400MT/s. Kingston 96 GB DDR5-5600 ECC RDIMMs neste servidor fornecem uma excelente mistura de desempenho por dólar, tornando-os uma opção atraente para cargas de trabalho que precisam de DRAM de alta velocidade e uma pegada de DRAM razoável sem o prêmio de custo de DIMMs de 128 GB. Esses módulos oferecem o melhor dos dois mundos para cargas de trabalho intensivas de HPC e IA. 

SSDs KIOXIA XD7.68P de 7 TB

Os 32 compartimentos E1.S SSD são preenchidos por KIOXIA 7.68TB XD7P SSDs. As unidades usam uma interface PCIe Gen4 x2 e fornecem uma largura de banda máxima de 7.2 GB/s de leitura e 4.8 GB/s de gravação. A KIOXIA projetou essas unidades especificamente para cargas de trabalho intensivas de hiperescala e HPC, onde as vantagens de densidade dos E1.S SSDs são benéficas. Mais importante, a KIOXIA garantiu que o design térmico do XD7P esteja pronto para acompanhar esse design de servidor denso, mesmo sob carga pesada.

Gigabyte S183-SH0-AAV1 Servidor E/S Traseiro

Especificações do sistema de teste

  • Servidor Gigabyte S183-SH0-AAV1
  • 2 x CPUs Intel Xeon Platinum 8592+ (64 núcleos, 1.9 GHz)
  • 16 x Kingston DDR96-5 de 5600 GB
  • 32 x SSDs KIOXIA XD7P 7.68 TB E1.S
  • Graid SupremeRAID SR-1010
  • Servidor Ubuntu 22.04.4

Resultados dos testes de desempenho

As cargas de trabalho de HPC podem operar por dias, semanas ou meses de cada vez e, sem armazenamento de backend resiliente, uma única falha de unidade pode forçar esses trabalhos de volta à estaca zero. Para avaliar o impacto do Graid na resiliência e no desempenho das cargas de trabalho de HPC e IA, analisamos o desempenho do benchmark de armazenamento interno do y-cruncher. O objetivo é comparar uma variedade de configurações de armazenamento, JBOD, RAID de software e Graid SupremeRAID, para entender seu impacto em cargas de trabalho intensivas de CPU.

Configuração RAID

Sabemos que o RAID de software mdadm vê um impacto substancial na gravação de dados de paridade. Embora o RAID10 atingisse um desempenho mais alto, ele também reduziria significativamente a capacidade utilizável. Para otimizar melhor o desempenho do RAID5 de software, configuramos dois pools RAID5, divididos entre os SSDs 0-15 e 16-31. Isso os equilibrou em ambas as CPUs.

A comparação do Graid também foi ajustada para usar dois pools RAID5, com uma divisão uniforme de metade dos SSDs na CPU0 e a outra metade na CPU1 para balanceamento NUMA. Testamos com um único volume em cada pool RAID5, bem como dois volumes por pool RAID5.

Cada unidade é mapeada individualmente na configuração JBOD, garantindo balanceamento NUMA uniforme.

Não pudemos incluir RAID de hardware neste relatório, pois a maneira como as unidades são cabeadas neste servidor torna as placas RIAD de hardware tradicionais não suportadas. Vale a pena notar, no entanto, que mesmo se pudéssemos, o melhor cenário seria atingir o limite de largura de banda de um slot PCIe Gen4 x16 para uma única placa, em torno de 28 GB/s.

Configuração de Software

Para esses vários cenários de armazenamento, usamos triturador de yferramenta de teste de desempenho interno do . Os resultados do teste são divididos em desempenho de leitura e gravação sequencial, velocidade de E/S de computação, velocidade de E/S de disco e a proporção da velocidade de E/S de disco para a velocidade de computação. Selecionamos esta ferramenta porque ela estressa simultaneamente a CPU, a memória e a E/S da unidade. Embora não represente nenhuma carga de trabalho específica, descobrimos que os dados que ela gera estão intimamente correlacionados com o desempenho geral do sistema em aplicativos com E/S pesada. Notavelmente, o teste de E/S inclui processamento de dados real em vez de apenas enviar bits por uma interface o mais rápido possível, tornando-o um reflexo mais preciso do desempenho do sistema sob carga do mundo real.

O desempenho de leitura e gravação sequencial indica a velocidade bruta do conjunto de discos. A velocidade de computação é a taxa na qual a CPU trabalha com dados, enquanto a velocidade de E/S do disco é a rapidez com que os dados podem ser transmitidos para a CPU conforme o trabalho de computação ocorre. As cargas de trabalho que vão para o disco precisam que a velocidade de E/S do disco seja maior que a velocidade de computação para não ficarem mais lentas. Se essa proporção for menor que 1.0, o disco é um gargalo, enquanto acima de 1.0, a CPU é um gargalo. O y-cruncher para grandes cargas de trabalho tem melhor desempenho quando a proporção é 2.0 ou maior.

Configuração de armazenamento Leitura sequencial GB/s Gravação sequencial GB/s Computação GB/s E/S de disco GB/s Relação
JBOD direto 102 102 18.4 81.5 4.42
Grau RAID5 x 2 2VD 64.3 43.8 23.1 70.4 3.05
Grau RAID5 x 2 4VD 85.2 73.7 22.1 69.4 3.14
Software RAID5 x 2 122 3.6 25.7 10.9 0.42

Com JBOD direto para 32 SSDs E1.S individuais, o y-cruncher viu um desempenho de 102 GB/s de leitura e 102 GB/s de gravação com seu processo de striping interno. Este é geralmente o desempenho mais alto que o y-cruncher verá para esta plataforma, embora a compensação seja a ausência de paridade de dados. Quando a configuração foi alternada para volumes RAID5 de software (distribuídos em ambas as CPUs) com mdadm, o desempenho sequencial despencou para apenas 3.6 GB/s de gravação e 122 GB/s de leitura. O Graid com dois pools RAID5 e dois volumes mediu 64.3 Gb/s de leitura com desempenho de gravação de 43.8 GB/s. Dividindo isso em dois pools RAID5, mas com quatro volumes, o Graid viu um aumento na largura de banda para 85.2 GB/s de leitura e 73.7 GB/s de gravação.

Com os números de largura de banda abordados e o espectro de opções de configuração de armazenamento compreendido, nós detalhamos o impacto dessa decisão no aplicativo. A proporção de computação para largura de banda de E/S de disco viu a maior proporção de 4.43 da configuração JBOD. O RAID5 de software foi um insignificante 0.42, enquanto o RAID5 Graid 3.05 com 2VDs e 3.14 com 4VDs.

Neste exemplo de y-cruncher, que inclui todos os recursos de desempenho do servidor, uma taxa de 2.0 ou superior é necessária para um desempenho ideal. Embora a configuração JBOD forneça os melhores resultados gerais, ela o faz ao custo de dados de paridade, o que significa que uma falha de qualquer unidade, mesmo que por um momento, significa perda de dados. Por outro lado, o RAID de software pode oferecer disponibilidade de dados e uma velocidade de leitura maior do que o JBOD, mas as gravações sofrem tão severamente que a E/S do disco não consegue acompanhar o ritmo da CPU, resultando no terrível resultado de .42.

Esses dois pontos de dados são essenciais para entender o benefício que o Graid SupremeRAID oferece a essas cargas de trabalho. Para esse caso de uso, os números de desempenho agregado estão entre JBOD e RAID de software, mas E/S bruta não é a história completa. Este exemplo mostra que o Graid pode fornecer mais do que o desempenho de aplicativo necessário, ao mesmo tempo em que fornece disponibilidade de dados. Essa combinação significa que as organizações que usam o Graid podem esperar proteção RAID, armazenamento e desempenho de aplicativo com uma arquitetura sem bloqueio que excede em muito o que uma placa RAID tradicional poderia fornecer.

Conclusão

O SupremeRAID da Graid Technology expande consistentemente os limites da proteção de dados e desempenho, definindo um novo padrão na indústria. Ao aproveitar o poder da aceleração de GPU, a Graid oferece velocidade e eficiência inigualáveis ​​em configurações RAID, reduzindo significativamente a tensão da CPU e maximizando o rendimento.

Os dados que coletamos para este relatório demonstram a capacidade da Graid de garantir proteção de dados robusta ao mesmo tempo em que atende aos requisitos exigentes das cargas de trabalho modernas de IA e HPC — áreas em que as soluções RAID tradicionais e RAID de software geralmente ficam aquém. Essa eficiência permite que recursos críticos do sistema, como CPU, DRAM e armazenamento, contribuam totalmente para o desempenho dos aplicativos que eles são projetados para suportar, aumentando o valor e a eficácia geral do sistema.

Tecnologia Graid

Este relatório é patrocinado pela Graid Technology. Todas as visões e opiniões expressas neste relatório são baseadas em nossa visão imparcial do(s) produto(s) em consideração.

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed