A Gigabyte adicionou recentemente à sua linha de servidores o sistema R282-3C0 (rev. 100) – 2U Gen4 NVMe. Este servidor possui duas CPUs escalonáveis Intel® Xeon® de 3ª geração lançadas em abril. O R282-3C0 destina-se a armazenamento de alta densidade que suporta até oito unidades SATA de 3.5 polegadas e quatro unidades NVMe de 3.5 polegadas, dando um total de 12 compartimentos hot-swappable.
A Gigabyte adicionou recentemente à sua linha de servidores o sistema R282-3C0 (rev. 100) – 2U Gen4 NVMe. Este servidor possui duas CPUs escalonáveis Intel® Xeon® de 3ª geração lançadas em abril. O R282-3C0 destina-se a armazenamento de alta densidade que suporta até oito unidades SATA de 3.5 polegadas e quatro unidades NVMe de 3.5 polegadas, dando um total de 12 compartimentos hot-swappable.
Especificações Gigabyte R282-3C0
O modelo específico que estamos analisando é o R282-3C0. Este modelo não é o mais avançado da série R282, no entanto, os componentes internos ainda oferecem bom potencial de desempenho e flexibilidade.
Gigabyte R282-3C0 (rev. 100) | |
Fator de Forma | 2U 438 mm x 87.5 mm x 730 mm |
motherboard | MR92-FS0 |
Processadores | Processadores escalonáveis Intel® Xeon® de 3ª geração (Processador Intel® Xeon® Platinum, Processador Intel® Xeon® Gold, Processador Intel® Xeon® Silver) |
Memória | 32 Slots DDR4 DIMM; 8 canais por processador; Módulos RDIMM e LRDIMM de até 128 GB |
Armazenamento | Frente: (8) baias de HDD/SSD de 3.5" ou 2.5" SATA/SAS hot-swappable (4) baias de HDD/SSD de troca a quente SATA/SAS/Gen3.5 NVMe de 2.5" ou 4" Traseira: (2) baias HDD/SSD SATA/SAS hot-swappable de 2.5″ na parte traseira |
Vídeo | Integrado no Aspeed® AST2500 Adaptador gráfico de vídeo 2D com interface de barramento PCIe 1920×1200@60Hz 32bpp, DDR4 SDRAM |
Slots de expansão | Cartão Riser CRS2033: (1) slot PCIe x16 (Gen4 x16), altura total com meio comprimento (2) slots PCIe x8 (Gen4 x8), metade do comprimento de altura total Cartão Riser CRS2137: (1) slot PCIe x16 (Gen4 x16 ou x8), altura total com meio comprimento (1) Slots PCIe x8 (Gen4 x0 ou x8), altura total com meio comprimento (1) Slot PCIe x16 (Gen4 x16 ou x8), compartilhado com OCP 2.0, altura total com meio comprimento Cartão Riser CRS2027: (2) slots PCIe x8 (Gen4 x8), meio comprimento de perfil baixo (1) Slot mezanino OCP 3.0 com largura de banda PCIe Gen4 x16 da CPU_0 Função NCSI suportada (1) Slot mezanino OCP 2.0 com largura de banda PCIe Gen3 x8 da CPU_1 Função NCSI suportada |
E / S interna | (2) Conectores do ventilador da CPU, (1) Conector USB 3.0, (1) Conector TPM, (1) Conector VROC, (1) Conector do painel frontal, (1) Conector da placa traseira do HDD, (1) Conector IPMB, (1 ) Limpar jumper CMOS, (1) Chave de recuperação do BIOS |
Front I / O | (2) USB 3.0, (1) botão liga/desliga com LED, (1) botão ID com LED, (1) botão Reset, (1) botão NMI, (1) LED de status do sistema, (1) LED de atividade do HDD, (2) ) LEDs de atividade da LAN |
I / O traseiro | (2) USB 3.0, (1) VGA, (2) RJ45, (1) MLAN, (1) botão ID com LED |
E/S do painel traseiro | Front side_CBP20C5: 8 portas SATA/SAS e 4 portas SATA/SAS/NVMe Lado traseiro_CBP2022: 2 x portas SATA Largura de banda: PCIe Gen4 x4 ou SATA 6Gb/s ou SAS 12Gb/s por porta |
Fonte de alimentação do laboratório | (2) PSUs redundantes de 1600 W (80 PLUS Platinum) |
Gestão de Sistemas | Controlador de gerenciamento Aspeed® AST2500 Interface da web do console de gerenciamento GIGABYTE (AMI MegaRAC SP-X) |
Gigabyte R282-3C0 Projeto e Construção
Este sistema de revisão possui recursos e layout interessantes. A primeira coisa a notar é o número de compartimentos de unidade na máquina. Há oito baias de HDD/SSD de 3.5” SATA hot-swap, quatro baias de HDD/SSD de 3.5” NVMe hot-swappable e, finalmente, duas baias de 2.5” na parte traseira da máquina que podem ser usadas para inicialização.
Em termos de placa-mãe, no modelo que temos, a MR92-FS0, que vem com 2 soquetes para o conjunto dual CPU que está onboard, 32 slots DIMM com suporte para DDR4, 8 slots PCIe com comprimentos variados. A coisa mais interessante a notar sobre o modelo que temos é que não há um slot M.2. A maioria dos outros servidores possui um slot M.2, que seria usado para inicializar, no entanto, não temos um. Isso pode ser uma inconveniência, não um problema ou um obstáculo, mas algo em que o comprador deve pensar.
Por fim, quando se trata de design e construção, é importante observar as E/S dianteiras e traseiras. Na frente do servidor, temos duas portas USB 3.0, um botão liga/desliga com LED, botão ID com LED, botão reset, botão NMI, LED de status do sistema, LED de atividade do HDD e dois LEDs de atividade da LAN.
Na parte traseira do servidor, existem 2 portas USB 3.0, uma porta VGA, 2 portas RJ45, uma porta MLAN, um botão ID com LED e 2 portas de conector de alimentação para as fontes de alimentação duplas que estão dentro do servidor
Gerenciamento Gigabyte R282-3C0
O Gigabyte R282-3C0 utiliza um MegaRAC SP-X BMC para gerenciamento fora de banda. Essa plataforma de gerenciamento permite que os usuários lidem com tarefas básicas, como controlar remotamente a energia do servidor, atualizar o BIOS e iniciar um KVM para instalar software no servidor.
A interface é um pouco desajeitada em comparação com o que você pode encontrar em um servidor Tier1 da Dell EMC, HPE, Cisco, etc, mas faz o trabalho para gerenciar o sistema remotamente. Os usuários também recebem opções de HTML5 e Java KVM, dependendo de qual eles preferem usar. O único aspecto negativo que encontramos com o KVM especificamente é que os ISOs montados foram limitados a pouco mais de 1 Mb/s de velocidade de transferência, fazendo com que as instalações do sistema operacional com pegada ainda menor levassem muito tempo. O compromisso que encontramos foi atualizar um pen drive USB com o instalador do sistema operacional e usar o KVM para instalá-lo remotamente.
Desempenho Gigabyte R282-3C0
No que diz respeito ao desempenho do servidor, realizamos vários testes com base na configuração de (2) CPUs Intel 8380, (16) 32GB DDR4 a 3200Mhz e (4) Intel P5510 SSDs de 7.68 TB.
Desempenho do SQL Server
O protocolo de teste OLTP do Microsoft SQL Server da StorageReview emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados.
Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste SQL procura desempenho de latência.
Configuração de teste do SQL Server (por VM)
- Windows Server 2012 R2
- Ocupação de armazenamento: 600 GB alocados, 500 GB usados
- SQL Server 2014
- Tamanho do banco de dados: escala 1,500
- Carga de cliente virtual: 15,000
- Memória RAM: 48 GB
- Duração do teste: 3 horas
- 2.5 horas de pré-condicionamento
- período de amostra de 30 minutos
Para a latência média do SQL Server, o Gigabyte R282-3C0 manteve uma latência de 1ms com 8VM.
Desempenho do Sysbench MySQL
Nosso primeiro benchmark de aplicativo de armazenamento local consiste em um banco de dados Percona MySQL OLTP medido via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.
Cada VM do Sysbench é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.
Configuração de teste do Sysbench (por VM)
- CentOS 6.3 64 bits
- Percona XtraDB 5.5.30-rel30.1
- Tabelas de banco de dados: 100
- Tamanho do banco de dados: 10,000,000
- Segmentos de banco de dados: 32
- Memória RAM: 24 GB
- Duração do teste: 3 horas
- 2 horas de pré-condicionamento 32 tópicos
- 1 hora 32 tópicos
Com o Sysbench OLTP, registramos uma pontuação agregada de 25,537 TPS para as 8 VMs com VMs individuais variando de 3,187 a 3,199 TPS. A média e os intervalos não foram um choque para nós, pois no passado, vimos servidores semelhantes com o mesmo desempenho.
Com latência média, 8VM nos deu um tempo agregado de 10.025 com VMs individuais variando de 10 a 10.04.
Em nosso pior cenário, percentil 99, a latência no 8VM atingiu um tempo agregado de 19.13ms com tempos individuais variando de 19.07ms a 19.17ms.
Análise de Carga de Trabalho do VDBench
Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes.
Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes de tamanho de transferência de banco de dados comuns, bem como capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais.
perfis:
- Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
- Gravação aleatória em 4K: 100% de gravação, 128 threads, 0-120% de atualização
- Leitura sequencial de 64K: 100% de leitura, 32 threads, 0-120% iorado
- Gravação sequencial de 64K: 100% gravação, 16 threads, 0-120% iorado
- Banco de Dados Sintético: SQL e Oracle
- Clone completo de VDI e rastreamentos de clone vinculados
Olhando para a leitura aleatória de 4K, o Gigabyte R282-3C0 começou abaixo de 100µs e ficou lá até cerca de 2.25 milhões de IOPS e atingiu o pico em 3,770,372 IOPS e com uma latência de 536µs.
A gravação aleatória de 4K teve um começo muito bom com a latência bem abaixo de 100µs a 35µs e permanecendo lá até o servidor atingir um pouco mais de 1.6 milhão de IOPS. O pico então acontece em 1,823,423 IOPS, com latência de 909µs.
Passando para a leitura sequencial de 64K, vimos o pico do R282 em 307,885 IOPS com uma latência de 413µs.
Em seguida, a gravação sequencial de 64K nos deu um desempenho máximo de 116,957 IOPS com uma latência de 1071µs, no entanto, também vimos um declínio depois disso, voltando para cerca de 140,000 IOPS com uma latência de aproximadamente 800µs.
Agora temos nossas cargas de trabalho SQL, SQL, SQL 90-10 e SQL 80-20. Com SQL, o Gigabyte R282-C03 começou em 91µs e ultrapassou 100µs em 480,959 IOPS. O servidor atingiu o pico de 995,117 IOPS e teve uma latência de 125µs.
No SQL 90-10, o servidor tinha uma latência inicial de 85µs e conseguiu ficar abaixo de 100µs até atingir 589,647 IOPS. Em seguida, atingiu o pico de 967,723 IOPS com uma latência de 126µs.
No SQL 80-20, o servidor tinha uma latência inicial de 80µs e conseguiu ficar abaixo de 100µs até atingir 554,447 IOPS. Em seguida, atingiu o pico de 935,383 IOPS com uma latência de 132µs.
Nossos próximos testes foram nosso Oracle Workloads, Oracle, Oracle 90-10 e Oracle 80-20. Com nossa carga de trabalho Oracle, o R282 começou com uma latência de 80µs e depois atingiu o pico de 924,993 IOPS com uma latência de 133µs.
Para o nosso Oracle 90-10, o servidor iniciou em 83µs e conseguiu manter a latência abaixo de 100µs até 635,178 IOPS, mas depois atingiu o pico em 792,231 IOPS com uma latência de 108µs.
Por fim, o Oracle 80-20 também foi capaz de ficar abaixo de 100 durante a maior parte do teste, começando em 78.5µs e atingindo o pico de 770,853 IOPS com uma latência de 110µs.
Para nossos últimos testes, mudamos para nosso teste de clone VDI, Full and Linked. Para a inicialização VDI Full Clone (FC), o R282 atingiu o pico de 762,590 IOPS com uma latência de 162µs.
No VDI FC Initial Login, o servidor teve um aumento constante e acentuado para um pico de 479,697 IOPS com uma latência de 216µs.
Para o VDI FC Monday Login, o servidor teve um aumento constante até atingir o pico de 347,985 IOPS com uma latência de 165µs.
Agora, para os testes VDI Linked Clone (LC), começando com a inicialização, o servidor teve uma pequena subida para um pico de 305,058 IOPS com uma latência de 197µs.
Para o teste Initial Login, o servidor teve um grande aumento, começando em 100µs e depois chegou ao pico de 167,785 IOPS com uma latência de 152µs.
Por fim, para o Login de segunda-feira, o servidor teve um grande aumento, começando em 107µs e conseguiu atingir o pico de 271,522 IOPS com um grande salto na latência de até 213µs.
Conclusão
O Gigabyte R282-3C0 é um servidor de processador duplo de 2U que usa o desempenho dos processadores escalonáveis Xeon de 3ª geração e os coloca à prova. Juntamente com as 12 baias de 3.5″ hot-swappable na frente, quatro das quais são capazes de suportar NVMe, este servidor é capaz de armazenar uma mistura de armazenamento. Para organizações que precisam de capacidade acelerada, é interessante misturar um pouco de flash para tiering, com HDDs de baixo custo para armazenamento. Então você tem as unidades SATA gêmeas na parte de trás que podem ser usadas para inicialização. Isso é útil porque não há armazenamento M.2 integrado.
Os vários testes que fizemos no servidor acabaram sendo o que já esperávamos. A limitação de quatro compartimentos NVMe reteve o potencial de armazenamento de pico, pois a maioria dos compartimentos é aproveitada para mídia giratória de maior capacidade. Embora a configuração da unidade seja direcionada, a maioria dos clientes colocaria CPUs de médio porte em um sistema como este e visaria um preço mais equilibrado. Obviamente, outra coisa na linha Gigabyte teria mais desempenho com uma lista completa de NVMe. Eles têm o R282-Z92, por exemplo, que pode emparelhar 24 SSDs NVMe com EXCELENTE para um desempenho incrível.
Para nossos testes SQL sintéticos, vimos um máximo de 481K IOPS em nossa carga de trabalho SQL, 968K IOPS no SQL 90-10 e no teste SQL 80-20, 935K IOPS no máximo. Em nossos testes Oracle, vimos 924K IOPS na carga de trabalho Oracle, 792K no Oracle 90-10 e 770K no Oracle 80-20. No VDBench, registramos 3.7 milhões de IOPS na leitura de 4K, 1.8 milhão na gravação de 4K, 307,885 IOPS na leitura de 64K e 116,957 na gravação de 64K. Por fim, nos testes VDI Full Clone, vimos 762K IOPS na inicialização, 479K no Login inicial e 348K no Login de segunda-feira; para o clone vinculado, vimos 305 mil IOPS na inicialização, 167 mil no login inicial e 272 mil no login de segunda-feira.
Realisticamente, este servidor será usado para armazenamento de alta densidade, com possibilidade de aceleração via flash NVMe. A única coisa que está atrasando este servidor é mais armazenamento NVMe, mas esta construção foca nas vantagens de capacidade por dólar que os HDDs oferecem. O Gigabyte R282-3C0 é uma boa escolha para casos de uso que desejam uma combinação de capacidade e NVMe em um design de 12 baias (ou 14 dependendo de como você conta) construído em torno da arquitetura Intel Scaleable Gen3.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed