Home Empreendimento Análise do Comino Grando – Potências de GPU com refrigeração líquida

Análise do Comino Grando – Potências de GPU com refrigeração líquida

by Lyle Smith

A potência absoluta dos sistemas de refrigeração líquida Comino Grando garante que o desempenho da GPU permaneça inalterado mesmo sob carga total.

A Comino, para os não iniciados, é uma empresa que conquistou um nicho em servidores com refrigeração líquida, criando estações de trabalho e servidores versáteis e eficientes. Nesta revisão, examinaremos o Comino Grando Server e Workstation, seus principais sistemas. Esses sistemas são projetados para funcionar como uma unidade montável em rack de 19 polegadas e como um desktop independente, atendendo a uma ampla gama de necessidades de computação de alto desempenho. Quer se trate de análise de dados, design gráfico, jogos ou outras tarefas exigentes, estes servidores são construídos para oferecer desempenho, fiabilidade e eficiência de refrigeração.

Sistema Comino Grando 6x NVIDIA 4090

Sistema Comino Grando 6x NVIDIA 4090

É impossível exagerar o “fator legal” desses sistemas Grando. Eles exalam potência e desempenho, integrando perfeitamente tecnologias de refrigeração líquida de última geração para manter temperaturas ideais. Isso garante desempenho máximo, mesmo sob cargas de trabalho extenuantes, tornando a frieza um atributo literal e figurativo. O design da plataforma de resfriamento também permite densidades de GPU que de outra forma não seriam possíveis sem o resfriamento líquido. No Grando Server, por exemplo, o Comino pode acomodar seis GPUs NVIDIA 4090 lado a lado, o que seria impossível refrigerado a ar. O design refrigerado a líquido tem a largura de um slot, enquanto a parte refrigerada a ar padrão tem largura dupla.

Os modelos de servidor e estação de trabalho são altamente personalizáveis, oferecendo aos usuários uma variedade de opções, incluindo poderosos processadores multi-core (AMD Threadripper PRO), configurações de memória de até 1 TB e enormes capacidades de armazenamento. Os usuários também têm a opção de adicionar até seis GPUs profissionais de primeira linha, incluindo NVIDIA RTX A6000 (48 GB), NVIDIA RTX 6000 ADA (46 GB), NVIDIA H100 (80 GB), NVIDIA A100 (80 GB), NVIDIA L40s (48 GB) e a NVIDIA RTX 4090 (24 GB). Isto faz do Comino Grando uma escolha sólida para profissionais e empresas que buscam soluções de computação robustas que prometam potência e confiabilidade.

Tivemos a oportunidade de testar dois sistemas de refrigeração líquida da Comino. Começando com o Grando Server, nossa configuração é equipada com seis NVIDIA RTX 4090s. Ele também vem equipado com CPU Threadripper PRO 5995WX da AMD (um processador de 64 núcleos que vimos dentro do Lenovo Think Station P620), 512 GB de DRAM DDR5, um SSD NVMe de 2 TB e quatro PSUs de 1600 W para redundância para aumentar a confiabilidade contra falhas de energia.

O segundo sistema que recebemos da Comino, a iteração Workstation, é destacado por quatro GPUs profissionais NVIDIA A100, um processador Threadripper Pro 3975WX (36 núcleos, 64 threads, velocidade turbo de até 4.2 GHz), 512GB DDR5 DRAM e 2TB NVMe SSD. Este foi projetado para operações quase silenciosas; chocante considerando as GPUs internas.

Sistemas GPU com refrigeração líquida Comino Grando

Sistemas GPU com refrigeração líquida Comino Grando

Conforme indicado acima, a principal distinção entre os dois modelos reside nas capacidades de GPU e CPU, o que significa que os cenários de aplicação direcionados também diferem. A CPU 5995WX no modelo Servidor possui uma contagem de núcleos maior, tornando-a adequada para tarefas de processamento paralelo. Ele melhora significativamente o desempenho em ambientes de servidor onde é crucial lidar com múltiplas tarefas simultaneamente.

Em contraste, embora ainda poderoso, o 3975WX da estação de trabalho oferece menos núcleos, alinhando-se com o uso da estação de trabalho onde é necessário desempenho equilibrado em vários aplicativos. A seleção da GPU diferencia ainda mais os dois; Os RTX 4090 são inovadores em renderização gráfica e ideais para tarefas que exigem computação gráfica intensa, enquanto os NVIDIA A100 (cada um equipado com 40 GB de memória) são feitos sob medida para aprendizado profundo e computação científica.

Componentes e construção do Comino Grando

Apesar de um acidente inicial de envio (onde o servidor sofreu uma queda do caminhão de entrega – não por nossa causa, eu juro!), a embalagem completa da Comino garantiu que a integridade do sistema permanecesse intacta. Esta resiliência deve-se em parte ao seu design compacto e refrigerado a água, que reduz inerentemente o risco de danos durante o transporte. Este sistema foi apresentado em convenções e analisado por especialistas em tecnologia em todos os EUA, por isso não é estranho ao desgaste das viagens.

Tampas dos sistemas GPU refrigerados a líquido Comino Grando removidas

Comino Grando 6x 4090 (esquerda) e 4x A100 (direita)

Ao desembalar o modelo Grando Server, descobrimos um interior bem organizado, completo com cabos de alimentação, trilhos e um aviso sobre o sistema de refrigeração pré-preenchido, incluindo ferramentas e recursos para manutenção. A frente do servidor possui uma linha impressionante de seis RTX 4090s, cada um reduzido a um formato de slot único graças aos blocos de água para um design elegante e eficiente. Considerando a potência que estas unidades compactas possuem, esta configuração é certamente interessante.

Traseira do servidor Comino Grando

Traseira do servidor Comino Grando

Ambos os modelos usam caixas quase idênticas; internamente, eles parecem praticamente iguais, exceto pela configuração de resfriamento. Salvo indicação em contrário, focaremos na iteração do Servidor para a parte de layout. A conectividade do painel frontal inclui opções adicionais de E/S, incluindo conectores de entrada/saída de áudio para integração direta do sistema de som, múltiplas portas USB para conectividade periférica e portas de rede para permitir conexões a uma ampla gama de dispositivos. Ambos os modelos enfatizam o fácil acesso para manutenção e interação do usuário, consistente com a filosofia de design da Comino para hardware de computação de alto desempenho.

Localizado na extremidade esquerda do painel frontal do servidor está um display LED, que fornece uma variedade de dados de telemetria úteis, incluindo informações sobre as bombas, temperatura do ar, temperatura do líquido refrigerante e velocidade do ventilador. A navegação no menu é facilitada pelos botões iluminados no módulo de refrigeração, com toques curtos (menos de 2 segundos) para percorrer as informações. Um toque longo em PB2 (mais de 2 segundos) abre acesso a ramificações de menu adicionais, incluindo Comandos, Serviço (Configurações) e Registro de Eventos, adicionando mais controle sobre configurações e diagnósticos do sistema. No geral, a interface é intuitiva, com menus de fácil navegação aprimorados por botões retroiluminados para fácil operação.

Tela do sistema GPU com refrigeração líquida Comino Grando

Tela de telemetria do sistema GPU com refrigeração líquida Comino Grando

Abrindo o painel superior, a primeira coisa que nos chamou a atenção foi claro o tubo de líquido, mostrando uma sensação de sofisticação e uniformidade. Também fomos atraídos pela barra de suporte que abrange as áreas que abrigam as GPUs e SSDs dentro do chassi, o que reduzirá significativamente qualquer movimento de componentes sensíveis durante o transporte, garantindo que cheguem em boas condições.

Interior do sistema Comino Grando 6x 4090

Interior do sistema Comino Grando 6x 4090

No centro do sistema há um grande bloco de distribuição de água, que fornece líquido frio e um caminho de retorno. Todos eles são conectados com acoplamentos de desconexão rápida sem gotejamento, exalando as proezas de engenharia de alta qualidade da Comino.

Coletor Comino Grando 6x 4090

Coletor Comino Grando 6x 4090

Envolvidas em placas frias proprietárias da Comino, as seis GPUs NVIDIA RTX 4090 dentro do Grando Server são organizadas em uma formação muito compacta para maximizar o espaço dentro do servidor e, ao mesmo tempo, garantir que cada unidade possa ser resfriada de forma eficaz. O modelo Workstation utiliza quatro GPUs NVIDIA A100.

Coletor Comino Grando 4x A100

Coletor Comino Grando 4x A100

Ambos são fixados com segurança dentro do servidor por meio de uma cinta de retenção, que passa perpendicularmente por eles. Isso ajuda a estabilizar e alinhar as GPUs e mantém sua integridade estrutural durante as movimentações.

Placas frias GPU Comino Grando

Placas frias GPU Comino Grando

Removendo uma GPU para ter uma visão melhor, cada um é um Gigabyte NVIDIA RTX 4090 pronto para uso com o design de placa fria personalizado da Comino. As placas pesam uma quantidade significativa, sem dúvida em parte devido ao enorme conjunto do dissipador de calor imprensado na GPU.

Os encaixes de cada placa que volta ao bloco de distribuição de água são conexões sem gotejamento, que permitem a retirada das placas para manutenção sem vazamento de líquido para todos os lados. Eles apresentam uma quantidade mínima de resíduos na superfície de contato, mas isso é tudo depois de desconectá-los do sistema.

Os mesmos acessórios também estão no bloco de distribuição.

A CPU e os reguladores de tensão possuem uma placa fria conectada diretamente às mangueiras de refrigeração para mantê-los resfriados e evitar gargalos sob cargas de trabalho intensas. Flanqueando a CPU em ambos os lados estão slots DRAM totalmente preenchidos para um total de 512 GB.

Placa fria de CPU Comino Grando

Placa fria de CPU Comino Grando

Embora ambos os sistemas tenham um enorme radiador na parte traseira para descarregar o calor, a maior diferença entre as duas plataformas é a configuração da ventoinha e o ruído geral. Embora ambos os sistemas sejam muito silenciosos, a configuração da estação de trabalho é mais silenciosa e possui uma configuração de ventilador menos agressiva.

Interior da estação de trabalho Comino Grando

Interior da estação de trabalho Comino Grando 4x A100

Em termos de design, a única reclamação real que temos é a colocação de portas de E/S na frente e entradas de energia na parte traseira. Em um ambiente de data center montado em rack, esse projeto representa um desafio. Ao usar uma placa-mãe pronta para uso, o Comino tem tantas opções. O resultado líquido é um pequeno incômodo, em um design extremamente bem pensado.

Comino Grando Gerenciamento Remoto

Grafana é aproveitado para gerenciar o servidor Comino Grando, servindo como uma poderosa solução de análise e monitoramento de código aberto, fornecendo visualização de dados em tempo real por meio de painéis. Ele se integra a diversas fontes de dados e oferece recursos como alertas, suporte multilocatário e acesso à API, tornando-o prático para rastrear e diagnosticar o desempenho do sistema.

Olhando para o painel de informações gerais, o Grafana exibe métricas em tempo real no Comino Grando, como taxas de fluxo de refrigerante para gerenciamento térmico, níveis de umidade ambiente, temperaturas de componentes críticos como gerenciamento de sistema (STM), módulo regulador de tensão (VRM) e Placas de circuito impresso (PCB).

Ele também monitora o consumo de energia, exibindo o uso de componentes individuais, como consumo de energia da CPU e GPU, o que é essencial para gerenciar um servidor deste calibre. A interface consolida com eficiência todas essas informações críticas exibidas de maneira fácil de consumir. Isso garante que o desempenho e a confiabilidade do servidor sejam mantidos em níveis ideais, ao mesmo tempo que fornece aos administradores insights acionáveis ​​para resolver quaisquer problemas potenciais de forma preventiva.

Especificações do Comino Grando

Grande Servidor Estação de trabalho Grando
CPU Threadripper Pro W5995WX Threadripper Pro 3975WX
Carneiro RAM 512GB RAM 512GB
GPU 6X NVIDIA RTX 4090 4X A100
PSU 4 fontes de alimentação de 1600 W 3x fonte de alimentação 1000 SFX-L
Armazenamento 2 TB NVMe 2 TB NVMe

Qual o desempenho do Comino Grando?

Para comparar o desempenho entre duas configurações de sistemas Comino Grando – um servidor e uma estação de trabalho – utilizamos uma série de benchmarks que avaliam diferentes aspectos do desempenho da computação, incluindo renderização, computação e capacidades de processamento de dados. Os benchmarks incluem Blender 4.0, Luxmark, OctaneBench, Blackmagic RAW Speed ​​Test, 7-zip Compression e Y-Cruncher, cada um escolhido por sua relevância na avaliação dos pontos fortes específicos desses sistemas em vários ambientes de computação.

Blender 4.0

Blender é um conjunto abrangente de criação 3D de código aberto para projetos de modelagem, animação, simulação e renderização. Os benchmarks do Blender avaliam o desempenho de um sistema na renderização de cenas complexas, aspecto crucial para profissionais de efeitos visuais, animação e desenvolvimento de jogos. Este benchmark mede as capacidades de renderização de CPU e GPU, que são relevantes para servidores e estações de trabalho projetadas para processamento gráfico e tarefas computacionais de ponta.

Blender 4.0 (amostras por minuto, quanto maior, melhor) Servidor Grando (TR W5995WX, 512 GB, 6x 4090) Estação de trabalho Grando (TR 3975WX, 512 GB, 4x A100)
Monstro (CPU) 568.02 334.40
Loja de lixo (CPU) 386.53 231.90
Sala de Aula (CPU) 293.91 174.21
Testes de GPU do Blender 4.0
Monstro (GPU) 5,880.71 1,656.34
Loja de lixo eletrônico (GPU) 2,809.36 1,137.73
Sala de aula (GPU) 2,895.54 953.46

Os resultados destacam o desempenho robusto do Grando Server na renderização, que pode ser atribuído à sua CPU de alta potência e configuração superior da GPU. Embora a estação de trabalho Grando também tenha um desempenho admirável, especialmente em ambientes profissionais que exigem modelagem e renderização 3D detalhadas, a configuração do servidor foi projetada para tarefas de processamento gráfico ainda mais exigentes. As diferenças de desempenho refletem a prontidão do servidor para trabalhos de renderização de alto nível, oferecendo uma ferramenta valiosa para projetos com prazos apertados ou necessidades de renderização complexas.

Luxmark

Luxmark é um benchmark de GPU que usa LuxRender, um renderizador de ray tracing de código aberto, para avaliar o desempenho de um sistema no tratamento de cenas 3D altamente detalhadas. Este benchmark é pertinente para avaliar a capacidade de renderização gráfica de servidores e estações de trabalho, especialmente para efeitos visuais e aplicações de visualização arquitetônica, onde a simulação precisa da luz é crítica.

Luxmark (mais alto é melhor) Servidor Grando (TR W5995WX, 512 GB, 6x 4090) Estação de trabalho Grando (TR 3975WX, 512 GB, 4x A100)
Banco de corredor 240,303 92,156
Alimentício 98,459 27,194

O desempenho do Grando Server mostra seus excepcionais recursos de ray tracing, graças à sua configuração avançada de GPU 6x RTX 4090. Embora a estação de trabalho Grando demonstre capacidades substanciais, particularmente benéficas para tarefas que requerem visualização arquitetônica detalhada, o modelo Servidor é voltado para tarefas de renderização mais intensivas. Esta distinção enfatiza a adequação do servidor para projetos onde maximizar o desempenho do ray tracing é essencial, garantindo eficiência e realismo nas cenas renderizadas.

Banco Octane

O OctaneBench avalia o desempenho de renderização de GPUs usando o OctaneRender, um poderoso e popular renderizador de ray tracing acelerado por GPU. Este benchmark é fundamental para avaliar a capacidade de servidores e estações de trabalho de desempenho na criação de conteúdo, visualização de arquitetura e efeitos visuais, onde a velocidade de renderização impacta diretamente a produtividade e os cronogramas do projeto.

Banco Octane Núcleo Servidor Grando (TR W5995WX, 512 GB, 6x 4090) Estação de trabalho Grando (TR 3975WX, 512 GB, 4x A100)
Interior canais de informação 275.25 68.05
Interior Iluminação direta 826.70 244.65
Interior Rastreamento de caminho 1,065.47 297.89
idéia canais de informação 156.00 36.22
idéia Iluminação direta 642.48 191.03
idéia Rastreamento de caminho 785.45 232.82
ATV canais de informação 431.21 73.74
ATV Iluminação direta 896.54 220.35
ATV Rastreamento de caminho 1,130.18 273.55
Caixa canais de informação 222.37 51.48
Caixa Iluminação direta 789.55 224.08
Caixa Rastreamento de caminho 885.74 254.17
Pontuação Total 8,106.94 2,168.02

O Grando Server brilha nos testes do OctaneBench, indicando sua excepcional adequação para fluxos de trabalho de renderização exigentes que se beneficiam da aceleração da GPU. Ao mesmo tempo que oferece capacidades de renderização significativas, a estação de trabalho Grando é otimizada para equilibrar desempenho e versatilidade em ambientes profissionais. Esta distinção de desempenho ressalta o design do servidor para tarefas especializadas que exigem velocidades de renderização incomparáveis, suportando conclusões de projetos mais eficientes.

Teste de velocidade Blackmagic RAW

O Blackmagic RAW Speed ​​Test mede a velocidade de processamento para formatos de vídeo de alta qualidade, aspecto essencial para servidores e estações de trabalho na produção e edição de vídeos. Ele avalia como os sistemas gerenciam arquivos de vídeo RAW, afetando a eficiência do fluxo de trabalho e a produtividade em ambientes de produção de mídia.

Teste de velocidade Blackmagic RAW Servidor Grando (TR W5995WX, 512 GB, 6x 4090) Estação de trabalho Grando (TR 3975WX, 512 GB, 4x A100)
CPU 8K 132 FPS 135 FPS
8K CUDA 345 FPS 309 FPS

O servidor e a estação de trabalho Grando demonstram desempenho sólido no Blackmagic RAW Speed ​​Test, com o servidor se destacando ligeiramente em tarefas aceleradas por CUDA. Isso significa que o modelo Servidor oferece desempenho um pouco melhor para fluxos de trabalho que envolvem edição e processamento intenso de vídeo (especialmente aqueles que se beneficiam da aceleração da GPU). No entanto, a Workstation ainda oferece recursos substanciais para tarefas de processamento de vídeo, ilustrando sua construção completa para produção de mídia.

Compressão 7-zip

O benchmark de compactação 7-zip testa a eficiência de um sistema no tratamento da compactação e descompactação de dados, o que é crucial para gerenciar grandes conjuntos de dados e otimizar o armazenamento. Este benchmark reflete o desempenho de servidores e estações de trabalho em operações com uso intensivo de dados, onde a velocidade e a eficiência na manipulação de dados são vitais.

Benchmark de compactação 7-Zip (quanto maior, melhor) Servidor Grando (TR W5995WX, 512 GB, 6x 4090) Estação de trabalho Grando (TR 3975WX, 512 GB, 4x A100)
Uso atual da CPU 3,379% 3,439%
Classificação/uso atual 7.630 GIP 7.094 GIP
Classificação da corrente 257.832 GIP 243.994 GIP
Uso de CPU resultante 3,362% 3,406%
Classificação/uso resultante 7.697 GIP 7.264 GIP
Avaliação resultante 258.756 GIP 247.396 GIP
Descomprimindo
Uso atual da CPU 6,015% 6,286%
Classificação/uso atual 5.585 GIP 5.434 GIP
Classificação da corrente 335.958 GIP 341.599 GIP
Uso de CPU resultante 6,053% 6,269%
Classificação/uso resultante 5.603 GIP 5.468 GIP
Avaliação resultante 339.171 GIP 342.766 GIP
Avaliação Total
Uso total da CPU 4,708% 4,837%
Avaliação/uso total 6.650 GIP 6.366 GIP
Avaliação Total 298.963 GIP 295.081 GIP

Os resultados do benchmark de compactação 7-zip mostram o Grando Server e Workstation como executores capazes de lidar com tarefas de compactação e descompactação de dados. Seu desempenho indica que os sistemas podem gerenciar eficientemente grandes volumes de dados, com pequenas diferenças refletindo suas respectivas configurações de CPU. Estas capacidades destacam a adequação dos sistemas para tarefas significativas de gestão de dados, garantindo processos eficientes de armazenamento e recuperação.

Triturador em Y

Y-Cruncher é um benchmark computacional que testa a capacidade de um sistema de lidar com operações matemáticas complexas, calculando Pi com precisão em trilhões de dígitos. Este benchmark indica o poder computacional de servidores e estações de trabalho, especialmente para uso em pesquisas científicas e simulações que exigem processamento intensivo de números.

Y-Cruncher (tempo total de cálculo) Servidor Grando (TR W5995WX, 512 GB, 6x 4090) Estação de trabalho Grando (TR 3975WX, 512 GB, 4x A100)
1 bilhão de dígitos 11.023 segundos 11.759 segundos
2.5 bilhão de dígitos 28.693 segundos 32.073 segundos
5 bilhão de dígitos 61.786 segundos 69.869 segundos
10 bilhão de dígitos 130.547 segundos 151.820 segundos
25 bilhão de dígitos 353.858 segundos 425.824 segundos
50 bilhão de dígitos 788.912 segundos 971.086 segundos

O benchmark Y-Cruncher revela as capacidades computacionais ligeiramente superiores do Grando Server, adaptadas para tarefas altamente exigentes. Embora a estação de trabalho Grando ofereça um poder computacional substancial, adequado para uma ampla gama de aplicações científicas e analíticas, o servidor é otimizado explicitamente para cenários que exigem desempenho computacional máximo. Isto enfatiza o papel do Servidor no suporte a simulações e análises complexas, facilitando o processamento mais rápido e eficiente de tarefas computacionais.

Geekbench 6

O Geekbench 6 mede o desempenho computacional de CPUs e GPUs, abrangendo recursos de núcleo único e multinúcleo e poder de processamento gráfico. Este benchmark é essencial para avaliar a eficiência geral da computação de servidores e estações de trabalho em diversas tarefas, incluindo simulações, análise de dados e renderização de gráficos.

Geekbench 6 (quanto maior, melhor) Servidor Grando (TR W5995WX, 512 GB, 6x 4090) Estação de trabalho Grando (TR 3975WX, 512 GB, 4x A100)
CPU de núcleo único 2,127 2,131
CPU multinúcleo 21,621 20,411
GPU 294,894 193,447

Os resultados do Geekbench 6 ilustram uma quase paridade no desempenho da CPU de núcleo único entre as iterações do Grando Server e da estação de trabalho, indicando eficiência comparável em tarefas que dependem de processamento de thread único. No entanto, o Grando Server demonstra desempenho superior em testes multi-core e especialmente de GPU, refletindo sua capacidade de lidar com tarefas de processamento paralelo mais complexas e computações gráficas mais intensivas. Isso sugere a adequação do servidor para ambientes que exigem aplicativos multithread robustos e processamento gráfico de ponta, aumentando a produtividade em fluxos de trabalho com uso intensivo de gráficos e computação.

Cinebench R23

Cinebench R23 mede a capacidade de renderização da CPU, com foco no desempenho de núcleo único e multinúcleo. É uma referência essencial para avaliar o desempenho de um servidor ou estação de trabalho na criação de conteúdo, renderização 3D e outras tarefas que exigem uso intensivo da CPU. O MP Ratio (taxa de desempenho multi-core) fornece ainda mais informações sobre a eficiência com que um sistema utiliza seus múltiplos núcleos.

Cinebench R23 (mais alto é melhor) Servidor Grando (TR W5995WX, 512 GB, 6x 4090) Estação de trabalho Grando (TR 3975WX, 512 GB, 4x A100)
CPU multinúcleo 73,556 49,534
CPU de núcleo único 1,484 1,468
Taxa de MP 49.56x 33.75x

Aqui, o Grando Server supera a Workstation em testes multi-core, demonstrando sua capacidade superior para lidar com tarefas de renderização exigentes que se beneficiam do processamento paralelo. A ligeira diferença nos resultados de núcleo único indica eficiências semelhantes em tarefas que não requerem múltiplos núcleos. A maior proporção de MP do modelo de servidor demonstra sua proficiência na utilização de vários núcleos, tornando-o apto para lidar com aplicativos complexos e multithread em projetos de renderização e simulação.

Cinebench 2024

Cinebench 2024 amplia o escopo de seu equivalente de 2023 incorporando desempenho de GPU junto com benchmarks de CPU tradicionais. Esta estratégia abrangente é essencial para avaliar a proficiência de um sistema no gerenciamento das rigorosas demandas das atuais atividades de criação e renderização de conteúdo 3D. Ele oferece uma perspectiva abrangente sobre seus recursos de renderização computacional e gráfica.

Cinebench 2024 (quanto maior, melhor) Servidor Grando (TR W5995WX, 512 GB, 6x 4090) Estação de trabalho Grando (TR 3975WX, 512 GB, 4x A100)
GPU 140,842 52,829
CPU multinúcleo 4,430 2,817
CPU de núcleo único 90 89
Taxa de MP 49.49x 31.73x

O Grando Server mostra um desempenho impressionante em benchmarks multi-core de GPU e CPU, indicando sua forte capacidade para lidar com tarefas de renderização complexas que utilizam recursos extensos. Por outro lado, a Estação de Trabalho Grando demonstra uma eficiência louvável, especialmente considerando sua arquitetura e configuração em comparação com o modelo Servidor. As pontuações próximas da CPU de núcleo único entre os dois sistemas sugerem uma eficiência comparável para tarefas que não dependem fortemente do processamento multinúcleo. Por último, a pontuação MP Ratio de 49.49x ressalta a capacidade do modelo de servidor em maximizar sua configuração multi-core, tornando-o ideal para projetos exigentes que exigem alto rendimento de CPU e GPU para atingir desempenho e velocidade ideais.

Desempenho de desktop virtualizado

Além dos benchmarks que analisam o desempenho geral do sistema, queríamos virtualizar o sistema Grando Server para compartilhar seis desktops virtuais, cada um com uma GPU 4090 dedicada. Implantamos o Windows Server 2022 Standard e configuramos seis máquinas virtuais (VMs), uma para cada GPU, o que nos permitiu distribuir tarefas de forma eficiente e testar as verdadeiras capacidades do sistema.

Ao configurar uma VM para cada GPU RTX 4090, criamos um ambiente isolado que imita uma estação de trabalho dedicada, permitindo uma avaliação focada do desempenho de cada GPU. Abaixo está o processo PowerShell do processo de passagem.

Esta configuração também é útil para identificar os pontos fortes e potenciais gargalos em um sistema multi-GPU, pois garante que o desempenho de cada placa possa ser avaliado de forma independente, sem interferência de recursos compartilhados.

Lux Mark

Os resultados do benchmark LuxMark apresentam uma sólida faixa de pontuações de 38,599 a 40,797 no Hallbench. Isto demonstra uma consistência notável no desempenho, com pequenas variações provavelmente devido a flutuações operacionais ou configurações específicas da VM. As pontuações mais altas (VM1 e VM4) destacam as capacidades de desempenho máximo das GPUs RTX 4090 para tarefas exigentes de ray tracing, da mesma forma para a categoria Food.

No geral, esses resultados mostram a capacidade do servidor Comino para tarefas de computação de ponta usando uma única GPU, oferecendo potência e precisão em múltiplas cargas de trabalho simultâneas. Quando você compara a pontuação agregada com o desempenho do sistema cliente independente, os seis sistemas individuais se saíram muito bem. Medimos 6 em Hallbench e 241,183 em Food no total, contra o resultado independente de 103,399 e 240,303, respectivamente.

Servidor Grando (TR W5995WX, 512 GB, 6x NVIDIA RTX 4090) Banco de corredor Alimentício
Agregado 241,183 103,399
VM1 40,797 17,370
VM2 38,599 17,415
VM3 40,363 16,898
VM4 40,651 17,129
VM5 40,138 17,111
VM6 40,635 17,476

Cinebench 2024

O benchmark Cinebench 2024 permite avaliar como cada GPU lida com tarefas complexas de renderização em um ambiente virtualizado. O foco nesta carga de trabalho é realmente a GPU, já que não provisionamos totalmente os recursos de CPU do host disponíveis para cada VM. Aqui medimos uma pontuação agregada de GPU de 183,348 pontos, contra o sistema cliente que mediu 140,842.

Servidor Grando (TR W5995WX, 512 GB, 6x NVIDIA RTX 4090)
GPU CPU (múltiplos núcleos) CPU (núcleo único) Proporção de PM
Agregado 183,348 pts 2,333 pts 487 pts 4.78x
VM1 31,178 pts 394 pts 82 pts 4.83x
VM2 30,925 pts 392 pts 81 pts 4.81x
VM3 29,406 pts 384 pts 81 pts 4.74x
VM4 30,816 pts 391 pts 81 pts 4.81x
VM5 30,440 pts 386 pts 81 pts 4.76x
VM6 30,583 pts 386 pts 81 pts 4.75x

As pontuações da GPU variam de 29,406 a 31,178 pontos, o que demonstra um alto grau de consistência de desempenho. As pontuações de CPU multi-core estão agrupadas entre 384 e 394 pontos, com pontuações de núcleo único correspondentes de 81 a 82 pontos, mostrando a capacidade do servidor de lidar com tarefas intensivas de forma eficaz em todas as VMs.

A taxa de desempenho multi-core para single-core (proporção MP) varia ligeiramente de 4.74x a 4.83x, refletindo uma distribuição equilibrada de poder de processamento que beneficia tarefas de renderização multithread. Quanto às pontuações em si, de modo geral, esses resultados mostram o sólido desempenho do Comino Grando Server em um ambiente virtualizado, tornando-o adequado para renderização 3D exigente e tarefas computacionais onde eficiência e velocidade são fundamentais.

Blender 4.0

Durante o benchmark do Blender, cada VM demonstrou desempenho consistente em três cenários diferentes: Monster, Junkshop e Classroom. VM6 se destaca com a pontuação mais alta na cena Monster, 5,949, indicando uma ligeira variação no desempenho, possivelmente devido à alocação de recursos da VM ou a pequenas diferenças no tratamento da carga de trabalho. As pontuações da cena Junkshop são relativamente próximas, com VM5 mostrando a pontuação mais baixa, 2,656. Os resultados das cenas de sala de aula são mais variados, com VM2 alcançando a pontuação mais alta com 2,868, apontando para diferenças no manuseio de cenas ricas em geometria.

Quando comparamos esses resultados com o servidor não virtualizado, que não foi capaz de escalar a carga de trabalho no Blender, vemos desempenho e utilização muito maiores. O sistema cliente atingiu 5,881 no Monster, 2,809 no Junkshop e 2,896 no Classroom, enquanto no total em nossa implantação do Windows HyperV medimos 34,729 no Monster, 16,270 no Junkshop e 16,836 no Classroom.

Blender 4.0 – Servidor Grando (TR W5995WX, 512 GB, 6x NVIDIA RTX 4090)
Monstro sucata Sala de aula
Agregado 34,726 16,270 16,836
VM1 5,773 2,764 2,791
VM2 5,766 2,748 2,868
VM3 5,741 2,716 2,750
VM4 5,828 2,683 2,810
VM5 5,669 2,656 2,837
VM6 5,949 2,703 2,780

Conclusão

O servidor e a estação de trabalho Comino Grando são excelentes exemplos de como executar corretamente os sistemas de desempenho orientados por GPU, atendendo aos domínios de alta demanda de análise de dados, pesquisa de IA e tarefas com uso intensivo de gráficos. O modelo de servidor, configurado com seis NVIDIA RTX 4090s, é uma potência projetada para trabalhos computacionais pesados, complementado pela CPU Threadripper PRO 5995WX da AMD e 512 GB de memória DDR5. Essa configuração o torna uma escolha fantástica para ambientes de servidor que exigem processamento paralelo e manipulação de dados em alta velocidade.

Em contraste, embora um pouco menos abundante em núcleos, o modelo Workstation equilibra a equação com quatro GPUs NVIDIA A100, demonstrando sua habilidade em modelagem 3D detalhada e tarefas de aprendizado profundo. O design deste sistema é ligeiramente diferente, permitindo uma operação mais silenciosa. Para ser justo, ambos são extremamente silenciosos em nosso laboratório em comparação com qualquer servidor refrigerado a ar.

Em termos de desempenho, os resultados do benchmark mostram uma imagem clara: o Grando Server se destaca em testes intensivos de GPU, como OctaneBench e Blender 4.0, destacando sua capacidade de realizar facilmente trabalhos de renderização de alta qualidade. Com seu equilíbrio CPU-GPU personalizado, a versão para estação de trabalho oferece versatilidade para diversas aplicações profissionais. A velocidade e a eficiência de ambos os sistemas no gerenciamento de grandes conjuntos de dados, conforme evidenciado pelos benchmarks 7-zip Compression e Y-Cruncher, ressaltam sua capacidade de lidar com operações com uso intensivo de dados, uma vantagem crítica no cenário atual orientado a dados.

A flexibilidade dos sistemas foi ainda mais enfatizada quando transformamos o sistema 6x 4090 em uma caixa VDI. Também vimos um desempenho consistente, o que significa que uma organização poderia efetivamente dividir qualquer um desses sistemas para oferecer suporte a vários desktops remotos com acesso dedicado à GPU. Este caso de uso é totalmente habilitado pelas placas de resfriamento líquido, que é a única maneira de colocar esse tipo de densidade de GPU em uma única caixa.

Na sua totalidade, estes sistemas Comino Grando são alguns dos mais impressionantes que já vimos. Sim, existem muitas alternativas de servidores corporativos com refrigeração líquida, mas esse não é o objetivo aqui. Esses sistemas Comino oferecem extrema flexibilidade na configuração (opções de GPU cliente e empresarial) e densidade/eficiência de rack. A execução geral nestas frentes é extremamente impressionante, tornando os sistemas Comino Grando um dos nossos vencedores do prémio Best of 2024.

Comino Grando Sistemas

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed