Home Empreendimento Análise detalhada do servidor GPU com refrigeração líquida Dell PowerEdge XE9640

Análise detalhada do servidor GPU com refrigeração líquida Dell PowerEdge XE9640

by Haroldo Fritts

O Dell PowerEdge XE9640 é um servidor de montagem em rack acelerado por GPU 4x, capaz de fornecer energia de IA com eficiência energética, graças ao resfriamento líquido. O XE9640 foi anunciado durante SC22 junto com o XE8640 e um dos nossos favoritos, o de 8 vias XE9680 Servidor GPU. Hoje, o XE9640 está disponível para o público geral e estamos nos aprofundando no hardware subjacente.

O Dell PowerEdge XE9640 é um servidor de montagem em rack acelerado por GPU 4x, capaz de fornecer energia de IA com eficiência energética, graças ao resfriamento líquido. O XE9640 foi anunciado durante SC22 junto com o XE8640 e um dos nossos favoritos, o de 8 vias XE9680 Servidor GPU. Hoje, o XE9640 está disponível para o público geral e estamos nos aprofundando no hardware subjacente.

DellPowerEdge XE9640

DellPowerEdge XE9640

Família de servidores acelerados por GPU da Dell

A família de servidores PowerEdge XE foi desenvolvida especificamente para cargas de trabalho complexas de IA e HPC que exigem desempenho e confiabilidade. Esses servidores são projetados para serem inteligentes, de alto desempenho e baseados em insights. Hoje, a família de servidores XE compreende o XE9680 (Mencionamos que era um dos favoritos da Jordan?), XE9640, XE8640 e XE8545. O traço comum entre todos esses servidores é o design para suportar uma ampla variedade de iniciativas de IA com uma opção de resfriamento que faça sentido para o cliente.

Produtos

Propósito de Saúde Casos de uso
XE9680 Projetado para impulsionar insights com aceleração de IA projetada para desempenho ideal e tempo de retorno mais rápido Aproveite o desempenho extremo para IA e HPC com 8 GPUs NVIDIA H100 ou A100 Tensor Core SXM Modelos de linguagem grandes
A operação inteligente refrigerada a ar (até 35°C) maximiza a conversão de dados em resultados Processamento de linguagem natural
A operação inteligente refrigerada a ar (até 35°C) maximiza a conversão de dados em resultados Treinamento de mecanismo de recomendação grande
Modelagem e Simulação
Gêmeos Digitais e Fabricação
XE9640 Desenvolvido especificamente para impulsionar iniciativas de IA em um servidor 2U altamente denso e inteligente com refrigeração líquida Obtenha melhores resultados para IA com 4 GPUs NVIDIA H100 Tensor Core ou 4 GPUs Intel Data Center Max OAM Processamento de linguagem natural
CPUs e GPUs inteligentes com refrigeração líquida maximizam o desempenho Treinamento de mecanismo de recomendação grande
Menor TCO com eficiência otimizada de utilização de energia Modelagem e Simulação
Inteligência Artificial, Treinamento ML/DL para reconhecimento de objetos
XE8640 Impulsione cargas de trabalho de IA, HPC e análise com desempenho superior Automatize a análise de insights com 4 GPUs NVIDIA H100 para uma ampla variedade de aplicações Modelos de linguagem de conjunto de dados médio
Funciona com refrigeração a ar (até 35°C) para aumentar a eficiência energética Processamento de linguagem natural
Amplie as operações com opções de expansão inteligentes Modelagem e Simulação
Inteligência Artificial, Treinamento e Inferência ML/DL, reconhecimento de imagem
XE8545 Desempenho convencional de aplicativos gráficos e de IA Aumente o desempenho de treinamento e inferência com 4 GPUs NVIDIA A100 Modelagem e simulação, incluindo análise sísmica
A operação refrigerada a ar (até 35°C) proporciona uma operação eficiente Inteligência Artificial, Treinamento e Inferência de ML/DL, reconhecimento de imagem e Chatbot
Reduza o TCO com uma solução equilibrada de desempenho/watt

Dell PowerEdge XE9640 – Diversidade de GPU e refrigeração líquida

A PowerEdge XE9640 oferece resfriamento líquido direto (DLC) para GPUS e CPUs graças a uma profunda parceria com o parceiro CoolIT. O servidor vende alguns ventiladores para garantir que as placas de expansão DRAM, armazenamento e PCIe recebam fluxo de ar e resfriamento suficientes. Dito isto, esses ventiladores não precisam operar em RPM máximo, economizando energia substancial.

Bandeja Dell PowerEdge XE9640 NVIDIA H100

Dell PowerEdge XE9640 – Bandeja de GPU NVIDIA

O PowerEdge XE9640 traz diversidade de GPU para a mesa, oferecendo uma escolha entre 4x NVIDIA NV Link interconectado GPU H100SXM5 Módulo de 700W ou 4x Intel XeLink interconectado Intel Data Center GPU Max 1550 Módulo acelerador (OAM) de plataforma de computação aberta (OCP) de 600 W.

Graças a tecnologias como NVIDIA NVLink e Intel Xelink, essas GPUs se comunicam perfeitamente, reunindo efetivamente memória e núcleos. Isso é especialmente benéfico para lidar com cargas de trabalho coerentes com a memória, como Large Language Models (LLM). Essa versatilidade o torna adequado para uma ampla variedade de cargas de trabalho de IA. Claro, a pergunta óbvia é: “E o AMD Instinct?” A Dell está constantemente avaliando suporte adicional de GPU, mas não oferece uma solução AMD neste servidor no lançamento.

Bandeja de GPU Intel Dell PowerEdge XE9640

Dell PowerEdge XE9640 – Bandeja de GPU Intel

Essa diversidade de GPU permite que os usuários atendam às crescentes demandas de IA generativa, modelagem de simulação industrial e pesquisa científica de ponta. Por exemplo, os recursos do acelerador Intel Data Center GPU Max do PowerEdge XE9640 foram usados ​​no Texas Advanced Computing Center (TACC) para seu Supercomputador Stampede3.

Em termos de densidade e resfriamento, o PowerEdge XE9640 foi projetado e projetado para fazer uso eficiente do espaço do rack e, ao mesmo tempo, aumentar o desempenho. Com seu perfil compacto de 2RU, este servidor oferece impressionante capacidade de GPU por rack, maximizando o valioso espaço do data center. Empregando DLC, o PowerEdge XE9640 supera os sistemas tradicionais refrigerados a ar em termos de eficiência e economia.

Dell PowerEdge XE9640 – O resto do hardware

Além de “apenas” as GPUs, a engenharia por trás da série XE é de primeira classe. Acabamos de postar um análise de vídeo do XE9640 e XE8640. O vídeo fornece excelentes detalhes sobre o design, desde o acesso à unidade e roteamento dos tubos DLC no XE9640 até o resfriamento líquido da GPU de circuito fechado no XE8640 e o caminho para melhorias futuras em todos os servidores XE. Está incorporado abaixo para referência.

Além do XE9640, a remoção da moldura fornece acesso fácil às unidades NVMe. Dois slots no lado direito do chassi suportam unidades de subsistema de armazenamento com inicialização otimizada (BOSS) NVMe e incluem HWRAID 1 por meio de 2 SSDs M.2. Hoje, o armazenamento primário é fornecido por meio de 4 unidades NVMe U.2 Gen4. Isso dobrará em uma versão futura graças a uma opção de bandeja SSD para suportar 8 unidades E3.S Gen5 NVMe. A plataforma não suporta HW RAID para baias U.2 NVMe, embora a maioria não precise disso. Muitas dessas caixas de GPU aproveitam conjuntos de dados massivos externamente. O armazenamento local, neste caso, não será a fonte primária destes grandes conjuntos de dados.

É claro que existem boas opções de expansão na parte traseira do servidor para profissionais de IA que precisam acessar enormes matrizes de armazenamento. O XE9640 suporta quatro slots PCIe Gen5, dois de meia altura e dois de altura total. Além disso, você tem um slot PCIe Gen3 OCP NIC.

Dell PowerEdge XE9640 frontal

Dell PowerEdge XE9640 frontal

Para acalmar os temores de vazamento, os servidores refrigerados a líquido incluem relatórios de detecção de vazamento no iDRAC. O método da Dell para detectar vazamentos é incrível quando você perfura diferentes partes do chassi. Por exemplo, na imagem da placa de resfriamento da CPU abaixo, você pode ver finos traços de cobre em um padrão irregular ao redor de todo o bloco de água. Se pingar água nessas conexões, o circuito de fiação aberto detectará um pequeno curto-circuito e o sistema saberá que ocorreu um vazamento. O cabo de aço trançado é usado com um método de detecção semelhante em outras partes do chassi. Isso é visível em nossa foto do bloco principal de distribuição de líquido com as inúmeras mangueiras na frente do chassi. Além disso, as CDUs CoolIT e o restante do loop também possuem relatórios de detecção de vazamentos em vários pontos ao longo do caminho.

DellPowerEdge XE9640

Detecção de vazamento Dell PowerEdge XE9640

A propósito, o XE8640 e o XE9680 refrigerados a ar também incluem refrigeração líquida de GPU de circuito fechado com a mesma detecção de vazamento por meio do iDRAC.

Otimizando a potência por rack

O PowerEdge XE9640 oferece aos clientes a oportunidade de ajustar a utilização de energia por rack. Com nove servidores por rack, um pico de carga de computação acelerada pode exigir cerca de 41 kW de energia, utilizando uma distribuição de energia trifásica para um desempenho equilibrado. Para expansão, os data centers podem implantar racks que abrigam 12, 18 ou até 21 servidores PowerEdge XE9640, atingindo níveis de potência de aproximadamente 54 kW, 81 kW e 95 kW, respectivamente. Essa adaptabilidade permite que os data centers otimizem o uso de energia do rack de acordo com requisitos específicos.

Coletor de líquido Dell PowerEdge XE9640

Coletor de resfriamento líquido interno Dell PowerEdge XE9640

A Dell compilou vários recursos para fornecer aos clientes uma visão abrangente do PowerEdge XE9640. Isso inclui vídeos de unboxing e análises detalhadas de produtos. O vídeo de unboxing mostra o design e os recursos do servidor, oferecendo aos clientes um tour visual de suas capacidades.

Para enfatizar ainda mais as vantagens do PowerEdge XE9640, a Dell elaborou um infográfico que o compara com seu equivalente refrigerado a ar, o PowerEdge XE8640. Este infográfico destaca as distinções notáveis ​​do PowerEdge XE9640, especialmente sua eficiência em refrigeração líquida e impressionante capacidade de GPU por rack.

Parte traseira do Dell PowerEdge XE9640

Dell PowerEdge XE9640 traseiro

Considerações Finais

O PowerEdge XE9640 é parte integrante das soluções de IA generativa em expansão da Dell, projetadas para revolucionar as cargas de trabalho de IA e promover a inovação. A solução de IA generativa da Dell combina tecnologia de ponta, inovação e serviços oferecidos pela Dell Technologies para fornecer resultados mais inteligentes e rápidos. Ao aproveitar as capacidades da IA ​​generativa, as organizações podem obter novos insights, acelerar os seus esforços de transformação e melhorar a eficiência da força de trabalho.

Embora o XE9680 possa continuar sendo nosso servidor GPU Dell favorito, o XE9640 conquistou nossos corações puramente do ponto de vista de eficiência e design. O chassi 2U envolve uma enorme quantidade de engenharia; os data centers com refrigeração líquida gravitarão claramente para essas caixas com eficiência energética. Os quatro módulos NVIDIA consomem 2800 W, portanto, qualquer coisa que a Dell possa fazer para ajudar os data centers a serem mais eficientes em termos de rack e energia é um salto gigantesco.

Infográfico

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed