Home EmpreendimentoAI As GPUs Lenovo SR675 V3 e NVIDIA L40S ajudam a impulsionar sistemas de IA de última geração

As GPUs Lenovo SR675 V3 e NVIDIA L40S ajudam a impulsionar sistemas de IA de última geração

by Lyle Smith
GPU NVIDIA L40S

O servidor Lenovo ThinkSystem SR675 V3 – equipado com as novas GPUs L40S da NVIDIA – subiu ao palco no SIGGRAPH em Los Angeles, tornando-se um ponto focal nos planos da NVIDIA para avançar lançamentos globais de IA e introduzir aplicativos generativos de IA como chatbots inteligentes, pesquisa e ferramentas de resumo para usuários em vários setores.

O servidor Lenovo ThinkSystem SR675 V3 – equipado com as novas GPUs L40S da NVIDIA – subiu ao palco no SIGGRAPH em Los Angeles, tornando-se um ponto focal nos planos da NVIDIA para avançar lançamentos globais de IA e introduzir aplicativos generativos de IA como chatbots inteligentes, pesquisa e ferramentas de resumo para usuários em vários setores.

O novo ThinkSystem foi apresentado como um servidor NVIDIA OVX e em breve integrará as recém-anunciadas GPUs NVIDIA L40S. Espera-se que essa colaboração ajude a revolucionar as implementações de IA, permitindo IA de próxima geração, simulações imersivas de metaverso e decisões cognitivas em larga escala.

GPU NVIDIA L40S

A recém-revelada GPU NVIDIA L40S se destaca como um poderoso processador de centro de dados universal, desenvolvido especificamente para acelerar aplicativos de computação intensiva, incluindo treinamento e inferência de IA, projetos e visualização 3D, processamento de vídeo e digitalização industrial com a plataforma NVIDIA Omniverse. Possui aceleração de carga de trabalho múltipla inovadora para inferência de modelo de linguagem grande (LLM) e retreinamento, gráficos e aplicativos de vídeo.

A GPU L40S capacita a próxima geração de aplicativos de áudio, fala, 2D, vídeo e 3D habilitados para IA e é um componente crucial para as próximas plataformas NVIDIA Omniverse OVX 3.0, oferecendo alta fidelidade e gêmeos digitais precisos.

GPU NVIDIA L40S

A GPU NVIDIA L40S será um ativo chave nos sistemas NVIDIA OVX. Equipado com a arquitetura de GPU NVIDIA Ada Lovelace e generosos 48 GB de memória, cada servidor pode acomodar até oito GPUs L40S. Ele também possui Tensor Cores de quarta geração e um FP8 Transformer Engine, oferecendo incríveis 1.45 petaflops de poder de processamento de tensor.

Comparado ao seu antecessor, o NVIDIA A100 Tensor Core GPU, o L40S demonstra até 1.2 vezes mais desempenho de inferência de IA generativa e desempenho de treinamento até 1.7 vezes mais rápido para lidar com cargas de trabalho de IA complexas com bilhões de parâmetros e várias modalidades de dados.

A GPU L40S foi projetada para atender a uma ampla gama de fluxos de trabalho profissionais. Ele inclui 142 núcleos RT de terceira geração, oferecendo 212 teraflops de desempenho de rastreamento de raios, ideal para fluxos de trabalho de visualização profissional de alta fidelidade, como renderização em tempo real, design de produtos e criação de conteúdo 3D.

Além disso, os 40 núcleos CUDA do L18,176S fornecem quase 5x o desempenho de ponto flutuante de precisão única (FP32) da GPU NVIDIA A100, garantindo que as demandas computacionais para simulações científicas e de engenharia sejam atendidas com eficiência acelerada.

Configurações do ThinkSystem SR675 V3

A Lenovo está estrategicamente posicionada para oferecer suporte ao L40S com sua nova linha de servidores otimizados para as novas GPUs. Ao combinar gêmeos digitais totalmente simulados com IA generativa, a Lenovo visa melhorar seus processos de negócios e resultados de design. A colaboração entre a Lenovo e a NVIDIA no sistema NVIDIA OVX facilita a construção e a operação de mundos virtuais, estendendo os recursos do sistema para IA generativa e fornecendo desempenho de energia para data centers com cargas de trabalho de IA.

O ThinkSystem SR675 V3 oferece três configurações de servidor em uma, que inclui suporte para sistemas NVIDIA HGX A100 4-GPU com NVLink e refrigeração líquida híbrida Lenovo Neptune. Além disso, é compatível com configurações de 4 ou 8 GPUs que apresentam servidores NVIDIA L40S, NVIDIA H100 80GB ou NVIDIA H100 NVL em um espaço de 3U.

A Lenovo vê esses desenvolvimentos como um salto significativo na simplificação da implantação da IA, tornando-a acessível a organizações de todos os tamanhos e impulsionando a inteligência transformadora em todos os setores.

Configurações do ThinkSystem SR675 V3: Módulos Base, Dense e HGX

No domínio das configurações de servidor AI/HPC, entender as vantagens e desvantagens de diferentes configurações é crucial para otimização e requisitos de carga de trabalho específicos. O Lenovo ThinkSystem SR675 V3 oferece flexibilidade com suas configurações de módulo Base, Dense e HGX, cada uma projetada para necessidades específicas.

Módulo Base

A configuração do módulo base atende a organizações que procuram uma combinação equilibrada de suporte de GPU e capacidade de armazenamento. Pode acomodar até 4 pessoas de largura dupla, altura total e comprimento total; GPUs FHFL, utilizando conexões PCIe Gen5 x16. Isso oferece recursos decentes de processamento paralelo para cargas de trabalho de IA e aprendizado profundo.

Em termos de armazenamento, o Módulo Base suporta até 8 unidades Hot Swap SAS/SATA/NVMe de 2.5”, proporcionando um equilíbrio entre volume de armazenamento e velocidade.

Módulo Denso

Para organizações que priorizam o processamento paralelo de GPU, o Módulo Denso pode suportar até 8 GPUs de largura dupla, altura total e comprimento total. Cada GPU usa PCIe Gen5 x16 em um comutador PCIe, maximizando assim o número de GPUs em um único servidor para processamento paralelo aprimorado.

Quando se trata de armazenamento, o Módulo Denso é versátil. Suporta até 6 SSDs EDSFF E1.S NVMe ou até 4 SSDs EDSFF E3.S 1T NVMe HS. Essa configuração é ideal para cenários em que tarefas intensas de processamento de dados exigem mais GPUs ao custo de alguma flexibilidade de armazenamento.

Módulo HGX

A configuração do Módulo HGX é especializada, visando necessidades de alto desempenho com requisitos específicos de GPU. Ele aproveita a NVIDIA HGX H100 com 4 GPUs SXM5 conectadas ao NVLink. Essas GPUs SXM5 podem limitar o número geral que você pode colocar no chassi, mas oferecem desempenho de chip superior, tornando-as ideais para tarefas exigentes de IA e aprendizado profundo.

Em termos de armazenamento, o Módulo HGX é otimizado para velocidade. Ele pode acomodar até 4 SSDs NVMe Hot Swap de 2.5” ou até 4 SSDs EDSFF E3.S 1T NVMe HS.

Pensamentos de Encerramento

Cada configuração de módulo do ThinkSystem SR675 V3 tem seus pontos fortes exclusivos. Embora as GPUs SXM5 no Módulo HGX ofereçam desempenho incomparável, as organizações que exigem mais processamento paralelo podem optar pelo Módulo Denso para acomodar mais GPUs PCIe. No entanto, isso ocorre com o custo de perda de TDP e possível degradação do desempenho. O Módulo Base fornece um meio-termo, oferecendo um equilíbrio entre suporte de GPU e opções de armazenamento. Como sempre, a melhor escolha depende dos requisitos e restrições específicos da tarefa em questão, e nunca expulsaríamos nenhuma dessas configurações de nosso laboratório.

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed