À medida que as indústrias continuam adotando e integrando a IA na infraestrutura de computação, os recursos são sobrecarregados e a eficiência energética está se tornando difícil de sustentar. No geral, a computação acelerada e a tecnologia subjacente fornecem a eficiência para desenvolver a próxima geração de inovação, com GPUs NVIDIA, NVIDIA AI e processadores de última geração como o novo 4ª geração Intel Xeon escalável plataforma de processadores liderando o caminho.
À medida que as indústrias continuam adotando e integrando a IA na infraestrutura de computação, os recursos são sobrecarregados e a eficiência energética está se tornando difícil de sustentar. No geral, a computação acelerada e a tecnologia subjacente fornecem a eficiência para desenvolver a próxima geração de inovação, com GPUs NVIDIA, NVIDIA AI e processadores de última geração como o novo 4ª geração Intel Xeon escalável plataforma de processadores liderando o caminho.
Com o lançamento do processador Intel Xeon Scalable de 4ª geração, a NVIDIA e seus parceiros estão lançando uma nova geração de sistemas de computação acelerados por IA com eficiência energética. Quando combinado com NVIDIA H100 Tensor Core GPU, esses sistemas oferecem desempenho dramaticamente maior, maior escala e maior eficiência do que as gerações anteriores.
Novos sistemas agregam desempenho e eficiência à IA corporativa
Novos sistemas equipados com NVIDIA e Intel permitirão que as empresas executem cargas de trabalho 25 vezes mais eficientes do que os servidores de data center somente com CPU. Fornecer esse desempenho por watt equivale a usar menos energia, o que significa mais energia para os data centers acelerarem as cargas de trabalho modernas.
A nova geração de servidores acelerados pela NVIDIA acelera o treinamento e a inferência, aumentando a eficiência energética em 3.5x, o que se traduz em economia real, reduzindo o TCO para data centers de IA em 3x.
As CPUs Intel Xeon de 4ª geração apresentam suporte para PCIe Gen 5
A nova CPU Intel Xeon de 4ª geração suporta PCIe Gen 5, dobrando as taxas de transferência de dados da CPU para GPUs NVIDIA e rede. As pistas PCIe aumentadas fornecem uma maior densidade de GPUs e rede de alta velocidade em cada servidor.
A largura de banda de memória mais rápida melhora o desempenho de cargas de trabalho com uso intensivo de dados, como IA, enquanto as velocidades de rede de até 400 gigabits por segundo (Gbps) por conexão suportam transferências de dados mais rápidas entre servidores e armazenamento.
Os sistemas e servidores NVIDIA DGX H100 de parceiros da NVIDIA que oferecem sistemas e servidores NVIDIA DGX H100 equipados com GPUs H100 PCIe vêm com uma licença para NVIDIA IA Empresarial, um conjunto completo, seguro e nativo da nuvem de software de desenvolvimento e implantação de IA, fornecendo uma plataforma completa para IA corporativa eficiente.
Sistemas NVIDIA DGX H100 alimentados por NVIDIA Base Command
Os sistemas NVIDIA DGX H100 fornecem uma plataforma otimizada alimentada pelo Comando base da NVIDIA sistema operacional projetado para o data center acelerado. Cada sistema possui oito GPUs NVIDIA H100, 10 NVIDIA Connect X-7 adaptadores de rede e processadores Intel Xeon Scalable duplos de 4ª geração para oferecer o desempenho necessário para criar grandes modelos de IA generativa, modelos de linguagem grandes, sistemas de recomendação e muito mais.
Combinada com a rede NVIDIA, espera-se que essa arquitetura supere a computação eficiente em escala, oferecendo até 9x mais desempenho do que a geração anterior e 20x a 40x mais desempenho do que os servidores X86 dual-socket não acelerados para treinamento de IA e cargas de trabalho HPC. Com esse tipo de desempenho, o que costumava levar um modelo de linguagem de 40 dias de treinamento poderia ser concluído em menos de dois dias.
Os sistemas NVIDIA DGX H100 são os blocos de construção do NVIDIA DGX SuperPOD, oferecendo até um exaflop de desempenho de IA, um salto em eficiência para implantação de IA corporativa em larga escala.
Parceiros da NVIDIA aumentam a eficiência do data center
Para cargas de trabalho de data center de IA, as GPUs NVIDIA H100 permitem que as empresas criem e implantem aplicativos com mais eficiência.
Os parceiros da NVIDIA, incluindo ASUS, Atos, Cisco, Dell Technologies, Fujitsu, GIGABYTE, Hewlett Packard Enterprise, Lenovo, QCT e Supermicro, devem começar a entregar o novo portfólio de GPUs H100 e servidores de CPUs escaláveis Intel Xeon de 4ª geração em breve.
A conexão de servidores com rede NVIDIA ConnectX-7 e processadores Intel Xeon Scalable de 4ª geração aumentará a eficiência e reduzirá a infraestrutura e o consumo de energia. Os adaptadores NVIDIA ConnectX-7 suportam PCIe Gen 5 e velocidades de conexão de 400 Gbps via Ethernet ou InfiniBand, dobrando a taxa de transferência de rede entre servidores e armazenamento.
Os adaptadores suportam transferências avançadas de rede, armazenamento e segurança. O ConnectX-7 reduz o número de cabos e portas de switch necessários, economizando 17% ou mais na energia necessária para a rede de grandes clusters HPC e AI acelerados por GPU e contribuindo para a melhor eficiência energética desses novos servidores.
NVIDIA AI Enterprise Software oferece uma solução completa de IA
Esses sistemas de última geração são otimizados para NVIDIA AI Enterprise Suite. Executando em NVIDIA H100, NVIDIA AI Enterprise acelera o pipeline de ciência de dados. Ele simplifica o desenvolvimento e a implantação de modelos preditivos de IA para automatizar processos essenciais e obter insights rápidos dos dados.
Com uma extensa biblioteca de software full-stack, incluindo fluxos de trabalho de IA de aplicativos de referência, estruturas, modelos pré-treinados e otimização de infraestrutura, o software fornece uma base ideal para dimensionar o sucesso da IA corporativa.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed