Home Empreendimento Os benchmarks de inferência de AI do NVIDIA Hopper na estreia do MLPerf estabelecem recorde mundial

Os benchmarks de inferência de AI do NVIDIA Hopper na estreia do MLPerf estabelecem recorde mundial

by Haroldo Fritts

A estreia da GPU NVIDIA H100 Tensor Core nos benchmarks de IA padrão da indústria MLPerf estabeleceu recordes mundiais em inferência em todas as cargas de trabalho, oferecendo até 4.5 vezes mais desempenho do que as GPUs da geração anterior. As GPUs NVIDIA A100 Tensor Core e o módulo NVIDIA Jetson AGX Orin para robótica com tecnologia AI forneceram desempenho geral de inferência de liderança em todos os testes MLPerf: reconhecimento de imagem e fala, processamento de linguagem natural e sistemas de recomendação.

A estreia da GPU NVIDIA H100 Tensor Core nos benchmarks de IA padrão da indústria MLPerf estabeleceu recordes mundiais em inferência em todas as cargas de trabalho, oferecendo até 4.5 vezes mais desempenho do que as GPUs da geração anterior. As GPUs NVIDIA A100 Tensor Core e o módulo NVIDIA Jetson AGX Orin para robótica com tecnologia AI forneceram desempenho geral de inferência de liderança em todos os testes MLPerf: reconhecimento de imagem e fala, processamento de linguagem natural e sistemas de recomendação.

O H100, também conhecido como Hopper, elevou o nível de desempenho por acelerador em todas as seis redes neurais, demonstrando liderança em taxa de transferência e velocidade em servidores separados e testes offline. Graças em parte ao seu Transformer Engine, Hopper se destacou no modelo BERT para processamento de linguagem natural. Está entre os maiores e mais ávidos por desempenho dos modelos MLPerf AI.

Esses benchmarks de inferência marcam a primeira demonstração pública das GPUs H100, disponíveis ainda este ano. As GPUs H100 participarão de futuras rodadas MLPerf para treinamento.

GPUs A100 mostram liderança

As GPUs NVIDIA A100, disponíveis hoje nos principais provedores de serviços em nuvem e fabricantes de sistemas, continuaram a mostrar liderança geral em desempenho mainstream em inferência de IA, vencendo mais testes do que qualquer envio nas categorias e cenários de data center e computação de ponta. Em junho, o A100 também apresentou liderança geral em benchmarks de treinamento MLPerf, demonstrando suas habilidades em todo o fluxo de trabalho de IA.

GPU Nvidia HGX A100

Desde sua estreia em julho de 2020 no MLPerf, as GPUs A100 aumentaram seu desempenho em 6x, graças às melhorias contínuas no software NVIDIA AI. A NVIDIA AI é a única plataforma para executar todas as cargas de trabalho e cenários de inferência MLPerf em data center e computação de ponta.

Os usuários precisam de desempenho versátil

A liderança de desempenho da GPU NVIDIA em todos os modelos significativos de IA valida a tecnologia para os usuários, já que os aplicativos do mundo real normalmente empregam muitas redes neurais de diferentes tipos. Por exemplo, um aplicativo de IA pode precisar entender a solicitação falada de um usuário, classificar uma imagem, fazer uma recomendação e, em seguida, fornecer uma resposta como uma mensagem falada em voz humana. Cada etapa requer um tipo diferente de modelo de IA.

Os benchmarks MLPerf abrangem essas e outras cargas de trabalho e cenários populares de IA, incluindo visão computacional, processamento de linguagem natural, sistemas de recomendação e reconhecimento de fala. Os resultados do MLPerf ajudam os usuários a tomar decisões de compra informadas com base em testes específicos, garantindo que os usuários obtenham um produto que oferece desempenho confiável e flexível.

Os benchmarks MLPerf são apoiados por um amplo grupo que inclui Amazon, Arm, Baidu, Google, Harvard, Intel, Meta, Microsoft, Stanford e a Universidade de Toronto.

Orin lidera no limite

Na computação de ponta, a NVIDIA Orin executou todos os benchmarks do MLPerf, vencendo mais testes do que qualquer outro sistema em um chip de baixo consumo de energia, proporcionando um aumento de até 50% na eficiência energética em comparação com a estreia em abril do MLPerf. Na rodada anterior, o Orin funcionou até 5x mais rápido do que o módulo Jetson AGX Xavier da geração anterior, ao mesmo tempo em que apresentou uma média de eficiência energética 2x melhor.

Orin integra em um único chip uma GPU de arquitetura NVIDIA Ampere e um cluster de poderosos núcleos de CPU Arm. Está disponível hoje no kit de desenvolvedor NVIDIA Jetson AGX Orin e nos módulos de produção para robótica e sistemas autônomos. Ele suporta toda a pilha de software NVIDIA AI, incluindo plataformas para veículos autônomos (NVIDIA Hyperion), dispositivos médicos (Clara Holoscan) e robótica (Isaac).

Amplo ecossistema de AI da NVIDIA

Os resultados do MLPerf mostram que o ecossistema mais amplo do setor apóia a NVIDIA AI no aprendizado de máquina. Mais de 70 envios nesta rodada foram executados na plataforma NVIDIA, e o Microsoft Azure apresentou resultados executando NVIDIA AI em seus serviços de nuvem.

Além disso, 19 sistemas certificados pela NVIDIA apareceram nesta rodada de 10 fabricantes de sistemas, incluindo ASUS, Dell Technologies, Fujitsu, GIGABYTE, Hewlett Packard Enterprise, Lenovo e Supermicro. Seu trabalho demonstra excelente desempenho com NVIDIA AI na nuvem e no local.

O MLPerf é uma ferramenta valiosa para clientes que avaliam plataformas e fornecedores de IA. Os resultados da última rodada demonstram que o desempenho oferecido por esses parceiros crescerá com a plataforma NVIDIA. Todo o software usado para esses testes está disponível no repositório MLPerf para que qualquer pessoa possa obter esses resultados. As otimizações são continuamente dobradas em contêineres disponíveis no NGC, o catálogo da NVIDIA para software acelerado por GPU. NVIDIA TensorRT, usado por todos os envios nesta rodada para otimizar a inferência de IA, está localizado no catálogo.

Executamos nossos próprios resultados de MLperf de borda recentemente em Supermicro e Lenovo plataformas com as GPUs T4 e A2 dentro.

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed