A NVIDIA aproveitou o SC22 para fazer anúncios destacando uma nova onda de inovação em HPC que permite descobertas científicas revolucionárias. A NVIDIA destacou Quantum-2, Omniverse, HPC na borda e Digital Twin Simulation. Aqui está a compilação da NVIDIA.
A NVIDIA aproveitou o SC22 para fazer anúncios destacando uma nova onda de inovação em HPC que permite descobertas científicas revolucionárias. A NVIDIA destacou Quantum-2, Omniverse, HPC na borda e Digital Twin Simulation. Aqui está a compilação da NVIDIA.
O primeiro é o anúncio de que houve ampla adoção de sua próxima geração GPU H100 Tensor Core e Banda Infinita Quantum-2, incluindo novas ofertas na nuvem do Microsoft Azure e mais de 50 novos sistemas de parceiros para acelerar a descoberta científica.
A NVIDIA lançou atualizações significativas para suas bibliotecas de aceleração cuQuantum, CUDA e BlueField DOCA e anunciou suporte para sua plataforma de simulação Omniverse em sistemas NVIDIA A100 e H100. H100, Quantum-2 e as atualizações da biblioteca fazem parte da plataforma HPC da NVIDIA. A plataforma HPC inclui uma pilha de tecnologia completa com CPUs, GPUs, DPUs, sistemas, redes e uma ampla variedade de softwares de IA e HPC, oferecendo aos pesquisadores a capacidade de acelerar com eficiência seu trabalho em sistemas poderosos, no local ou na nuvem.
Azure oferece NVIDIA Quantum-2 para cargas de trabalho HPC
A adoção da plataforma de rede Quantum-2 InfiniBand pelo Microsoft Azure seguiu a disponibilidade geral do NVIDIA Quantum-2 anunciada no GTC em março.
Novos servidores turbinados com H100, NVIDIA AI
ASUS, Atos, Dell, HPE, Lenovo e Supermicro são apenas alguns dos parceiros da NVIDIA que anunciam servidores com tecnologia H100. Uma licença de cinco anos para NVIDIA AI Enterprise está incluída em cada GPU H100 PCIe. Isso garante que as organizações tenham acesso às estruturas e ferramentas de IA necessárias para criar soluções de IA aceleradas por H100, desde imagens médicas a modelos meteorológicos, sistemas de alerta de segurança e muito mais.
Entre a onda de novos sistemas está o Dell PowerEdge XE9680, também anunciado durante o SC22, que lida com as mais exigentes cargas de trabalho de IA e alto desempenho. Este é o primeiro sistema de oito vias da Dell baseado na plataforma NVIDIA HGX desenvolvida especificamente para convergência de simulação, análise de dados e IA.
O PowerEdge XE8640, o novo sistema HGX H100 da Dell com quatro GPUs Hopper, permite que as empresas desenvolvam, treinem e implantem modelos de IA e aprendizado de máquina. Um sistema de rack 4U, o XE8640 oferece desempenho de treinamento AI mais rápido e recursos principais aprimorados com até quatro slots PCIe Gen5, tecnologia NVIDIA Multi-Instance GPU (MIG) e NVIDIA GPU Direct Storage .
Principais atualizações para bibliotecas de aceleração
Para ajudar a impulsionar a descoberta científica, a NVIDIA lançou atualizações significativas para suas bibliotecas de aceleração CUDA, cuQuantum e DOCA, incluindo:
- As bibliotecas NVIDIA CUDA agora incluem um Eigensolver de vários nós e várias GPUs, permitindo escala e desempenho sem precedentes para os principais aplicativos de HPC, como o VASP, um pacote para cálculos mecânicos quânticos de princípios básicos.
- O kit de desenvolvimento de software NVIDIA cuQuantum para acelerar fluxos de trabalho de computação quântica agora oferece suporte a métodos de rede tensor aproximada. Isso permite que os pesquisadores simulem dezenas de milhares de qubits e habilitam automaticamente o suporte a vários nós e várias GPUs para simulação quântica com desempenho inigualável usando o cuQuantum Appliance.
- NVIDIA DOCA, o SDK de nuvem aberta e estrutura de aceleração para DPUs NVIDIA BlueField, inclui programação, segurança e funcionalidade avançadas para dar suporte a novos casos de uso de armazenamento.
Essas bibliotecas permitem que os pesquisadores dimensionem vários servidores e os equipem com aumentos de desempenho para impulsionar a descoberta científica. As bibliotecas de aceleração NVIDIA HPC estão disponíveis nas principais plataformas de nuvem AWS, Google Cloud, Microsoft Azure e Oracle Cloud Infrastructure.
Portais Abertos do Omniverse para Cientistas
Em seguida, a NVIDIA anunciou que o NVIDIA Omniverse agora se conecta aos principais softwares de visualização de computação científica e oferece suporte a novas cargas de trabalho de renderização em lote em sistemas com GPUs NVIDIA A100 e H100 Tensor Core.
A NVIDIA também introduziu gêmeos digitais industriais e científicos em tempo real para a comunidade de computação de alto desempenho, habilitados pelo NVIDIA OVX, um sistema de computação projetado para alimentar gêmeos digitais Omniverse em larga escala, e Omniverse Cloud, um software e infraestrutura como um -oferta de serviço.
O Omniverse agora oferece suporte a cargas de trabalho em lote que pesquisadores, cientistas e engenheiros de IA e HPC podem executar em seus sistemas A100 ou H100 existentes.
A NVIDIA também revelou conexões com ferramentas populares de computação científica, como o ParaView da Kitware, um aplicativo para visualização; NVIDIA IndeX para renderização volumétrica; NVIDIA Modulus para desenvolver modelos de ML de física; e NeuraVDB para representação de dados volumétricos esparsos em larga escala.
Usando cargas de trabalho Omniverse e de nuvem híbrida, os clientes de computação científica podem conectar pipelines de simulação e visualização herdados para obter interação distribuída, totalmente interativa e em tempo real verdadeiro com seus modelos e conjuntos de dados. Clientes da NVIDIA, como Argonne National Laboratory, Lockheed Martin e Princeton Plasma Physics Laboratory, já estão vendo os benefícios do Omniverse para cargas de trabalho de HPC.
Omniverse recebe apoio de Líderes Científicos Globais.
O Argonne National Laboratory está usando o NVIDIA Omniverse em seu supercomputador Polaris equipado com A100 para conectar suas ferramentas de visualização herdadas como um primeiro passo para desenvolver as bases para futuros gêmeos digitais.
O Laboratório de Física de Plasma de Princeton (PPPL), o laboratório nacional do Departamento de Energia dos EUA para física de plasma e ciência de fusão, está usando o Omniverse para conectar e acelerar simuladores HPC sintéticos de última geração em tempo real para modelar dispositivos de fusão e controlar sistemas e, finalmente, melhorar a operação do experimento em direção a uma nova fonte de energia limpa comercialmente viável.
Alinhando-se com a iniciativa Earth-2 da NVIDIA para acelerar a pesquisa climática, a Lockheed Martin, líder aeroespacial, começou recentemente a usar o NVIDIA Omniverse para fornecer à Administração Nacional Oceânica e Atmosférica (NOAA) dos EUA uma melhor consciência ambiental e situacional global e desenvolver um pipeline interativo de pesquisa climática.
Disponibilidade
Esses novos recursos agora têm suporte no NVIDIA Omniverse e estão disponíveis para desenvolvedores e empresas.
Plataforma NVIDIA resolve problemas de HPC na borda
Universidades e empresas que compartilham trabalho em longas distâncias exigem uma linguagem comum e um pipeline seguro para que todos os dispositivos, de microscópios e sensores a servidores e redes de campus, vejam e entendam os dados transmitidos. A crescente quantidade de dados que precisam ser armazenados, transmitidos e analisados apenas aumenta o desafio.
A NVIDIA está abordando o problema apresentando uma plataforma de computação de alto desempenho que combina computação de ponta e IA para capturar e consolidar dados de streaming de instrumentos científicos de ponta, permitindo que os dispositivos se comuniquem por longas distâncias.
A plataforma consiste em três componentes principais, NVIDIA Holoscan, MetroX-3 e NVIDIA BlueField-3 DPUs. O NVIDIA Holoscan é um kit de desenvolvimento de software que cientistas de dados e especialistas em domínio podem usar para criar pipelines acelerados por GPU para sensores que transmitem dados. O MetroX-3 é um novo sistema de longa distância que amplia a conectividade da plataforma NVIDIA Quantum-2 InfiniBand. E os DPUs NVIDIA BlueField-3 fornecem migração de dados segura e inteligente.
Os pesquisadores podem usar a nova plataforma NVIDIA para computação de borda HPC para se comunicar com segurança e colaborar na solução de problemas e reunir seus dispositivos e algoritmos díspares para operar como um grande supercomputador.
Holoscan para HPC na borda
Acelerado por plataformas de computação GPU que incluem os sistemas NVIDIA IGX, HGX e DGX, o NVIDIA Holoscan oferece o desempenho extremo necessário para processar fluxos massivos de dados gerados pelos instrumentos científicos do mundo.
O NVIDIA Holoscan para HPC inclui novas APIs para C++ e Python que os pesquisadores de HPC podem usar para criar fluxos de trabalho de processamento de dados de sensores flexíveis o suficiente para formatos sem imagem e escaláveis o suficiente para converter dados brutos em insights em tempo real.
O Holoscan também gerencia a alocação de memória para garantir trocas de dados de cópia zero, para que os desenvolvedores possam se concentrar na lógica do fluxo de trabalho e não se preocupar com o gerenciamento de arquivos e E/S de memória.
Os novos recursos do Holoscan estarão disponíveis para todos os desenvolvedores de HPC no próximo mês.
MetroX-3 vai longe
O sistema de longa distância NVIDIA MetroX-3, disponível no próximo mês, estende os mais recentes recursos nativos da nuvem da plataforma NVIDIA Quantum-2 InfiniBand desde a borda até o núcleo do data center HPC. Ele permite que as GPUs entre locais compartilhem dados com segurança pela rede InfiniBand a até 25 km de distância.
Aproveitando o acesso remoto direto à memória nativa, os usuários podem facilmente migrar dados e tarefas de computação de um minicluster conectado ao InfiniBand para o data center principal ou combinar clusters de computação dispersos geograficamente para maior desempenho geral e escalabilidade.
Os operadores de data center podem provisionar, monitorar e operar em todas as redes de data center conectadas ao InfiniBand usando o NVIDIA Unified Fabric Manager para gerenciar seus sistemas MetroX-3.
BlueField para HPC seguro e eficiente
Os DPUs NVIDIA BlueField descarregam, aceleram e isolam serviços avançados de rede, armazenamento e segurança para aumentar o desempenho e a eficiência do HPC moderno.
NVIDIA Traz Simulação de Gêmeos Digitais para Operadores de Data Center HPC
A simulação e os gêmeos digitais podem ajudar os projetistas, construtores e operadores de data centers a criar instalações altamente eficientes e de alto desempenho. A plataforma de simulação NVIDIA Omniverse ajuda a simplificar o processo de design virtual colaborativo.
O Omniverse agora permite que os operadores de data center agreguem informações em tempo real de seus principais aplicativos de design, simulação e monitoramento auxiliados por computador de terceiros, para que possam ver e trabalhar com seus conjuntos de dados completos em tempo real.
A demonstração do SC22 Omniverse mostra como o Omniverse permite que os usuários aproveitem o poder da computação acelerada, simulação e gêmeos digitais operacionais conectados ao monitoramento em tempo real e IA. Isso permite que as equipes simplifiquem o projeto das instalações, acelerem a construção e a implantação e otimizem as operações em andamento.
A demonstração também destacou o NVIDIA Air, uma plataforma de simulação de data center projetada para funcionar com o Omniverse para simular a rede. Com o NVIDIA Air, as equipes podem modelar toda a pilha de rede, permitindo automatizar e validar hardware e software de rede antes da criação.
Criando gêmeos digitais para elevar o design e a simulação
Ao planejar e construir um dos mais recentes supercomputadores de IA da NVIDIA, vários conjuntos de dados CAD de engenharia foram coletados de ferramentas do setor de terceiros, como Autodesk Revit, PTC Creo e Trimble SketchUp. Isso permitiu que projetistas e engenheiros visualizassem o modelo baseado na Universal Scene Description em total fidelidade e pudessem iterar colaborativamente no projeto em tempo real.
O PATCH MANAGER é um aplicativo de software empresarial para planejamento de cabeamento, ativos e conectividade ponto a ponto da camada física em domínios de rede. Com o PATCH MANAGER conectado ao Omniverse, a complexa topologia de conexões porta a porta, layouts de rack e nó e cabeamento podem ser integrados diretamente ao modelo ativo. Isso permite que os engenheiros do data center tenham uma visão completa do modelo e suas dependências.
Para prever o fluxo de ar e as transferências de calor, os engenheiros usaram o Cadence 6SigmaDCX, um software para dinâmica de fluidos computacional. Os engenheiros também podem usar substitutos de IA treinados com NVIDIA Modulus para análise “e se” quase em tempo real. Isso permite que as equipes simulem mudanças em temperaturas e resfriamento complexos e possam ver os resultados instantaneamente.
E com o NVIDIA Air, a topologia de rede exata — incluindo protocolos, monitoramento e automação — pode ser simulada e pré-validada.
Depois que um data center é construído, seus sensores, sistema de controle e telemetria podem ser conectados ao gêmeo digital dentro do Omniverse, permitindo o monitoramento em tempo real das operações.
Os engenheiros podem simular perigos comuns, como picos de energia ou falhas no sistema de resfriamento com um gêmeo digital perfeitamente sincronizado. Os operadores podem se beneficiar das mudanças recomendadas pela IA que otimizam as principais prioridades, como aumentar a eficiência energética e reduzir a pegada de carbono. O gêmeo digital também permite que eles testem e validem as atualizações de software e componentes antes da implantação no data center físico.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed