Home EmpreendimentoAI VMware Private AI ajudará as empresas a cumprir a promessa da IA ​​generativa

VMware Private AI ajudará as empresas a cumprir a promessa da IA ​​generativa

by Haroldo Fritts

No evento VMware Explore 2023, a VMware revelou novas ofertas de IA privada destinadas a promover a adoção de IA generativa nas empresas e aproveitar o potencial de dados confiáveis. Caracterizado por sua abordagem arquitetônica, o VMware Private AI equilibra os benefícios da IA ​​com os requisitos práticos de privacidade e conformidade das organizações.

No evento VMware Explore 2023, a VMware revelou novas ofertas de IA privada destinadas a promover a adoção de IA generativa nas empresas e aproveitar o potencial de dados confiáveis. Caracterizado por sua abordagem arquitetônica, o VMware Private AI equilibra os benefícios da IA ​​com os requisitos práticos de privacidade e conformidade das organizações.

VMware Private AI Foundation com NVIDIA permitirá que as empresas personalizem modelos e executem aplicativos generativos de IA, incluindo chatbots inteligentes, assistentes, pesquisa e resumo. A plataforma será uma solução totalmente integrada com software de IA generativo e computação acelerada da NVIDIA, construído em VMware Cloud Foundation e otimizado para IA.

Com base em sua parceria estratégica, a oferta VMware Private AI Foundation com NVIDIA fornece às empresas implantadas na infraestrutura em nuvem da VMware as ferramentas para abraçar o interesse crescente na era da IA ​​generativa. Esta extensão integra a arquitetura de IA privada da VMware com o software NVIDIA AI Enterprise e computação acelerada, fornecendo uma solução pronta para uso para implantação de aplicativos generativos de IA em data centers, nuvens públicas e na borda.

Para obter benefícios comerciais mais rapidamente, as empresas procuram agilizar o desenvolvimento, os testes e a implantação de aplicações generativas de IA. A VMware Private AI Foundation com NVIDIA permitirá que as empresas aproveitem esse recurso, personalizando grandes modelos de linguagem, produzindo modelos mais seguros e privados para uso interno e oferecendo IA generativa como serviço aos seus usuários, executando com segurança cargas de trabalho de inferência em escala.

Resumo da IA ​​privada da VMware

Espera-se que a plataforma inclua ferramentas integradas de IA para capacitar as empresas a executar modelos comprovados treinados em seus dados privados de maneira econômica. Os clientes obtêm os resultados desejados de IA com a arquitetura de referência de IA privada da VMware para código aberto, aproveitando tecnologias de software de código aberto de primeira linha, atendendo aos requisitos atuais e futuros.

Ecossistema aberto de IA privada da VMware

Espera-se que a plataforma seja construída sobre os softwares VMware Cloud Foundation e NVIDIA AI Enterprise, com inúmeros benefícios. Do ponto de vista da privacidade, os clientes podem executar serviços de IA adjacentes ao local onde os dados residem, com uma arquitetura que preserva a privacidade dos dados com acesso seguro.

As empresas terão uma ampla escolha de onde construir e executar seus modelos, desde NVIDIA NeMo até Llama 2. Inclui configurações de hardware OEM e, no futuro, ofertas de nuvem pública e provedores de serviços.

Base VMware Private AI com NVIDIA

O desempenho esperado deve ser igual ou superior ao bare metal com a plataforma rodando na infraestrutura acelerada da NVIDIA. As otimizações de dimensionamento de GPU em ambientes virtualizados permitirão que cargas de trabalho de IA sejam dimensionadas para até 16 vGOUs/GPUs em uma única VM e vários nós para acelerar o ajuste fino e as implantações do modelo de IA generativo.

Maximizar o uso de todos os recursos de computação em GPUs, DPUs e CPUs significa que os custos gerais deverão ser menores, ao mesmo tempo em que se cria um ambiente de recursos agrupados e compartilhados entre as equipes. VMware vSAN Express Storage Architecture (ESA) fornecerá armazenamento NVMe com desempenho otimizado, suportando armazenamento GPUDirect sobre RDMA, fornecendo transferência direta de E/S do armazenamento para GPUs sem envolver a CPU.

A profunda integração entre o vSphere e o NVIDIA NVSwitch permitirá que modelos multi-GPU sejam executados sem gargalos entre GPUs, proporcionando rede acelerada.

Todos esses benefícios significarão pouco se levar muito tempo para implantar e obter retorno. Com imagens de VM e repositório de imagens do vSphere Deep Learning, os recursos de prototipagem rápida oferecem uma imagem de solução pronta e estável que inclui estruturas pré-instaladas e bibliotecas com desempenho otimizado.

NVIDIA NeMo, uma estrutura nativa da nuvem de ponta a ponta e sistema operacional para a plataforma NVIDIA AI incluída no NVIDIA AI Enterprise, é um recurso da plataforma. O NeMo permite que as empresas construam, personalizem e implantem modelos generativos de IA praticamente em qualquer lugar, combinando estruturas de personalização, kits de ferramentas de proteção, ferramentas de curadoria de dados e modelos pré-treinados para oferecer às empresas um caminho fácil, econômico e eficiente para a adoção de IA generativa.

Implantando IA generativa na produção, o NeMo usa TensorRT para Large Language Models (TRT-LLM), acelerando e otimizando o desempenho de inferência nos LLMs mais recentes em GPUs NVIDIA. Com o NeMo, o VMware Private AI Foundation com NVIDIA permite que as empresas extraiam seus dados para construir e executar modelos de IA generativos personalizados na infraestrutura de nuvem híbrida da VMware.

O VMware Private AI Foundation estende os recursos e modelos de IA para onde os dados corporativos são gerados, processados ​​e consumidos, independentemente de ser em uma nuvem pública, em um data center corporativo ou na borda. Ao apresentar essas novas ofertas, a VMware pretende permitir que os clientes unam flexibilidade e controle, impulsionando uma nova geração de aplicativos baseados em IA. As aplicações têm o potencial de aumentar significativamente a produtividade dos trabalhadores, desencadear a transformação nas principais funções empresariais e gerar um impacto económico substancial – um relatório da McKinsey projeta que a IA generativa contribuirá com até 4.4 biliões de dólares anualmente para a economia global.

Crucial para o sucesso desta evolução é o estabelecimento de um ambiente multinuvem, pois abre caminho para a utilização de dados privados, mas amplamente distribuídos. A estratégia multinuvem da VMware capacita as empresas com maior flexibilidade na construção, personalização e implantação de modelos de IA usando dados privados, ao mesmo tempo que garante segurança e resiliência em ambientes variados.

Raghu Raghuram, CEO da VMware, enfatiza que a viabilidade da IA ​​generativa depende da manutenção da privacidade dos dados e da minimização dos riscos de IP. O VMware Private AI aborda essas preocupações, permitindo que as organizações aproveitem seus dados confiáveis ​​para a construção e execução eficiente de modelos de IA em um ambiente multinuvem.

Fundação privada de IA da VMware

Plataforma empresarial de IA da NVIDIA

nemo

Envolva-se com a StorageReview 

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed