A NVIDIA e o Google Cloud colaboram para levar IA de agente para empresas que utilizam modelos de IA do Google Gemini por meio das plataformas Blackwell HGX e DGX.
A NVIDIA anunciou uma parceria estratégica com o Google Cloud para implementar IA agêntica em empresas. Essa colaboração permite que as empresas utilizem a família de modelos de IA do Google Gemini localmente por meio das plataformas Blackwell HGX e DGX da NVIDIA e da NVIDIA Confidential Computing para maior segurança de dados.
Habilitando conformidade e segurança com NVIDIA Blackwell
A plataforma NVIDIA Blackwell, integrada ao Google Distributed Cloud, capacita data centers locais a atender aos requisitos regulatórios e às leis de soberania de dados. As empresas podem garantir a conformidade, mantendo a eficiência operacional, restringindo o acesso a informações confidenciais, como registros de pacientes, transações financeiras e dados governamentais confidenciais. Além disso, a Computação Confidencial da NVIDIA protege o código sensível dos modelos Gemini, protegendo-o contra acesso não autorizado e possíveis violações de dados.
Sachin Gupta, vice-presidente e gerente geral de infraestrutura e soluções do Google Cloud, destacou que a parceria permite que as empresas aproveitem com segurança todo o potencial da IA agentic, combinando o desempenho e os recursos de computação confidencial do NVIDIA Blackwell com simplicidade operacional.
Segurança de dupla camada
A computação confidencial com NVIDIA Blackwell oferece às empresas a garantia técnica de que as solicitações do usuário à interface de programação de aplicativos (API) dos modelos Gemini e os dados usados para ajustes finos permanecem seguros. Essa segurança de camada dupla protege contra acesso não autorizado ou adulteração, permitindo que as empresas inovem com confiança com os modelos Gemini, preservando a privacidade dos dados.
O dilema local
Apesar dos avanços no raciocínio multimodal — integrando texto, imagens, código e outros tipos de dados para resolver problemas complexos —, empresas com requisitos rigorosos de segurança ou soberania de dados têm enfrentado desafios na adoção dessas tecnologias. Esta parceria aborda esses desafios, tornando o Google Cloud um dos primeiros provedores a oferecer recursos de computação confidencial para proteger cargas de trabalho de IA agêntica em todos os ambientes, sejam eles baseados em nuvem ou híbridos.
Com a plataforma NVIDIA HGX B200, GPUs Blackwell e NVIDIA Confidential Computing, esta solução permite que os clientes protejam seus modelos e dados de IA, alcançando desempenho e eficiência energética inovadores. As empresas agora podem manter a segurança dos dados e a integridade dos modelos sem comprometer a inovação.
Observabilidade e segurança da IA para IA Agentic
Escalar IA agêntica em produção requer observabilidade e segurança robustas para garantir desempenho e conformidade confiáveis. Para resolver esse problema, o Google Cloud lançou o GKE Inference Gateway, projetado para otimizar a implantação de cargas de trabalho de inferência de IA por meio de roteamento e escalabilidade avançados. Ao integrar-se ao NVIDIA Triton Inference Server e ao NVIDIA NeMo Guardrails, o gateway fornece balanceamento de carga inteligente que aprimora o desempenho e reduz os custos de serviço. Ele também permite segurança e governança centralizadas de modelos.
Olhando para o futuro, o Google Cloud planeja aprimorar a observabilidade de cargas de trabalho de IA agêntica integrando o NVIDIA Dynamo, uma biblioteca de código aberto projetada para atender e escalar modelos de IA de raciocínio em fábricas de IA. Essa abordagem prospectiva garante que as empresas possam escalar com confiança seus aplicativos de IA agêntica, mantendo a segurança e a conformidade.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed