No centro da Visão da Intel está uma previsão significativa: o investimento empresarial em GenAI deverá quadruplicar, passando de 40 mil milhões de dólares em 2024 para uns impressionantes 151 mil milhões de dólares em 2027. No entanto, no meio deste optimismo, o caminho para a adopção empresarial está repleto de obstáculos.
No centro da Visão da Intel está uma previsão significativa: o investimento empresarial em GenAI deverá quadruplicar, passando de 40 mil milhões de dólares em 2024 para uns impressionantes 151 mil milhões de dólares em 2027. No entanto, no meio deste optimismo, o caminho para a adopção empresarial está repleto de obstáculos.
A Intel está firmemente comprometida em enfrentar esses desafios, fornecendo soluções GenAI escalonáveis, seguras e completas que enfrentam os obstáculos mais críticos da IA, desde complexidades de segurança e integração até preocupações com custos. Com um foco constante em permitir a transformação, a Intel está elaborando uma estratégia abrangente de IA empresarial, adotando uma abordagem baseada em ecossistema aberto em toda a sua linha de produtos, abrangendo PCs de IA, computação de ponta e data center.
Roubando a cena: acelerador Intel Gaudi 3
Na vanguarda da visão da Intel está o lançamento do acelerador Intel Gaudi 3 AI, acompanhando o desempenho e a eficiência estabelecidos de seu antecessor, o acelerador Intel Gaudi 2 AI. Oferecendo aos clientes a flexibilidade de software aberto baseado em comunidade e rede Ethernet padrão da indústria, o Gaudi 3 marca um salto significativo na escalabilidade do sistema.
Projetado para desempenho e eficiência GenAI, o Gaudi 3 oferece melhorias impressionantes em relação ao seu antecessor. Com computação de IA 4x para BF16, um aumento de 1.5x na memória e largura de banda de rede 2x, ele promete produtividade incomparável para treinamento de IA e inferência em modelos de linguagem grande (LLMs) e modelos multimodais.
Justin Hotard, vice-presidente executivo da Intel e gerente geral do Data Center e do AI Group, ressalta a importância de Gaudi 3 na abordagem do cenário em evolução do mercado de IA. Ele destaca a demanda por maior escolha entre as empresas e enfatiza a combinação atraente de desempenho de preço, escalabilidade e vantagem no tempo de obtenção de valor de Gaudi 3.
Em setores críticos como finanças, indústria e saúde, as empresas estão a expandir rapidamente a acessibilidade à IA, fazendo a transição da implementação experimental para a implementação em grande escala de projetos de IA generativa (GenAI). A Intel vê o acelerador Gaudi 3 como fundamental para atender a esses requisitos, oferecendo versatilidade por meio de software aberto baseado em comunidade e rede Ethernet padrão para dimensionar sistemas e aplicações de IA de maneira flexível.
A arquitetura personalizada do Gaudi 3 é adaptada para computação eficiente de IA em grande escala, fabricada em um processo de 5 nanômetros (nm) e equipada com os principais recursos:
- Mecanismo de computação dedicado à IA: Apresentando um mecanismo de computação heterogêneo composto por 64 Tensor Processor Cores (TPCs) customizados e programáveis por IA e oito mecanismos de multiplicação de matrizes (MMEs), o Gaudi 3 se destaca no tratamento de operações matriciais complexas fundamentais para algoritmos de aprendizagem profunda.
- Aumento de memória para requisitos de capacidade LLM: Com ampla capacidade de memória, largura de banda e memória de acesso aleatório estática (SRAM) integrada, o Gaudi 3 processa com eficiência grandes conjuntos de dados GenAI, melhorando o desempenho da carga de trabalho e a eficiência de custos do data center.
- Escalonamento eficiente do sistema para Enterprise GenAI: Integrado com vinte e quatro portas Ethernet de 200 gigabits, o Gaudi 3 permite redes flexíveis e de padrão aberto, facilitando o escalonamento eficiente para suportar grandes clusters de computação e, ao mesmo tempo, eliminar a dependência do fornecedor.
- Software de indústria aberta para produtividade do desenvolvedor: O software Gaudi integra a estrutura PyTorch e fornece modelos otimizados baseados na comunidade Hugging Face, aumentando a produtividade do desenvolvedor e facilitando a portabilidade de modelos entre tipos de hardware.
- Gaudi 3 PCIe: Apresentando um novo formato na linha de produtos, a placa complementar Gaudi 3 PCIe oferece alta eficiência e menor consumo de energia, ideal para cargas de trabalho como ajuste fino, inferência e geração aumentada de recuperação (RAG).
Espera-se que forneça melhorias significativas de desempenho para tarefas de treinamento e inferência nos principais modelos GenAI, o acelerador Gaudi 3 está preparado para revolucionar a IA e a computação de alto desempenho (HPC). Ele desempenhará um papel vital no Falcon Shores, a GPU de próxima geração da Intel, integrando a propriedade intelectual Intel Gaudi e Intel Xe com uma única interface de programação de GPU baseada na especificação Intel oneAPI.
Intel Gaudi 3 x NVIDIA
Durante a sessão de abertura, o CEO da Intel, Pat Gelsinger, foi o centro das atenções para apresentar o acelerador Intel Gaudi 3 AI. Espera-se que o Gaudi 3 ofereça um tempo de treinamento 50% mais rápido em comparação com o NVIDIA H100 nos parâmetros Llama2 7B e 13B e GPT-3 175B. Além disso, o acelerador Gaudi 3 pode produzir uma taxa de transferência de inferência 50% maior e uma eficiência de energia de inferência 40% melhor nos parâmetros Llama 7B e 70B e nos modelos de parâmetros Falcone 180B em comparação com o NVIDIA H200. Além disso, Gaudi 3 demonstrou inferência 30% mais rápida do que NVIDIA H200 nos parâmetros Llama 7B e 70B e nos modelos de parâmetros Falcon 180B.
Apresentando métricas de desempenho impressionantes, Gaudi 3 apresenta um rendimento de inferência notável de 50% melhor e eficiência energética 60% melhor em comparação com alternativas da indústria.
Apoiado pelos principais OEMs, como Dell Technologies, Supermicro, Lenovo e HPE, e aprimorado com recursos como suporte a placas PCIe, Gaudi 3 surge como uma GPU com tremendo potencial no cenário de IA.
Processadores Intel Xeon 6
Além do acelerador Intel Gaudi 3, a Intel forneceu atualizações sobre seus produtos e serviços de próxima geração em todos os segmentos de IA empresarial, com os novos processadores Intel Xeon 6.
Os processadores Intel Xeon 6 oferecerão soluções com desempenho eficiente para executar as atuais soluções GenAI, incluindo RAG, que produzem resultados específicos de negócios usando dados proprietários. A Intel lançou uma nova marca para seus processadores de próxima geração para data centers, nuvem e edge. Os processadores Intel Xeon 6 com novos núcleos eficientes (E-core) proporcionarão eficiência. Ao mesmo tempo, o Intel Xeon 6 com núcleos de desempenho (P-core) oferecerá maior desempenho de IA e será lançado logo após os processadores E-core.
Espera-se que os processadores Intel Xeon 6 com E-cores (anteriormente codinome Sierra Forest) ofereçam um desempenho melhorado de 2.4x por watt e uma densidade de rack 2.7x melhor do que os processadores Intel Xeon de 2ª geração. Os processadores Intel Xeon 6 com P-cores (anteriormente codinome Granite Rapids) incorporam suporte de software para o formato de dados MXFP4, reduzindo a latência de token subsequente em até 6.5x em relação ao Xeon de 4ª geração usando FP16 e a capacidade de executar 70 bilhões de parâmetros Llama2 modelos.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed