A arquitetura AMD Zen 5 emprega um design modular inovador, permitindo à AMD criar CPUs para desktops, servidores, clientes e embarcados.
O 2024 Tech Day da AMD revelou os detalhes por trás dos últimos avanços e cobriu muito terreno, especialmente com suas mais recentes CPU Zen 5 e arquiteturas centradas em IA XDNA. Este evento enfatizou a visão da AMD de revolucionar a eficiência da IA, o desempenho de energia e a integração perfeita entre vários aplicativos, reafirmando sua liderança no setor de computação de alto desempenho.
A colaboração estratégica com a Microsoft preparou o terreno para a liderança da AMD em experiências de PC com IA, oferecendo eficiência, desempenho e integração sem precedentes em uma ampla gama de aplicativos. As CPUs EPYC de 5ª geração, com até 192 núcleos e 384 threads, prometem ganhos significativos em eficiência energética e aceleração de IA. Com previsão de ramificação avançada, tubos de decodificação duplos e uma nova unidade de aceleração matemática, a AMD afirma que o Zen 5 oferece uma melhoria de 35% no desempenho AES-XTS de núcleo único e um aumento de 32% nas tarefas de aprendizado de máquina em relação ao seu antecessor. À medida que a AMD continua a ultrapassar os limites do poder e eficiência de processamento, a arquitetura Zen 5 está preparada para revolucionar os mercados de data centers e servidores.
A arquitetura AMD Zen 5 emprega um design modular inovador, permitindo à AMD criar produtos personalizados para desktop, servidor, cliente e aplicativos incorporados. A incorporação de tecnologias de processo de 4nm e 3nm garante que os produtos baseados no Zen5 possam oferecer desempenho otimizado e eficiência energética em diversos casos de uso.
AMD Zen 5
Na apresentação da AMD no 2024 Tech Day, Mark Papermaster revelou avanços significativos em sua arquitetura Zen 5, destacando particularmente as CPUs EPYC de 5ª geração. A linha EPYC, a ser lançada no segundo semestre de 2024, promete entregar desempenho e eficiência incomparáveis, levando ao extremo as métricas de densidade e desempenho nos mercados de servidores e data centers.
As CPUs EPYC de 5ª geração aumentaram significativamente a contagem de núcleos e a capacidade de threading. Essas melhorias também incluem melhorias na eficiência energética, que foram possíveis através de uma parceria contínua com a TSMC e de uma pilha de metal otimizada. Este último melhorou notavelmente o desempenho térmico e elétrico. A arquitetura aproveita a aceleração avançada de IA ao introduzir uma nova Unidade de Aceleração Matemática que promete uma melhoria de até 35% no desempenho AES-XTS de núcleo único e até 32% em tarefas de aprendizado de máquina de núcleo único em comparação com o Zen 4.
Os avanços arquitetônicos no Zen 5 são abrangentes. Os estágios de busca e decodificação de instruções foram aprimorados com previsão avançada de ramificação e tubos de decodificação duplos para reduzir a latência e melhorar a precisão. As unidades de execução inteiras recebem uma atualização substancial com capacidades de despacho/retirada de 8 larguras e um agendador ALU mais unificado, tudo dentro de uma janela de execução maior. Os avanços de carregamento/armazenamento incluem um cache de dados L48 de 12 vias de 1 KB com o dobro da largura de banda máxima para o cache L1 e para a unidade de ponto flutuante, o que é crucial para operações com muitos dados.
A arquitetura Zen 5 também inclui melhorias significativas na largura de banda de dados. Os avanços de carregamento/armazenamento, com um cache de dados L48 de 12 vias de 1 KB, apresentam o dobro da largura de banda máxima para o cache L1 e a unidade de ponto flutuante, essencial para operações com uso intensivo de dados. A capacidade da arquitetura de lidar com um grande número de instruções de ponto flutuante em voo, com AVX-512 e um caminho de dados completo de 512 bits, garante ganhos substanciais de desempenho em cargas de trabalho de IA e vetoriais.
A execução de unidades matemáticas de ponto flutuante e vetorial também teve melhorias significativas. O AVX-512, com um caminho de dados completo de 512 bits e seis pipelines (que oferecem latência de dois ciclos para operações de adição de ponto flutuante), aprimora significativamente a capacidade de gerenciar instruções simultâneas de ponto flutuante. Isso beneficia particularmente as cargas de trabalho de vetores e IA, permitindo melhorias significativas de desempenho em aprendizado de máquina e tarefas com uso intensivo de dados. Isso contrasta com o Zen 4, onde a AMD “bombou duas vezes” o caminho de 256 bits para alcançar desempenho de 512 bits.
O Zen 5 traz um aumento médio de IPC de 16% para processadores de desktop e móveis em relação ao seu antecessor, o Zen 4. Isso é alcançado por meio de refinamentos arquitetônicos, incluindo unidades de despacho e execução mais amplas, maior largura de banda de dados e algoritmos de pré-busca aprimorados. Os ganhos do IPC se traduzem em melhorias reais de desempenho em diversas aplicações, desde jogos até criação de conteúdo e aprendizado de máquina.
No que diz respeito à GPU, a AMD continua a otimizar sua arquitetura RDNA 3 para eficiência no desempenho de energia. A AMD afirma desempenho por watt até 32% maior do que as CPUs Ryzen anteriores. Isto é conseguido através de um melhor gerenciamento de memória, operações comuns de textura de jogo com taxa dupla e recursos aprimorados de gerenciamento de energia.
A arquitetura Zen 5 da AMD é uma evolução impressionante na arquitetura Zen, especialmente para a linha EPYC, que promete aumentar os padrões de desempenho em todos os setores, desde desktops e dispositivos móveis até mercados de servidores e data centers. Com melhorias significativas na contagem de núcleos, threading, eficiência de energia e aceleração de IA em alguns chips, as CPUs EPYC de 5ª geração estão posicionadas para atender às demandas crescentes de cargas de trabalho modernas centradas em dados.
XDNA
Vamsi Boppana, vice-presidente sênior do Grupo de Inteligência Artificial, descreveu o potencial transformador da nova arquitetura centrada em IA da AMD. O crescimento exponencial e a especialização das cargas de trabalho de IA exigem arquiteturas de computação inovadoras, e a resposta da AMD é a introdução da arquitetura XDNA 2.
No centro desta inovação está a arquitetura AMD XDNA, conhecida por seu legado em diversas aplicações de IA e DSP, abrangendo comunicação, implantação 5G, processamento de sinal de radar de defesa, processamento de IA de transmissão em tempo real para pontos de vista 3D e processamento de imagens de saúde. A arquitetura passa das hierarquias tradicionais de computação fixa e memória baseada em cache para um modelo mais flexível e adaptável. Essa reconfigurabilidade espacial e arquitetura de fluxo de dados lado a lado permitem multitarefa eficiente e desempenho garantido em tempo real.
A apresentação destacou o processador x86 da AMD com NPU integrado, projetado para oferecer alta eficiência e desempenho para cargas de trabalho de IA. Os processadores AMD Ryzen AI de 3ª geração apresentam avanços significativos nos recursos de NPU, alcançando até 50 TOPS (trilhões de operações por segundo) e incorporando até 12 núcleos de CPU e 16 unidades de computação de GPU. Esses processadores são configurados para potencializar mais de 100 experiências baseadas em IA em plataformas como Adobe, Black Magic e Topaz Labs, tornando-os centrais para experiências de PC com IA de próxima geração.
O mecanismo de IA na arquitetura XDNA 2 inclui suporte aprimorado para diversos tipos de dados, como INT8 e Block FP16, o que garante alto desempenho e precisão em uma variedade de aplicações de IA. A arquitetura adaptativa de IA permite integração escalável em todo o portfólio de produtos da AMD, oferecendo multitarefa eficiente e desempenho garantido em tempo real por meio de reconfigurabilidade espacial e uma arquitetura de fluxo de dados lado a lado.
O bloco FP16, em particular, permite uma substituição imediata para modelos FP32 com pouca ou nenhuma perda de precisão, tornando-o altamente eficiente para tarefas como geração de imagens, modelos de linguagem e processamento de áudio e vídeo em tempo real.
Um recurso de destaque é a capacidade de configurar a estrutura XDNA em tempo de execução. Isso permite flexibilidade com caminhos de dados e segmentação da NPU para executar vários modelos de tamanhos diferentes simultaneamente. Ele também oferece flexibilidade para oferecer experiências baseadas em IA, como Copilot+, para maior produtividade e colaboração envolvente. A integração da pilha unificada de software de IA nos componentes de CPU, GPU e NPU da AMD permite amplo suporte a modelos e desempenho otimizado, tornando mais fácil para os desenvolvedores implantarem milhares de modelos de IA de forma rápida e eficaz.
A arquitetura AMD XDNA 2 demonstra um salto significativo na tecnologia de IA. Com até oito fluxos espaciais simultâneos, duplica a eficiência energética das gerações anteriores. Isso torna a solução da AMD poderosa e altamente eficiente, abrindo caminho para uma nova era de aplicações de IA em PCs e muito mais.
Os processadores AMD Ryzen AI de 3ª geração também apresentam segurança aprimorada com a introdução de novos recursos de Trusted IO. Este aprimoramento de segurança é crucial para proteger dados confidenciais e garantir um desempenho confiável em aplicações orientadas por IA, reforçando o compromisso da AMD com soluções de IA seguras e eficientes.
Especificações AMD Zen 5 e XDNA 2
Arquitetura Zen 5 | |
Característica | Detalhes |
Processo tecnológico | 4nm e 3nm |
Contagem de núcleo | Até 192 núcleos |
A contagem da linha | Até 384 fios |
Esconderijo | Cache de dados L48 de 12 KB e 1 vias |
Largura de Banda | Dobre a largura de banda máxima para cache L1 e unidade de ponto flutuante |
Execução Inteira | Despacho/retirada de 8 larguras, 6 ALU, 3 multiplicações |
Execução de Ponto Flutuante | AVX-512 com caminho de dados completo de 512 bits, 6 pipelines |
Aceleração AI | Nova Unidade de Aceleração Matemática |
Elevação do IPC | Aumento médio de IPC de 16% em relação ao Zen 4 |
Ganhos de desempenho | Melhoria de 35% em AES-XTS de núcleo único, aumento de 32% em tarefas de aprendizado de máquina |
Eficiência energética | Otimizado para desempenho/watt com pilha de metal aprimorada |
Aplicações do produto | Desktop, dispositivos móveis, servidores e data center |
Arquitetura XDNA 2 | |
Blocos de motor de IA | Até 32 |
Desempenho de IA | Até 50 TOPS |
Contagem de núcleo | Até 12 núcleos de CPU |
Unidades de computação GPU | Até 16 |
Tipos de dados suportados | INT8, Bloco FP16 |
Eficiência | Eficiência energética 2x em comparação com a geração anterior |
Fluxos de concorrentes | Até 8 |
Segurança | Novos recursos de E/S confiáveis |
Pilha de software | Pilha unificada de software de IA em CPU, GPU e NPU |
Desempenho em tempo real | Desempenho garantido em tempo real com arquitetura espacial |
Aplicações | Jogos, entretenimento, assistência pessoal de IA, criação de conteúdo, produtividade empresarial |
Overclocking de desktop Zen 5 com Curve Shaper
O Curve Optimizer da AMD, um recurso característico da série Ryzen 7000, permite que os usuários habilitem escalonamento ou subtensão dinâmicos com reconhecimento de PMFW/PBO. Esta ferramenta poderosa muda dinamicamente a curva de tensão através de etapas ajustáveis de “Otimizador de Curva”, fornecendo tensão variável em todo o espectro de frequência, com mais tensão alocada em frequências mais altas. Os usuários podem aplicar essa otimização por núcleo, por CCD ou por CPU, permitindo controle granular sobre o desempenho e a eficiência de sua CPU.
Com base no Curve Optimizer, a AMD apresenta o Curve Shaper, um aprimoramento sofisticado que permite aos usuários remodelar as curvas de tensão subjacentes para maximizar o potencial de subtensão. Curve Shaper utiliza as mesmas etapas de seu antecessor. Ainda assim, ele concede aos usuários a flexibilidade de adicionar ou remover seletivamente etapas de 15 bandas distintas de frequência-temperatura (três bandas de temperatura e cinco bandas de frequência). Esta capacidade de ajuste fino permite que os usuários reduzam ainda mais a tensão em bandas estáveis, ao mesmo tempo que adicionam tensão em áreas onde são observadas instabilidades. A curva remodelada é aplicada uniformemente em todos os núcleos, que pode ser ajustada ainda mais usando o Curve Optimizer.
Pensamentos de Encerramento
O AMD Tech Day 2024 foi um grande evento onde tivemos a oportunidade muito apreciada de nos aprofundarmos nos engenheiros por trás dos produtos. Os mais recentes avanços da AMD com a arquitetura XDNA 2 e CPUs Zen 5 destacam seu compromisso em liderar a revolução da IA e da computação de alto desempenho. Com melhorias inovadoras na contagem de núcleos, threading, eficiência de energia e aceleração de IA, a AMD está preparada para redefinir os padrões da indústria e atender às demandas crescentes de cargas de trabalho modernas centradas em dados, garantindo amplo desempenho em aplicativos de desktop, móveis, servidores e data centers.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed