A AMD anunciou oficialmente o ROCm 7, uma nova versão de sua pilha de software open source projetada para acelerar a inteligência artificial (IA) e aumentar a produtividade dos desenvolvedores. Esta atualização vem como uma continuação do popular ROCm 6, que recebeu várias melhorias ao longo dos últimos anos, especialmente no campo da IA. 
O ROCm 7 traz mudanças significativas, com foco principal em melhorar o desempenho de inferência e a introdução de novas funcionalidades e otimizações.
O novo stack inclui diversas atualizações, como frameworks aprimorados, incluindo vLLM v1, llm-d e SGLang, com o objetivo de melhorar o desempenho de inferência. Também foram adicionadas otimizações como Inferência Distribuída, Prefill e Desagregação, o que deve aumentar a eficiência das cargas de trabalho de IA.
Uma das grandes novidades do ROCm 7 é a adição de novos kernels e algoritmos, como GEMM Autotuning, MoE e Attention, além de suporte à criação de kernels em Python. O stack agora também suporta tipos de dados avançados, como FP8, FP6, FP4 e precisão mista, o que proporcionará um grande aumento de desempenho, especialmente em modelos de IA e cálculos complexos. As GPUs MI350 da AMD agora têm suporte total para esses tipos de dados avançados, garantindo maior eficiência e desempenho.
Em termos de desempenho, a AMD destaca um impressionante aumento de 3,5x no desempenho de inferência. Por exemplo, o ROCm 7 apresenta um aumento de 3,2x no Llama 3.1 70B, 3,4x no Qwen2-72B e até 3,8x no DeepSeek R1 em comparação com o ROCm 6. Nos testes do DeepSeek R1, a GPU Instinct MI355X com ROCm 7 mostrou desempenho 30% mais rápido em comparação com a plataforma NVIDIA Blackwell B200 rodando CUDA, em termos de throughput FP8.
O desempenho em treinamento também apresentou um grande ganho, com até 3x de aumento em cargas de trabalho como Llama 2 70B, Llama 3.1 8B e Quen 1.5 7B. Essas melhorias fazem do ROCm 7 um forte concorrente no mercado de IA.
Como parte de sua expansão para IA corporativa, o ROCm 7 oferece soluções completas de ponta a ponta, integração segura de dados e facilidade de implementação, tornando-se uma escolha ideal para cargas de trabalho de GenAI. O stack também é compatível com diversos hardwares, incluindo GPUs, CPUs e DPUs, oferecendo suporte amplo para diferentes casos de uso.
No final deste ano, a AMD expandirá o suporte do ROCm para notebooks e estações de trabalho Ryzen, com suporte ao Linux e Windows previsto para o segundo semestre de 2025.
6 comentários
Já estou ansioso para testar isso na minha estação de trabalho! Finalmente a AMD está ficando competitiva em IA 💪
Legal, mas duvido que a NVIDIA não vá lançar algo melhor em breve 💀
Gostei desse aumento de 3,5x, mas será que isso se aplica no mundo real? 🤔
Novos algoritmos para IA? Legal, mas quem vai realmente usar isso? 🤷♂️
Hahaha, a AMD sempre sai com essas funcionalidades incríveis, mas quem realmente vai usar isso? 😂
Tesla abandonando a Nvidia e indo pra AMD… Será que eles conseguem competir com o CUDA? 🤔