Início » Sem categoria » AMD Anuncia ROCm 7 com Novas Funcionalidades para IA e Performance Melhorada

AMD Anuncia ROCm 7 com Novas Funcionalidades para IA e Performance Melhorada

por ytools
6 comentários 1 visualizações

A AMD anunciou oficialmente o ROCm 7, uma nova versão de sua pilha de software open source projetada para acelerar a inteligência artificial (IA) e aumentar a produtividade dos desenvolvedores. Esta atualização vem como uma continuação do popular ROCm 6, que recebeu várias melhorias ao longo dos últimos anos, especialmente no campo da IA.
AMD Anuncia ROCm 7 com Novas Funcionalidades para IA e Performance Melhorada
O ROCm 7 traz mudanças significativas, com foco principal em melhorar o desempenho de inferência e a introdução de novas funcionalidades e otimizações.

O novo stack inclui diversas atualizações, como frameworks aprimorados, incluindo vLLM v1, llm-d e SGLang, com o objetivo de melhorar o desempenho de inferência. Também foram adicionadas otimizações como Inferência Distribuída, Prefill e Desagregação, o que deve aumentar a eficiência das cargas de trabalho de IA.

Uma das grandes novidades do ROCm 7 é a adição de novos kernels e algoritmos, como GEMM Autotuning, MoE e Attention, além de suporte à criação de kernels em Python. O stack agora também suporta tipos de dados avançados, como FP8, FP6, FP4 e precisão mista, o que proporcionará um grande aumento de desempenho, especialmente em modelos de IA e cálculos complexos. As GPUs MI350 da AMD agora têm suporte total para esses tipos de dados avançados, garantindo maior eficiência e desempenho.

Em termos de desempenho, a AMD destaca um impressionante aumento de 3,5x no desempenho de inferência. Por exemplo, o ROCm 7 apresenta um aumento de 3,2x no Llama 3.1 70B, 3,4x no Qwen2-72B e até 3,8x no DeepSeek R1 em comparação com o ROCm 6. Nos testes do DeepSeek R1, a GPU Instinct MI355X com ROCm 7 mostrou desempenho 30% mais rápido em comparação com a plataforma NVIDIA Blackwell B200 rodando CUDA, em termos de throughput FP8.

O desempenho em treinamento também apresentou um grande ganho, com até 3x de aumento em cargas de trabalho como Llama 2 70B, Llama 3.1 8B e Quen 1.5 7B. Essas melhorias fazem do ROCm 7 um forte concorrente no mercado de IA.

Como parte de sua expansão para IA corporativa, o ROCm 7 oferece soluções completas de ponta a ponta, integração segura de dados e facilidade de implementação, tornando-se uma escolha ideal para cargas de trabalho de GenAI. O stack também é compatível com diversos hardwares, incluindo GPUs, CPUs e DPUs, oferecendo suporte amplo para diferentes casos de uso.

No final deste ano, a AMD expandirá o suporte do ROCm para notebooks e estações de trabalho Ryzen, com suporte ao Linux e Windows previsto para o segundo semestre de 2025.

Você também pode gostar de

6 comentários

Anonymous July 8, 2025 - 11:41 pm

Já estou ansioso para testar isso na minha estação de trabalho! Finalmente a AMD está ficando competitiva em IA 💪

Responder
Anonymous October 26, 2025 - 4:36 pm

Legal, mas duvido que a NVIDIA não vá lançar algo melhor em breve 💀

Responder
Anonymous October 29, 2025 - 11:06 pm

Gostei desse aumento de 3,5x, mas será que isso se aplica no mundo real? 🤔

Responder
Anonymous November 12, 2025 - 8:43 am

Novos algoritmos para IA? Legal, mas quem vai realmente usar isso? 🤷‍♂️

Responder
Anonymous November 22, 2025 - 10:44 pm

Hahaha, a AMD sempre sai com essas funcionalidades incríveis, mas quem realmente vai usar isso? 😂

Responder
Anonymous November 23, 2025 - 9:44 pm

Tesla abandonando a Nvidia e indo pra AMD… Será que eles conseguem competir com o CUDA? 🤔

Responder

Deixe um comentário