Início » Sem categoria » MLPerf v5.1: comparativo entre NVIDIA Blackwell Ultra GB300 e AMD Instinct MI355X

MLPerf v5.1: comparativo entre NVIDIA Blackwell Ultra GB300 e AMD Instinct MI355X

por ytools
1 comentário 1 visualizações

A mais recente rodada de benchmarks MLPerf v5.1 AI Inference chegou e trouxe uma disputa de peso no setor de aceleração de IA. Os holofotes ficaram sobre a nova NVIDIA Blackwell Ultra GB300 e a AMD Instinct MI355X, chips que representam o auge da tecnologia de cada fabricante.
MLPerf v5.1: comparativo entre NVIDIA Blackwell Ultra GB300 e AMD Instinct MI355X
A Intel também entrou em cena com a Arc Pro B60, mas a verdadeira batalha aconteceu entre NVIDIA e AMD.

NVIDIA Blackwell Ultra GB300 impressionou logo de cara. No teste DeepSeek R1 (Offline), um cluster de 72 GPUs atingiu 420.569 amostras por segundo, contra 289.712 da geração anterior GB200 – um salto de 45%, praticamente confirmando a promessa de 50% de ganho feita pela empresa. Mesmo em configurações menores, com 8 GPUs, a GB300 mostrou 48.047 amostras por segundo, superando a GB200 em 44%. Isso significa mais velocidade para treinar e rodar modelos com menor latência.

No modo DeepSeek R1 (Server), que mede desempenho em cargas dinâmicas, a GB300 também levou vantagem: 25% mais rápida em 72 GPUs e 21% melhor em 8 GPUs. Para aplicações que exigem respostas em tempo real – como chatbots, sistemas de recomendação e assistentes virtuais – esses ganhos são cruciais.

AMD Instinct MI355X não ficou atrás. No benchmark Llama 3.1 405B (Offline), um setup com 8 GPUs registrou 2.109 tokens por segundo, 27% a mais que o GB200 em configuração equivalente. Foi um recado claro de que a AMD não só compete, mas pode superar em cenários específicos.

O destaque maior veio no Llama 2 70B (Offline). Usando 64 aceleradores, o MI355X entregou 648.248 tokens por segundo. Com 32 GPUs, foram 350.820, e com apenas 8, ainda impressionou com 93.045. Em comparação, o GB200 (8 GPUs) ficou em 65.770 – ou seja, a AMD mais que dobrou a taxa da NVIDIA nesse teste. Fica evidente que o MI355X é altamente otimizado para modelos generativos de larga escala.

A Intel Arc Pro B60, embora com números bem mais modestos (cerca de 3.009 tokens/s no Llama 2 70B), tem uma proposta diferente. Seu apelo está no custo-benefício e em atender pequenas equipes e laboratórios que não precisam de soluções de data center mas querem acelerar cargas de IA.

A NVIDIA também reforçou seu diferencial: recordes em tarefas de raciocínio. A Blackwell Ultra GB300 superou a geração Hopper em até 4,7 vezes nos testes offline e 5,2 vezes em servidores. Isso mostra que não se trata apenas de força bruta, mas também de capacidade em lidar com cargas de IA mais complexas.

O que esperar daqui para frente? Novas otimizações de software, drivers mais ajustados e rounds ainda mais acirrados nos próximos MLPerf. Para quem acompanha o setor, fica claro que estamos em uma corrida acelerada. A escolha entre plataformas não dependerá apenas dos números crus, mas da compatibilidade com workloads, da maturidade do ecossistema e do custo total de operação. Uma coisa é certa: o nível do jogo em inferência de IA subiu de vez.

Você também pode gostar de

1 comentário

XiaoMao October 10, 2025 - 2:31 pm

intel arc b60 é tipo placa de entrada mas serve pra labs

Responder

Deixe um comentário