Início » Sem categoria » AMD Instinct MI350: o monstro de IA com 288GB HBM3e

AMD Instinct MI350: o monstro de IA com 288GB HBM3e

por ytools
0 comentário 1 visualizações

A AMD chegou com tudo no Hot Chips 2025 ao detalhar a nova série Instinct MI350, baseada na arquitetura CDNA 4 e construída em chiplets 3nm + 6nm.
AMD Instinct MI350: o monstro de IA com 288GB HBM3e
Esses aceleradores foram projetados para lidar com cargas massivas de IA e finalmente encarar de frente a NVIDIA no segmento de data centers.

O motivo é claro: os modelos de linguagem estão ficando gigantescos e exigem memória cada vez maior. A solução da AMD foi ousada – ampliar radicalmente a memória e incluir novos formatos de dados. O resultado é que o MI350 suporta modelos acima de 4000B parâmetros, com 288 GB de memória HBM3e e largura de banda de até 8 TB/s.

A linha conta com duas versões principais. O MI350X vem com refrigeração a ar, até 1000W e clock de 2.2 GHz. Já o MI355X é voltado para data centers, com refrigeração líquida, 1400W e até 2.4 GHz. Ambos possuem 185 bilhões de transistores e 8 chiplets de processamento (XCDs) fabricados em 3nm, além de dois chiplets de I/O em 6nm.

Em memória, é um espetáculo: oito pilhas de HBM3e entregam 288 GB, acompanhados de uma Infinity Cache de 256 MB e interconexão Infinity Fabric de 5.5 TB/s. Nos números de performance, o MI355X chega a 80.5 PFLOPs em FP8 e 20 PFLOPs em FP4/FP6 – um salto de 4x geração a geração. Em testes de inferência com Llama 3.1 405B, a AMD fala em 35x de ganho sobre o MI300.

A flexibilidade também chama atenção. É possível particionar GPU e memória, rodando até oito modelos de 70B parâmetros em paralelo. Os sistemas escalam para oito aceleradores por placa UBB, integrados com CPUs EPYC de 5ª geração e NICs Pensando.

Comparando com a concorrência, a AMD promete 2x mais performance FP64 e 1.6x mais memória que a NVIDIA GB200, mantendo igualdade no FP8 e introduzindo novos formatos FP6/FP4. Frente à geração anterior MI300, o salto é simplesmente enorme.

A disponibilidade está marcada para o terceiro trimestre de 2025 através dos parceiros da AMD. E para 2026, já foi confirmada a próxima geração MI400. Mas, por enquanto, o MI350 é a declaração de guerra da AMD: um acelerador de IA pronto para a era dos modelos de trilhões de parâmetros.

Você também pode gostar de

Deixe um comentário