A Tachyum voltou aos holofotes com mais uma versão do seu processador Prodigy, e desta vez a promessa é ainda mais agressiva: um chip de 2 nm com até 1024 núcleos de 64 bits rodando a até 6 GHz, 1 GB de cache de último nível, suporte a 24 canais de DDR5-17600 e desempenho em IA supostamente mais de 20 vezes superior ao da plataforma NVIDIA Rubin Ultra por rack. No papel, parece o processador perfeito para matar de uma vez só CPUs tradicionais, GPUs e aceleradores dedicados. 
Na prática, porém, ainda estamos falando de um projeto que vive em slides, simulações e emuladores FPGA, não em servidores reais instalados em data centers.
Para entender por que o Prodigy gera tanto hype e tanta desconfiança ao mesmo tempo, vale lembrar o histórico da empresa. A Tachyum vem falando do seu "processador universal" desde por volta de 2018, vendendo a ideia de um único chip capaz de assumir o papel de CPU, GPU e TPU. A primeira encarnação pública citava algo em torno de 128 núcleos em 5 nm, rodando perto de 5,7 GHz. Com o tempo, o número de núcleos foi subindo para 192, depois 256 por chiplet, e o cronograma foi escorregando: datas que iam de 2020 a 2021, 2022 e, mais recentemente, meados desta década. Nenhuma dessas versões, porém, virou produto comercial.
Do sonho de 128 núcleos ao plano de 1024 núcleos em 2 nm
A iteração atual da visão da Tachyum é a mais ousada de todas
. A empresa fala em fabricar o Prodigy em um processo de 2 nm e lançar SKUs com até 1024 núcleos de 64 bits em um único soquete. Esses núcleos teriam clocks de até 6,0 GHz, algo mais comum em PCs de entusiastas do que em CPUs de servidor com centenas ou milhares de núcleos.
Em termos de especificações, a família Prodigy 2 nm é descrita da seguinte forma:
- Tecnologia de fabricação de 2 nm (ainda não tape-out, muito menos em produção em volume);
- Até 1024 núcleos gerais de 64 bits por soquete;
- Frequências de até 6 GHz;
- Até 1 GB de cache L2+L3 combinados por soquete;
- Gama de SKUs com 32, 64, 96, 128, 256, 320, 384, 448, 512, 768 e 1024 núcleos;
- TDP variando de 30–70 W nas opções de entrada até 1600 W na configuração topo de linha;
- Suporte a até 24 canais de DDR5, com velocidades anunciadas de até 17.600 MT/s;
- Capacidade máxima de até 48 TB de memória DDR5 por soquete;
- Até 128 lanes de PCI Express 7.0, expostas por 64 controladores PCIe.
Além do soquete único, a Tachyum promete escalabilidade para sistemas multi-soquete. Em seu material, a empresa fala em configurações de até 16 soquetes e 8192 núcleos na mesma máquina, com o SKU de 1024 núcleos limitado a 8 soquetes. Se esse tipo de sistema existisse hoje, ele poderia substituir uma boa quantidade de servidores CPU+GPU tradicionais por alguns poucos nós extremamente densos.
Arquitetura: núcleos fora de ordem com cara de CPU e alma de acelerador de IA
Por baixo, o Prodigy usa uma microarquitetura própria de 64 bits. A Tachyum descreve os núcleos como um design out-of-order capaz de emitir até 8 instruções por ciclo, com extensões vetoriais e matriciais voltadas para cargas de trabalho de IA e HPC. A ambição é clara: criar um núcleo que tenha a flexibilidade de um CPU de servidor, mas com blocos de cálculo que se aproximam de um acelerador dedicado quando o assunto é inferência de redes neurais.
Cada núcleo vem acompanhado de 128 KB de cache de instruções e 64 KB de cache de dados, ambos com ECC. Acima disso, um grande cache L2+L3 compartilhado pode chegar a 1 GB. É um valor incomum para CPUs, e mostra a aposta da Tachyum em manter modelos de IA e conjuntos de dados o máximo possível dentro do chip, reduzindo idas à memória principal e, em teoria, melhorando muito a latência e o throughput.
O consumo de energia, por sua vez, mostra o preço dessa ambição. Enquanto os SKUs de baixa contagem de núcleos aparecem com TDPs de 30 W, 70 W, 140 W ou 150 W, as versões intermediárias e de topo disparam para 300 W, 420 W, 550 W, 645 W, 800 W, 1000 W e, no limite, 1600 W. Em outras palavras: o Prodigy topo de linha teria um envelope térmico comparável ao de um grande acelerador de IA ou ao de um nó completo de servidor.
Memória e I/O: DDR5-17600 e PCIe 7.0 direto do futuro
Onde o Prodigy parece ainda mais futurista é na parte de memória e I/O. A Tachyum fala em 24 canais de DDR5 com suporte a DDR5-17600 e até 48 TB por soquete. Hoje, nem a especificação DDR5-17600 nem o ecossistema de PCIe 7.0 fazem parte do dia a dia dos servidores em produção. São tecnologias que ainda estão sendo padronizadas e amadurecendo.
Somar isso a 128 lanes de PCIe 7.0 distribuídas em 64 controladores significa imaginar um salto de várias gerações na largura de banda disponível para GPUs, storage e redes de alta velocidade. É uma visão bem à frente do que os grandes fabricantes de processadores e plataformas divulgaram publicamente até agora – o que explica por que tantos engenheiros olham para esses números com um misto de curiosidade e ceticismo.
Promessas de desempenho: mais de 1000 PFLOPs e 21x Rubin Ultra por rack
Se as especificações já chamam atenção, as promessas de desempenho chamam ainda mais. Segundo a Tachyum, a configuração máxima do Prodigy 2 nm seria o primeiro chip a superar 1000 PFLOPs (1 exaFLOP) em inferência de IA, frente a algo em torno de 50 PFLOPs prometidos para a plataforma NVIDIA Rubin. Em nível de rack, a empresa fala em até 21,3 vezes mais desempenho de IA por rack na versão "Prodigy Ultimate" em comparação com sistemas Rubin Ultra (NVL756), e em até 25,9 vezes mais na configuração "Prodigy Premium" frente a Rubin (NVL144).
O problema é que a metodologia por trás desses números não é detalhada. Não fica claro quais precisões numéricas são usadas (FP8, FP4, BF16 etc.), quais modelos de IA, quais tamanhos de lote, qual é o consumo real de energia dos nós ou como a comparação é feita em termos de área ocupada e custo total de propriedade. Também é uma comparação que mistura conceitos: Rubin é uma plataforma baseada em GPUs, com toda a maturidade do ecossistema CUDA, enquanto Prodigy é, em essência, uma arquitetura de CPU com unidades vetoriais e matriciais reforçadas. Tratar os dois como substitutos diretos pode ser conveniente para marketing, mas não resolve as dúvidas de quem precisa dimensionar clusters do mundo real.
Sete anos de promessas, zero chips disponíveis
Não é à toa que a reação da comunidade costuma misturar empolgação com ironia. O Prodigy foi anunciado, redesenhado e reanunciado tantas vezes desde 2018 que muita gente já perdeu a conta das revisões. Os prazos foram sendo empurrados, os slides ficaram mais bonitos, os números mais agressivos – mas, ao fim de 2025, a Tachyum ainda não tem um único chip Prodigy comercial rodando em servidores de clientes. O que existe são demonstrações com FPGAs e protótipos de software.
Por outro lado, a empresa não está parada. A Tachyum divulgou recentemente a captação de cerca de 220 milhões de dólares para levar o design de 2 nm até o tape-out. Esse nível de investimento não aparece do nada: há, sim, gente apostando que a arquitetura pode ter valor. Porém, dinheiro não resolve automaticamente os desafios de produzir um chip de ponta em um nó de processo extremamente avançado, com bom rendimento de fabricação, plataforma estável e suporte de software no nível que o mercado exige.
Entre entusiastas de hardware e profissionais de infraestrutura, o Prodigy já ganhou apelidos nada delicados, algo como "Onpaperium": um produto perfeito, desde que ninguém peça para vê-lo funcionando. Não faltam comparações jocosas com "chips caseiros" que seriam "300 vezes mais rápidos do que Rubin Ultra" – também só no papel. O recado por trás dessas piadas é claro: depois de tantos anúncios, o que falta não é marketing, é silício.
E se o Prodigy 2 nm realmente chegar?
Apesar das dúvidas, é interessante imaginar o impacto de um Prodigy 2 nm que chegue perto do que a Tachyum descreve. Um processador com 1024 núcleos a 6 GHz, 1 GB de cache, dezenas de canais de memória e desempenho de IA de classe exaflop poderia mudar a forma como data centers são desenhados. Em vez de clusters separados de CPUs e GPUs, provedores poderiam construir nós padronizados, onde o mesmo chip cuida de serviços, bancos de dados, inferência, simulações e até treinamento de modelos menores.
Em teoria, isso simplificaria o design das infraestruturas, reduziria a quantidade de tráfego entre diferentes tipos de nós e permitiria uma utilização mais eficiente dos recursos de computação. Para grandes nuvens públicas, isso significa menos ilhas de hardware especializado e mais flexibilidade para vender capacidade sob demanda, seja em forma de máquinas virtuais, seja em forma de instâncias de IA.
Mas há um abismo entre essa visão e a realidade. Para tirar um chip como esse do papel, a Tachyum precisa não só do tape-out em um nó de 2 nm, como também de um ecossistema de placas, firmwares, drivers, suporte em Linux, hypervisores, frameworks de IA, ferramentas de desenvolvimento e bibliotecas otimizadas. Precisa convencer fabricantes de servidores, operadores de nuvem e desenvolvedores a apostar em uma arquitetura nova e ainda não comprovada. Tudo isso enquanto gigantes consolidados também correm para entregar seus próprios designs de próxima geração.
Por enquanto, mais roteiro do que produto
O saldo, hoje, é mais pé no chão do que euforia. O Prodigy 2 nm, como descrito pela Tachyum, é um processador fascinante: 1024 núcleos, 6 GHz, 1 GB de cache, 24 canais de DDR5-17600, 48 TB por soquete, 128 lanes de PCIe 7.0 e racks com desempenho de IA teoricamente 20 vezes maior do que o Rubin Ultra. É o tipo de ficha técnica que qualquer arquiteto de data center adoraria ver virar realidade.
Ao mesmo tempo, a experiência dos últimos anos mostra que é muito mais fácil prometer esse futuro do que entregá-lo. Prodigy ainda não passou nem pelo primeiro filtro decisivo – o tape-out bem-sucedido de um chip de produção, capaz de rodar sistemas operacionais, suportar software mainstream e sobreviver aos primeiros benchmarks independentes sem virar manchete pelos motivos errados.
Até lá, a forma mais saudável de encarar o Prodigy 2 nm é como um manifesto de intenção: um desenho ambicioso de como poderia ser um processador universal para IA, HPC e workloads gerais. Se a Tachyum conseguir transformar esse manifesto em silício funcional, terá conquistado um espaço importante na conversa sobre o futuro da computação de alto desempenho. Se não conseguir, o Prodigy corre o risco de virar apenas mais um exemplo de como, no mundo dos chips, o papel aceita tudo – mas o wafer, não.