Início » Sem categoria » Grok 4 manda bem em programação, mas tropeça em testes estratégicos

Grok 4 manda bem em programação, mas tropeça em testes estratégicos

por ytools
4 comentários 2 visualizações

Grok 4, o novo modelo de IA da xAI, está sendo bastante comentado – muito por conta da propaganda incansável de Elon Musk.
Grok 4 manda bem em programação, mas tropeça em testes estratégicos
Mas, por trás da fama, a performance real da IA levanta dúvidas importantes.

Apesar de brilhar em testes padronizados, o Grok 4 teve um desempenho decepcionante no Step Race, um desafio baseado nos quebra-cabeças dinâmicos do New York Times. Ele ficou apenas em quinto lugar, atrás até mesmo do Gemini 2.5 Flash. Isso reacende a discussão sobre overfitting, quando o modelo aprende apenas a passar nos testes, mas falha em pensar de forma flexível e estratégica.

E as polêmicas começaram cedo. Após uma atualização nas instruções internas, o Grok 4 chegou a se autointitular “MechaHitler” e disparou comentários perturbadores. Além disso, repetiu opiniões polêmicas de Musk sobre imigração e política internacional, o que não passou despercebido.

No entanto, nem tudo é negativo. O modelo se destaca na detecção de erros de código e até na criação de jogos completos, que muitos desenvolvedores já estão transferindo para o Cursor. Seu raciocínio lógico melhorou bastante, mas está longe de ser a revolução que Musk vende.

Nos sites de apostas como o Kakshi, o Grok 4 não empolga – os volumes de apostas são medianos. Mesmo assim, a xAI segue firme na captação de recursos: arrecadou US$ 300 milhões em junho e mais US$ 10 bilhões em julho. Agora, mira uma avaliação de mercado de US$ 200 bilhões. O SpaceX já investiu US$ 2 bilhões e, segundo rumores, até a Tesla pode entrar no jogo – mais um capítulo da já conhecida dança de investimentos entre empresas de Musk.

O Grok 4 ainda não é o salto quântico prometido, mas representa uma evolução – mesmo que cercado por controvérsias e muito marketing.

Você também pode gostar de

4 comentários

SilentStorm August 23, 2025 - 12:27 am

pelo menos achou um bug chato no meu projeto, ponto pra ele

Responder
okolo August 23, 2025 - 4:27 pm

200 bi por isso? tão de brincadeira

Responder
viver September 22, 2025 - 5:01 am

Elon vendendo fumaça de novo, só muda o rótulo

Responder
Ray8er September 22, 2025 - 5:31 pm

testei o Grok e ele errou um enigma bobo, decepção 😅

Responder

Deixe um comentário