

O que é o Grok 3
Grok 3 é o mais recente modelo de linguagem da xAI, treinado usando uma estrutura revolucionária de aprendizado por reforço em um cluster de 200.000 GPUs. Possui 27 bilhões de parâmetros e uma janela de contexto de 1,28 milhão de tokens com recuperação de conhecimento em tempo real.
Através do modo Think, o Grok 3 pode se envolver em processos de raciocínio profundo que duram de 6 segundos a 6 minutos, demonstrando desempenho acima do nível de especialistas humanos. Alcançou 93,3% de precisão na competição AIME 2025 e 84,6% no GPQA de nível graduado.
Como assistente de IA versátil, o Grok 3 suporta 12 linguagens de programação, pode processar conteúdo de imagem e vídeo, e utiliza o DeepSearch para verificação de informações em tempo real.
Destaques dos Recursos Principais
Descubra Avanços Revolucionários no Grok 3
Motor de Raciocínio Aprimorado
- Suporta processo de raciocínio profundo de 6s a 6min
- Precisão de 93,3% na competição AIME 2025 (64 iterações de raciocínio)
- Precisão de 84,6% em problemas GPQA nível diamante (superando especialistas humanos)
- Framework de aprendizado por reforço baseado em cluster de 200k GPUs
Matemática e Ciência
- Média bienal AIME 2024/2025: 94,5% de precisão
- Benchmark MMLU-Pro: 79,9% de precisão (líder em STEM)
- Latência média para resolução de problemas matemáticos complexos: 67ms
Geração e Otimização de Código
- LiveCodeBench v5: 79,4% de precisão (avaliação de programação em tempo real)
- Suporta análise de bases de código de milhões de linhas
- Suporta 12 linguagens incluindo Python/Java/C++
Compreensão Multimodal
- Benchmark MMMU: 73,2% de precisão
- Compreensão de vídeo longo EgoSchema: 74,5% de precisão
- Resolução de problemas mistos imagem-texto melhorada em 42%
Motor de Conhecimento em Tempo Real
- Cobre dados em tempo real da web + dados sociais da plataforma 𝕏
- Tempo médio de resposta para consultas complexas <800ms
- Suporta verificação cruzada de mais de 1.200 fontes confiáveis
Processamento de Contexto Longo
- Memória de contexto de 1M tokens (aproximadamente 750k caracteres)
- Análise em única passagem de documentos técnicos de 3000 páginas
- Precisão de 83,3% no benchmark LOFT 128k
Comparação de Desempenho
Competition Math
Graduate-Level Google-Proof Q&A (Diamond)
LiveCodeBench (v5)
Code Generation: 10/1/2024 - 2/1/2025
MMMU
Multimodal Understanding