Grok 3 - Assistente de IA

Com informações em tempo real do X

Grok 3 Feature
Grok 3 Feature

O que é o Grok 3

Grok 3 é o mais recente modelo de linguagem da xAI, treinado usando uma estrutura revolucionária de aprendizado por reforço em um cluster de 200.000 GPUs. Possui 27 bilhões de parâmetros e uma janela de contexto de 1,28 milhão de tokens com recuperação de conhecimento em tempo real.

Através do modo Think, o Grok 3 pode se envolver em processos de raciocínio profundo que duram de 6 segundos a 6 minutos, demonstrando desempenho acima do nível de especialistas humanos. Alcançou 93,3% de precisão na competição AIME 2025 e 84,6% no GPQA de nível graduado.

Como assistente de IA versátil, o Grok 3 suporta 12 linguagens de programação, pode processar conteúdo de imagem e vídeo, e utiliza o DeepSearch para verificação de informações em tempo real.

Destaques dos Recursos Principais

Descubra Avanços Revolucionários no Grok 3

Motor de Raciocínio Aprimorado

  • Suporta processo de raciocínio profundo de 6s a 6min
  • Precisão de 93,3% na competição AIME 2025 (64 iterações de raciocínio)
  • Precisão de 84,6% em problemas GPQA nível diamante (superando especialistas humanos)
  • Framework de aprendizado por reforço baseado em cluster de 200k GPUs

Matemática e Ciência

  • Média bienal AIME 2024/2025: 94,5% de precisão
  • Benchmark MMLU-Pro: 79,9% de precisão (líder em STEM)
  • Latência média para resolução de problemas matemáticos complexos: 67ms

Geração e Otimização de Código

  • LiveCodeBench v5: 79,4% de precisão (avaliação de programação em tempo real)
  • Suporta análise de bases de código de milhões de linhas
  • Suporta 12 linguagens incluindo Python/Java/C++

Compreensão Multimodal

  • Benchmark MMMU: 73,2% de precisão
  • Compreensão de vídeo longo EgoSchema: 74,5% de precisão
  • Resolução de problemas mistos imagem-texto melhorada em 42%

Motor de Conhecimento em Tempo Real

  • Cobre dados em tempo real da web + dados sociais da plataforma 𝕏
  • Tempo médio de resposta para consultas complexas <800ms
  • Suporta verificação cruzada de mais de 1.200 fontes confiáveis

Processamento de Contexto Longo

  • Memória de contexto de 1M tokens (aproximadamente 750k caracteres)
  • Análise em única passagem de documentos técnicos de 3000 páginas
  • Precisão de 83,3% no benchmark LOFT 128k

Comparação de Desempenho

Competition Math

Grok 3 Beta (Think)93.3%
Grok 3 mini Beta (Think)90.8%
DeepSeek-R170.0%
Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%
Grok 3 mini Beta (Think)84.0%
DeepSeek-R171.5%
Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%
Grok 3 mini Beta (Think)80.4%
Deepseek-R1-Preview64.3%
Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%
Gemini 2.0 Flash Thinking75.4%
o178.2%

Perguntas Frequentes