Grok 3 - AI-Assistent

Met realtime info van X

Grok 3 Feature
Grok 3 Feature

Wat is Grok 3

Grok 3 is het nieuwste taalmodel van xAI, getraind met behulp van een baanbrekend reinforcement learning framework op een cluster van 200.000 GPU's. Het beschikt over 27 miljard parameters en een contextvenster van 1,28 miljoen tokens met realtime kennisophaling.

Via de Think-modus kan Grok 3 zich bezighouden met diepe denkprocessen die 6 seconden tot 6 minuten duren, met prestaties die het niveau van menselijke experts overtreffen. Het behaalde 93,3% nauwkeurigheid in de AIME 2025-competitie en 84,6% in graduate-level GPQA.

Als veelzijdige AI-assistent ondersteunt Grok 3 12 programmeertalen, kan het beeld- en video-inhoud verwerken, en gebruikt het DeepSearch voor realtime informatieverificatie.

Kernfuncties Overzicht

Ontdek Revolutionaire Doorbraken in Grok 3

Verbeterde Denk-Engine

  • Ondersteunt diep denkproces van 6s tot 6min
  • 93,3% nauwkeurigheid in AIME 2025-competitie (64 denkiteraties)
  • 84,6% nauwkeurigheid op GPQA diamant-niveau problemen (overtreft menselijke experts)
  • Reinforcement learning framework gebaseerd op 200k GPU-cluster

Wiskunde & Wetenschap

  • AIME 2024/2025 tweejaarlijks gemiddelde: 94,5% nauwkeurigheid
  • MMLU-Pro benchmark: 79,9% nauwkeurigheid (koploper in STEM)
  • Gemiddelde latentie voor complexe wiskundige problemen: 67ms

Code Generatie & Optimalisatie

  • LiveCodeBench v5: 79,4% nauwkeurigheid (realtime programmeerevaluatie)
  • Ondersteunt analyse van miljoenen regels codebases
  • Ondersteunt 12 talen waaronder Python/Java/C++

Multimodale Begrip

  • MMMU benchmark: 73,2% nauwkeurigheid
  • EgoSchema lange video begrip: 74,5% nauwkeurigheid
  • Beeld-tekst gemengde probleemoplossing verbeterd met 42%

Realtime Kennismotor

  • Dekt realtime webgegevens + sociale gegevens van 𝕏-platform
  • Gemiddelde responstijd voor complexe queries <800ms
  • Ondersteunt kruisverificatie van meer dan 1.200 betrouwbare bronnen

Lange Context Verwerking

  • 1M tokens contextgeheugen (ongeveer 750k karakters)
  • Eenmalige analyse van 3000-pagina technische documenten
  • 83,3% nauwkeurigheid in LOFT 128k benchmark

Prestatievergelijking

Competition Math

Grok 3 Beta (Think)93.3%
Grok 3 mini Beta (Think)90.8%
DeepSeek-R170.0%
Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%
Grok 3 mini Beta (Think)84.0%
DeepSeek-R171.5%
Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%
Grok 3 mini Beta (Think)80.4%
Deepseek-R1-Preview64.3%
Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%
Gemini 2.0 Flash Thinking75.4%
o178.2%

FAQ