Grok 3 - AI-Assistent

Met realtime info van X

Wat is Grok 3

Grok 3 is het nieuwste taalmodel van xAI, getraind met behulp van een baanbrekend reinforcement learning framework op een cluster van 200.000 GPU's. Het beschikt over 27 miljard parameters en een contextvenster van 1,28 miljoen tokens met realtime kennisophaling.

Via de Think-modus kan Grok 3 zich bezighouden met diepe denkprocessen die 6 seconden tot 6 minuten duren, met prestaties die het niveau van menselijke experts overtreffen. Het behaalde 93,3% nauwkeurigheid in de AIME 2025-competitie en 84,6% in graduate-level GPQA.

Als veelzijdige AI-assistent ondersteunt Grok 3 12 programmeertalen, kan het beeld- en video-inhoud verwerken, en gebruikt het DeepSearch voor realtime informatieverificatie.

Kernfuncties Overzicht

Ontdek Revolutionaire Doorbraken in Grok 3

Verbeterde Denk-Engine

Ondersteunt diep denkproces van 6s tot 6min
93,3% nauwkeurigheid in AIME 2025-competitie (64 denkiteraties)
84,6% nauwkeurigheid op GPQA diamant-niveau problemen (overtreft menselijke experts)
Reinforcement learning framework gebaseerd op 200k GPU-cluster

Wiskunde & Wetenschap

AIME 2024/2025 tweejaarlijks gemiddelde: 94,5% nauwkeurigheid
MMLU-Pro benchmark: 79,9% nauwkeurigheid (koploper in STEM)
Gemiddelde latentie voor complexe wiskundige problemen: 67ms

Code Generatie & Optimalisatie

LiveCodeBench v5: 79,4% nauwkeurigheid (realtime programmeerevaluatie)
Ondersteunt analyse van miljoenen regels codebases
Ondersteunt 12 talen waaronder Python/Java/C++

Multimodale Begrip

MMMU benchmark: 73,2% nauwkeurigheid
EgoSchema lange video begrip: 74,5% nauwkeurigheid
Beeld-tekst gemengde probleemoplossing verbeterd met 42%

Realtime Kennismotor

Dekt realtime webgegevens + sociale gegevens van 𝕏-platform
Gemiddelde responstijd voor complexe queries <800ms
Ondersteunt kruisverificatie van meer dan 1.200 betrouwbare bronnen

Lange Context Verwerking

1M tokens contextgeheugen (ongeveer 750k karakters)
Eenmalige analyse van 3000-pagina technische documenten
83,3% nauwkeurigheid in LOFT 128k benchmark

Prestatievergelijking

Competition Math

Grok 3 Beta (Think)93.3%

Grok 3 mini Beta (Think)90.8%

DeepSeek-R170.0%

Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%

Grok 3 mini Beta (Think)84.0%

DeepSeek-R171.5%

Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%

Grok 3 mini Beta (Think)80.4%

Deepseek-R1-Preview64.3%

Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%

Gemini 2.0 Flash Thinking75.4%

o178.2%