

Czym jest Grok 3
Grok 3 to najnowszy model językowy od xAI, trenowany przy użyciu przełomowego frameworka uczenia ze wzmocnieniem na klastrze 200 000 GPU. Posiada 27 miliardów parametrów i okno kontekstowe o wielkości 1,28 miliona tokenów z pobieraniem wiedzy w czasie rzeczywistym.
Poprzez tryb Think, Grok 3 może angażować się w głębokie procesy myślowe trwające od 6 sekund do 6 minut, wykazując wydajność przewyższającą poziom ludzkich ekspertów. Osiągnął 93,3% dokładności w konkursie AIME 2025 i 84,6% w GPQA na poziomie doktoranckim.
Jako wszechstronny asystent AI, Grok 3 obsługuje 12 języków programowania, może przetwarzać treści obrazowe i wideo oraz wykorzystuje DeepSearch do weryfikacji informacji w czasie rzeczywistym.
Główne Funkcje
Odkryj Rewolucyjne Przełomy w Grok 3
Ulepszony Silnik Myślenia
- Wspiera głęboki proces myślowy od 6s do 6min
- 93,3% dokładności w konkursie AIME 2025 (64 iteracje myślowe)
- 84,6% dokładności w problemach GPQA poziomu diamentowego (przewyższa ludzkich ekspertów)
- Framework uczenia ze wzmocnieniem oparty na klastrze 200k GPU
Matematyka i Nauka
- Średnia dwuletnia AIME 2024/2025: 94,5% dokładności
- Benchmark MMLU-Pro: 79,9% dokładności (lider w STEM)
- Średnia latencja dla złożonych problemów matematycznych: 67ms
Generowanie i Optymalizacja Kodu
- LiveCodeBench v5: 79,4% dokładności (ocena programowania w czasie rzeczywistym)
- Wspiera analizę baz kodu o milionach linii
- Obsługuje 12 języków w tym Python/Java/C++
Rozumienie Multimodalne
- Benchmark MMMU: 73,2% dokładności
- Rozumienie długich wideo EgoSchema: 74,5% dokładności
- Rozwiązywanie problemów mieszanych obraz-tekst ulepszone o 42%
Silnik Wiedzy w Czasie Rzeczywistym
- Obejmuje dane internetowe w czasie rzeczywistym + dane społecznościowe z platformy 𝕏
- Średni czas odpowiedzi dla złożonych zapytań <800ms
- Wspiera weryfikację krzyżową z ponad 1 200 zaufanych źródeł
Przetwarzanie Długiego Kontekstu
- Pamięć kontekstowa 1M tokenów (około 750k znaków)
- Jednorazowa analiza 3000-stronicowych dokumentów technicznych
- 83,3% dokładności w benchmarku LOFT 128k
Porównanie Wydajności
Competition Math
Graduate-Level Google-Proof Q&A (Diamond)
LiveCodeBench (v5)
Code Generation: 10/1/2024 - 2/1/2025
MMMU
Multimodal Understanding