Grok 3 - Asystent AI

Z informacjami w czasie rzeczywistym z X

Czym jest Grok 3

Grok 3 to najnowszy model językowy od xAI, trenowany przy użyciu przełomowego frameworka uczenia ze wzmocnieniem na klastrze 200 000 GPU. Posiada 27 miliardów parametrów i okno kontekstowe o wielkości 1,28 miliona tokenów z pobieraniem wiedzy w czasie rzeczywistym.

Poprzez tryb Think, Grok 3 może angażować się w głębokie procesy myślowe trwające od 6 sekund do 6 minut, wykazując wydajność przewyższającą poziom ludzkich ekspertów. Osiągnął 93,3% dokładności w konkursie AIME 2025 i 84,6% w GPQA na poziomie doktoranckim.

Jako wszechstronny asystent AI, Grok 3 obsługuje 12 języków programowania, może przetwarzać treści obrazowe i wideo oraz wykorzystuje DeepSearch do weryfikacji informacji w czasie rzeczywistym.

Główne Funkcje

Odkryj Rewolucyjne Przełomy w Grok 3

Ulepszony Silnik Myślenia

Wspiera głęboki proces myślowy od 6s do 6min
93,3% dokładności w konkursie AIME 2025 (64 iteracje myślowe)
84,6% dokładności w problemach GPQA poziomu diamentowego (przewyższa ludzkich ekspertów)
Framework uczenia ze wzmocnieniem oparty na klastrze 200k GPU

Matematyka i Nauka

Średnia dwuletnia AIME 2024/2025: 94,5% dokładności
Benchmark MMLU-Pro: 79,9% dokładności (lider w STEM)
Średnia latencja dla złożonych problemów matematycznych: 67ms

Generowanie i Optymalizacja Kodu

LiveCodeBench v5: 79,4% dokładności (ocena programowania w czasie rzeczywistym)
Wspiera analizę baz kodu o milionach linii
Obsługuje 12 języków w tym Python/Java/C++

Rozumienie Multimodalne

Benchmark MMMU: 73,2% dokładności
Rozumienie długich wideo EgoSchema: 74,5% dokładności
Rozwiązywanie problemów mieszanych obraz-tekst ulepszone o 42%

Silnik Wiedzy w Czasie Rzeczywistym

Obejmuje dane internetowe w czasie rzeczywistym + dane społecznościowe z platformy 𝕏
Średni czas odpowiedzi dla złożonych zapytań <800ms
Wspiera weryfikację krzyżową z ponad 1 200 zaufanych źródeł

Przetwarzanie Długiego Kontekstu

Pamięć kontekstowa 1M tokenów (około 750k znaków)
Jednorazowa analiza 3000-stronicowych dokumentów technicznych
83,3% dokładności w benchmarku LOFT 128k

Porównanie Wydajności

Competition Math

Grok 3 Beta (Think)93.3%

Grok 3 mini Beta (Think)90.8%

DeepSeek-R170.0%

Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%

Grok 3 mini Beta (Think)84.0%

DeepSeek-R171.5%

Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%

Grok 3 mini Beta (Think)80.4%

Deepseek-R1-Preview64.3%

Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%

Gemini 2.0 Flash Thinking75.4%

o178.2%