Grok 3 - Asisten AI

Dengan informasi real-time dari X

Apa itu Grok 3

Grok 3 adalah model bahasa terbaru dari xAI, dilatih menggunakan kerangka pembelajaran penguatan yang revolusioner pada kluster 200.000 GPU. Memiliki 27 miliar parameter dan jendela konteks 1,28 juta token dengan pengambilan pengetahuan secara real-time.

Melalui mode Think, Grok 3 dapat terlibat dalam proses pemikiran mendalam yang berlangsung dari 6 detik hingga 6 menit, menunjukkan kinerja di atas tingkat ahli manusia. Mencapai akurasi 93,3% dalam kompetisi AIME 2025 dan 84,6% dalam GPQA tingkat pascasarjana.

Sebagai asisten AI serbaguna, Grok 3 mendukung 12 bahasa pemrograman, dapat memproses konten gambar dan video, serta menggunakan DeepSearch untuk verifikasi informasi real-time.

Fitur Utama

Temukan Terobosan Revolusioner di Grok 3

Mode Think yang Ditingkatkan

Mendukung proses berpikir mendalam dari 6d hingga 6m
Akurasi 93,3% dalam kompetisi AIME 2025 (64 iterasi pemikiran)
Akurasi 84,6% dalam masalah GPQA tingkat berlian (melampaui ahli manusia)
Kerangka pembelajaran penguatan berbasis kluster 200k GPU

Matematika & Sains

Rata-rata dua tahun AIME 2024/2025: Akurasi 94,5%
Benchmark MMLU-Pro: Akurasi 79,9% (pemimpin dalam STEM)
Latensi rata-rata untuk masalah matematika kompleks: 67ms

Generasi & Optimasi Kode

LiveCodeBench v5: Akurasi 79,4% (evaluasi pemrograman real-time)
Mendukung analisis basis kode jutaan baris
Mendukung 12 bahasa termasuk Python/Java/C++

Pemahaman Multimodal

Benchmark MMMU: Akurasi 73,2%
Pemahaman video panjang EgoSchema: Akurasi 74,5%
Pemecahan masalah campuran gambar-teks ditingkatkan 42%

Mesin Pengetahuan Real-time

Mencakup data web real-time + data sosial dari platform 𝕏
Waktu respons rata-rata untuk kueri kompleks <800ms
Mendukung verifikasi silang dari lebih dari 1.200 sumber terpercaya

Pemrosesan Konteks Panjang

Memori konteks 1M token (sekitar 750k karakter)
Analisis satu kali dokumen teknis 3000 halaman
Akurasi 83,3% dalam benchmark LOFT 128k

Perbandingan Performa

Competition Math

Grok 3 Beta (Think)93.3%

Grok 3 mini Beta (Think)90.8%

DeepSeek-R170.0%

Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%

Grok 3 mini Beta (Think)84.0%

DeepSeek-R171.5%

Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%

Grok 3 mini Beta (Think)80.4%

Deepseek-R1-Preview64.3%

Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%

Gemini 2.0 Flash Thinking75.4%

o178.2%