Grok 3 - Asisten AI

Dengan informasi real-time dari X

Grok 3 Feature
Grok 3 Feature

Apa itu Grok 3

Grok 3 adalah model bahasa terbaru dari xAI, dilatih menggunakan kerangka pembelajaran penguatan yang revolusioner pada kluster 200.000 GPU. Memiliki 27 miliar parameter dan jendela konteks 1,28 juta token dengan pengambilan pengetahuan secara real-time.

Melalui mode Think, Grok 3 dapat terlibat dalam proses pemikiran mendalam yang berlangsung dari 6 detik hingga 6 menit, menunjukkan kinerja di atas tingkat ahli manusia. Mencapai akurasi 93,3% dalam kompetisi AIME 2025 dan 84,6% dalam GPQA tingkat pascasarjana.

Sebagai asisten AI serbaguna, Grok 3 mendukung 12 bahasa pemrograman, dapat memproses konten gambar dan video, serta menggunakan DeepSearch untuk verifikasi informasi real-time.

Fitur Utama

Temukan Terobosan Revolusioner di Grok 3

Mode Think yang Ditingkatkan

  • Mendukung proses berpikir mendalam dari 6d hingga 6m
  • Akurasi 93,3% dalam kompetisi AIME 2025 (64 iterasi pemikiran)
  • Akurasi 84,6% dalam masalah GPQA tingkat berlian (melampaui ahli manusia)
  • Kerangka pembelajaran penguatan berbasis kluster 200k GPU

Matematika & Sains

  • Rata-rata dua tahun AIME 2024/2025: Akurasi 94,5%
  • Benchmark MMLU-Pro: Akurasi 79,9% (pemimpin dalam STEM)
  • Latensi rata-rata untuk masalah matematika kompleks: 67ms

Generasi & Optimasi Kode

  • LiveCodeBench v5: Akurasi 79,4% (evaluasi pemrograman real-time)
  • Mendukung analisis basis kode jutaan baris
  • Mendukung 12 bahasa termasuk Python/Java/C++

Pemahaman Multimodal

  • Benchmark MMMU: Akurasi 73,2%
  • Pemahaman video panjang EgoSchema: Akurasi 74,5%
  • Pemecahan masalah campuran gambar-teks ditingkatkan 42%

Mesin Pengetahuan Real-time

  • Mencakup data web real-time + data sosial dari platform 𝕏
  • Waktu respons rata-rata untuk kueri kompleks <800ms
  • Mendukung verifikasi silang dari lebih dari 1.200 sumber terpercaya

Pemrosesan Konteks Panjang

  • Memori konteks 1M token (sekitar 750k karakter)
  • Analisis satu kali dokumen teknis 3000 halaman
  • Akurasi 83,3% dalam benchmark LOFT 128k

Perbandingan Performa

Competition Math

Grok 3 Beta (Think)93.3%
Grok 3 mini Beta (Think)90.8%
DeepSeek-R170.0%
Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%
Grok 3 mini Beta (Think)84.0%
DeepSeek-R171.5%
Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%
Grok 3 mini Beta (Think)80.4%
Deepseek-R1-Preview64.3%
Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%
Gemini 2.0 Flash Thinking75.4%
o178.2%

FAQ