

Grok 3とは
Grok 3は、xAIが開発した最新の言語モデルで、200,000 GPUのクラスターで革新的な強化学習フレームワークを使用して訓練されています。27億のパラメータと128万トークンのコンテキストウィンドウを持ち、リアルタイムの知識取得が可能です。
Thinkモードでは、Grok 3は6秒から6分の深い思考プロセスに従事し、人間の専門家レベルを超えるパフォーマンスを示します。AIME 2025コンペティションで93.3%の精度を達成し、大学院レベルのGPQAで84.6%を記録しました。
多目的AIアシスタントとして、Grok 3は12のプログラミング言語をサポートし、画像や動画コンテンツを処理でき、リアルタイムの情報検証にDeepSearchを使用します。
主要機能
Grok 3の革新的なブレークスルーを発見
強化された思考エンジン
- 6秒から6分の深い思考プロセスをサポート
- AIME 2025コンペティションで93.3%の精度(64回の思考反復)
- GPQAダイヤモンドレベルの問題で84.6%の精度(人間の専門家を超える)
- 200k GPUクラスターベースの強化学習フレームワーク
数学&科学
- AIME 2024/2025の2年平均:94.5%の精度
- MMLU-Proベンチマーク:79.9%の精度(STEM分野でリード)
- 複雑な数学問題の平均レイテンシー:67ms
コード生成&最適化
- LiveCodeBench v5:79.4%の精度(リアルタイムプログラミング評価)
- 数百万行のコードベース分析をサポート
- Python/Java/C++を含む12言語をサポート
マルチモーダル理解
- MMUベンチマーク:73.2%の精度
- EgoSchemaロングビデオ理解:74.5%の精度
- 画像-テキスト混合問題解決が42%向上
リアルタイム知識エンジン
- リアルタイムウェブデータ + 𝕏プラットフォームのソーシャルデータをカバー
- 複雑なクエリの平均応答時間 <800ms
- 1,200以上の信頼できるソースからのクロス検証をサポート
長文コンテキスト処理
- 1Mトークンのコンテキストメモリ(約750k文字)
- 3000ページの技術文書のワンパス分析
- LOFT 128kベンチマークで83.3%の精度
パフォーマンス比較
Competition Math
Grok 3 Beta (Think)93.3%
Grok 3 mini Beta (Think)90.8%
DeepSeek-R170.0%
Gemini 2.0 Flash Thinking53.5%
Graduate-Level Google-Proof Q&A (Diamond)
Grok 3 Beta (Think)84.6%
Grok 3 mini Beta (Think)84.0%
DeepSeek-R171.5%
Gemini 2.0 Flash Thinking74.2%
LiveCodeBench (v5)
Code Generation: 10/1/2024 - 2/1/2025
Grok 3 Beta (Think)79.4%
Grok 3 mini Beta (Think)80.4%
Deepseek-R1-Preview64.3%
Gemini 2.0 Flash Thinking45.8%
MMMU
Multimodal Understanding
Grok 3 Beta (Think)78.0%
Gemini 2.0 Flash Thinking75.4%
o178.2%