Grok 3 - AIアシスタント

Xからのリアルタイム情報を活用

Grok 3とは

Grok 3は、xAIが開発した最新の言語モデルで、200,000 GPUのクラスターで革新的な強化学習フレームワークを使用して訓練されています。27億のパラメータと128万トークンのコンテキストウィンドウを持ち、リアルタイムの知識取得が可能です。

Thinkモードでは、Grok 3は6秒から6分の深い思考プロセスに従事し、人間の専門家レベルを超えるパフォーマンスを示します。AIME 2025コンペティションで93.3%の精度を達成し、大学院レベルのGPQAで84.6%を記録しました。

多目的AIアシスタントとして、Grok 3は12のプログラミング言語をサポートし、画像や動画コンテンツを処理でき、リアルタイムの情報検証にDeepSearchを使用します。

主要機能

Grok 3の革新的なブレークスルーを発見

強化された思考エンジン

6秒から6分の深い思考プロセスをサポート
AIME 2025コンペティションで93.3%の精度（64回の思考反復）
GPQAダイヤモンドレベルの問題で84.6%の精度（人間の専門家を超える）
200k GPUクラスターベースの強化学習フレームワーク

数学＆科学

AIME 2024/2025の2年平均：94.5%の精度
MMLU-Proベンチマーク：79.9%の精度（STEM分野でリード）
複雑な数学問題の平均レイテンシー：67ms

コード生成＆最適化

LiveCodeBench v5：79.4%の精度（リアルタイムプログラミング評価）
数百万行のコードベース分析をサポート
Python/Java/C++を含む12言語をサポート

マルチモーダル理解

MMUベンチマーク：73.2%の精度
EgoSchemaロングビデオ理解：74.5%の精度
画像-テキスト混合問題解決が42%向上

リアルタイム知識エンジン

リアルタイムウェブデータ + 𝕏プラットフォームのソーシャルデータをカバー
複雑なクエリの平均応答時間 <800ms
1,200以上の信頼できるソースからのクロス検証をサポート

長文コンテキスト処理

1Mトークンのコンテキストメモリ（約750k文字）
3000ページの技術文書のワンパス分析
LOFT 128kベンチマークで83.3%の精度

パフォーマンス比較

Competition Math

Grok 3 Beta (Think)93.3%

Grok 3 mini Beta (Think)90.8%

DeepSeek-R170.0%

Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%

Grok 3 mini Beta (Think)84.0%

DeepSeek-R171.5%

Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%

Grok 3 mini Beta (Think)80.4%

Deepseek-R1-Preview64.3%

Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%

Gemini 2.0 Flash Thinking75.4%

o178.2%

Grok 3 - AIアシスタント

Grok 3とは

主要機能

強化された思考エンジン

数学＆科学

コード生成＆最適化

マルチモーダル理解

リアルタイム知識エンジン

長文コンテキスト処理

パフォーマンス比較

Competition Math

Graduate-Level Google-Proof Q&A (Diamond)

LiveCodeBench (v5)

MMMU

よくある質問

Grok 3とは何ですか？

Grok 3を無料で使用できますか？

Grok 3にはどうやってアクセスできますか？

Grok 3はどこで入手できますか？

Grok 3とChatGPT、どちらが優れていますか？

Grok 3は一般公開されていますか？