Grok 3 - AIアシスタント

Xからのリアルタイム情報を活用

Grok 3 Feature
Grok 3 Feature

Grok 3とは

Grok 3は、xAIが開発した最新の言語モデルで、200,000 GPUのクラスターで革新的な強化学習フレームワークを使用して訓練されています。27億のパラメータと128万トークンのコンテキストウィンドウを持ち、リアルタイムの知識取得が可能です。

Thinkモードでは、Grok 3は6秒から6分の深い思考プロセスに従事し、人間の専門家レベルを超えるパフォーマンスを示します。AIME 2025コンペティションで93.3%の精度を達成し、大学院レベルのGPQAで84.6%を記録しました。

多目的AIアシスタントとして、Grok 3は12のプログラミング言語をサポートし、画像や動画コンテンツを処理でき、リアルタイムの情報検証にDeepSearchを使用します。

主要機能

Grok 3の革新的なブレークスルーを発見

強化された思考エンジン

  • 6秒から6分の深い思考プロセスをサポート
  • AIME 2025コンペティションで93.3%の精度(64回の思考反復)
  • GPQAダイヤモンドレベルの問題で84.6%の精度(人間の専門家を超える)
  • 200k GPUクラスターベースの強化学習フレームワーク

数学&科学

  • AIME 2024/2025の2年平均:94.5%の精度
  • MMLU-Proベンチマーク:79.9%の精度(STEM分野でリード)
  • 複雑な数学問題の平均レイテンシー:67ms

コード生成&最適化

  • LiveCodeBench v5:79.4%の精度(リアルタイムプログラミング評価)
  • 数百万行のコードベース分析をサポート
  • Python/Java/C++を含む12言語をサポート

マルチモーダル理解

  • MMUベンチマーク:73.2%の精度
  • EgoSchemaロングビデオ理解:74.5%の精度
  • 画像-テキスト混合問題解決が42%向上

リアルタイム知識エンジン

  • リアルタイムウェブデータ + 𝕏プラットフォームのソーシャルデータをカバー
  • 複雑なクエリの平均応答時間 <800ms
  • 1,200以上の信頼できるソースからのクロス検証をサポート

長文コンテキスト処理

  • 1Mトークンのコンテキストメモリ(約750k文字)
  • 3000ページの技術文書のワンパス分析
  • LOFT 128kベンチマークで83.3%の精度

パフォーマンス比較

Competition Math

Grok 3 Beta (Think)93.3%
Grok 3 mini Beta (Think)90.8%
DeepSeek-R170.0%
Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%
Grok 3 mini Beta (Think)84.0%
DeepSeek-R171.5%
Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%
Grok 3 mini Beta (Think)80.4%
Deepseek-R1-Preview64.3%
Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%
Gemini 2.0 Flash Thinking75.4%
o178.2%

よくある質問