Grok 3 - ИИ-Ассистент

С информацией в реальном времени из X

Grok 3 Feature
Grok 3 Feature

Что такое Grok 3

Grok 3 - это новейшая языковая модель от xAI, обученная с использованием революционного фреймворка обучения с подкреплением на кластере из 200 000 GPU. Она имеет 27 миллиардов параметров и контекстное окно в 1,28 миллиона токенов с извлечением знаний в реальном времени.

Через режим Think, Grok 3 может участвовать в глубоких процессах мышления, длящихся от 6 секунд до 6 минут, демонстрируя производительность выше уровня человеческих экспертов. Она достигла 93,3% точности в соревновании AIME 2025 и 84,6% в GPQA на уровне аспирантуры.

Как универсальный ИИ-ассистент, Grok 3 поддерживает 12 языков программирования, может обрабатывать изображения и видео, и использует DeepSearch для проверки информации в реальном времени.

Основные Функции

Откройте Революционные Прорывы в Grok 3

Улучшенный Движок Мышления

  • Поддерживает глубокий процесс мышления от 6с до 6мин
  • 93,3% точности в соревновании AIME 2025 (64 итерации мышления)
  • 84,6% точности в задачах GPQA алмазного уровня (превосходит человеческих экспертов)
  • Фреймворк обучения с подкреплением на основе кластера из 200k GPU

Математика и Наука

  • Двухлетнее среднее AIME 2024/2025: 94,5% точности
  • Бенчмарк MMLU-Pro: 79,9% точности (лидер в STEM)
  • Средняя задержка для сложных математических задач: 67мс

Генерация и Оптимизация Кода

  • LiveCodeBench v5: 79,4% точности (оценка программирования в реальном времени)
  • Поддерживает анализ кодовых баз в миллионы строк
  • Поддерживает 12 языков включая Python/Java/C++

Мультимодальное Понимание

  • Бенчмарк MMMU: 73,2% точности
  • Понимание длинных видео EgoSchema: 74,5% точности
  • Решение смешанных задач изображение-текст улучшено на 42%

Движок Знаний в Реальном Времени

  • Охватывает данные веб в реальном времени + социальные данные с платформы 𝕏
  • Среднее время ответа для сложных запросов <800мс
  • Поддерживает перекрестную проверку из более чем 1 200 надежных источников

Обработка Длинного Контекста

  • Контекстная память 1M токенов (около 750k символов)
  • Единовременный анализ 3000-страничных технических документов
  • 83,3% точности в бенчмарке LOFT 128k

Сравнение Производительности

Competition Math

Grok 3 Beta (Think)93.3%
Grok 3 mini Beta (Think)90.8%
DeepSeek-R170.0%
Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%
Grok 3 mini Beta (Think)84.0%
DeepSeek-R171.5%
Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%
Grok 3 mini Beta (Think)80.4%
Deepseek-R1-Preview64.3%
Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%
Gemini 2.0 Flash Thinking75.4%
o178.2%

FAQ