Grok 3 - ИИ-Ассистент

С информацией в реальном времени из X

Что такое Grok 3

Grok 3 - это новейшая языковая модель от xAI, обученная с использованием революционного фреймворка обучения с подкреплением на кластере из 200 000 GPU. Она имеет 27 миллиардов параметров и контекстное окно в 1,28 миллиона токенов с извлечением знаний в реальном времени.

Через режим Think, Grok 3 может участвовать в глубоких процессах мышления, длящихся от 6 секунд до 6 минут, демонстрируя производительность выше уровня человеческих экспертов. Она достигла 93,3% точности в соревновании AIME 2025 и 84,6% в GPQA на уровне аспирантуры.

Как универсальный ИИ-ассистент, Grok 3 поддерживает 12 языков программирования, может обрабатывать изображения и видео, и использует DeepSearch для проверки информации в реальном времени.

Основные Функции

Откройте Революционные Прорывы в Grok 3

Улучшенный Движок Мышления

Поддерживает глубокий процесс мышления от 6с до 6мин
93,3% точности в соревновании AIME 2025 (64 итерации мышления)
84,6% точности в задачах GPQA алмазного уровня (превосходит человеческих экспертов)
Фреймворк обучения с подкреплением на основе кластера из 200k GPU

Математика и Наука

Двухлетнее среднее AIME 2024/2025: 94,5% точности
Бенчмарк MMLU-Pro: 79,9% точности (лидер в STEM)
Средняя задержка для сложных математических задач: 67мс

Генерация и Оптимизация Кода

LiveCodeBench v5: 79,4% точности (оценка программирования в реальном времени)
Поддерживает анализ кодовых баз в миллионы строк
Поддерживает 12 языков включая Python/Java/C++

Мультимодальное Понимание

Бенчмарк MMMU: 73,2% точности
Понимание длинных видео EgoSchema: 74,5% точности
Решение смешанных задач изображение-текст улучшено на 42%

Движок Знаний в Реальном Времени

Охватывает данные веб в реальном времени + социальные данные с платформы 𝕏
Среднее время ответа для сложных запросов <800мс
Поддерживает перекрестную проверку из более чем 1 200 надежных источников

Обработка Длинного Контекста

Контекстная память 1M токенов (около 750k символов)
Единовременный анализ 3000-страничных технических документов
83,3% точности в бенчмарке LOFT 128k

Сравнение Производительности

Competition Math

Grok 3 Beta (Think)93.3%

Grok 3 mini Beta (Think)90.8%

DeepSeek-R170.0%

Gemini 2.0 Flash Thinking53.5%

Graduate-Level Google-Proof Q&A (Diamond)

Grok 3 Beta (Think)84.6%

Grok 3 mini Beta (Think)84.0%

DeepSeek-R171.5%

Gemini 2.0 Flash Thinking74.2%

LiveCodeBench (v5)

Code Generation: 10/1/2024 - 2/1/2025

Grok 3 Beta (Think)79.4%

Grok 3 mini Beta (Think)80.4%

Deepseek-R1-Preview64.3%

Gemini 2.0 Flash Thinking45.8%

MMMU

Multimodal Understanding

Grok 3 Beta (Think)78.0%

Gemini 2.0 Flash Thinking75.4%

o178.2%