# Почему Grok 4 Fast в 47 раз дешевле конкурентов: разбор стратегии xAI

Источник: https://www.youtube.com/watch?v=PVhVq9RDxwM
Канал: Wes Roth
Опубликовано: 20.09.2025

---

Запуск новой модели Grok 4 Fast от компании xAI Илона Маска вызвал широкий резонанс в индустрии искусственного интеллекта. Ведущий YouTube-канала Wes Roth анализирует, почему эта модель ломает привычные представления о соотношении цены и производительности, и как агрессивная ставка на обучение с подкреплением (Reinforcement Learning) позволяет xAI обходить признанных технологических гигантов.

## 🚀 Ценовой прорыв Grok 4 Fast
[[JUMP:00:00]]

На рынке сложился определенный кластер передовых моделей: Gemini 1.5 Pro, GPT-5 Hive и Claude 3.5 Opus. Традиционно более «умные» и способные модели располагаются в правой верхней части графиков, что означает их высокую стоимость [00:26]. Облегченные или «быстрые» версии (Flash, Minimal) обычно значительно слабее флагманов. Однако Grok 4 Fast демонстрирует аномальные показатели: модель находится выше Gemini 1.5 Pro и Claude 3.5 Sonnet по ряду индексов, оставаясь при этом намного дешевле даже их «бюджетных» версий [01:07].

Основные характеристики Grok 4 Fast:

*   **Стоимость:** Модель в 47 раз дешевле предыдущих итераций Grok [28:52].
*   **Контекстное окно:** 2 миллиона токенов, что Уэс Рот называет новым стандартом для экономически эффективного ИИ [03:20].
*   **Цена через API:** $0,20 за 1 миллион входных токенов и $0,50 за 1 миллион выходных [18:15].
*   **Доступность:** На ограниченное время модель доступна бесплатно через OpenRouter и Vercel AI Gateway [18:02].

## 🧠 Секрет успеха: Масштабирование RL
[[JUMP:05:46]]

Ведущий подчеркивает, что успех Grok обусловлен не просто увеличением параметров, а колоссальным объемом вычислений, направленных на обучение с подкреплением (Reinforcement Learning, RL) [06:35]. По мнению Уэса Рота, xAI нашла эффективный способ масштабирования модели через «тренажерный зал RL» (RL Gym), о котором ранее упоминал Андрей Карпатый [06:48]. 

Джон Кабучио, специалист по RL в xAI, подтвердил, что команда внедрила новую внутреннюю агентную структуру (agent framework), которая стала ядром обучения Grok 4 Fast и будет использоваться во всех будущих прогонах [05:46]. Это позволяет максимально эффективно задействовать мощности суперкомпьютера Colossus 2 [05:59].

Автор видео выделяет ключевые тренды в развитии RL:

1.  **Смена приоритетов в вычислениях:** Со временем затраты на RL-вычисления станут значительно больше, чем на предварительное обучение (pre-training) [08:06].
2.  **Эффективность в сложных задачах:** RL-подход уже доказал свою состоятельность, позволяя моделям OpenAI и DeepSeek выигрывать золотые медали в престижных математических и кодинговых олимпиадах [07:14].
3.  **Принцип Парето:** Уэс Рот считает, что Илон Маск сделал ставку на RL как на «рычаг», который сдвинет всю индустрию, в то время как Марк Цукерберг в Meta больше инвестирует в таланты [13:05].

## 📊 Доминирование в тестах и бенчмарках
[[JUMP:03:59]]

В рейтинге LM Arena (Search Arena), который оценивает способность моделей работать с поиском информации в реальном времени и цитированием источников, Grok 4 Fast занял первое место, незначительно опередив поисковые версии GPT-5 и o3 [04:53]. Хотя доверительный интервал пока широк из-за небольшого количества голосов, это серьезный показатель для модели такого ценового сегмента.

Результаты в других дисциплинах:

*   **Текстовый лидерборд:** Разделил 8-е место, что является отличным результатом для «быстрой» модели [10:03].
*   **ARC-AGI:** Модели Grok традиционно показывают высокие результаты в этом тесте на общий интеллект [14:24].
*   **NYT Connections:** По утверждению ведущего, Grok 4 Fast «разгромил» новый бенчмарк, основанный на игре от New York Times [18:42].

Уэс Рот отмечает, что LM Arena — это слепое тестирование реальными пользователями, поэтому эти результаты сложно подделать [09:50].

## 🤝 Звездный состав: Переход Дастина Трэна в xAI
[[JUMP:10:40]]

Важным событием для компании стал переход Дастина Трэна из Google DeepMind, где он проработал 8 лет [10:40]. Трэн участвовал в ключевых прорывах Google, включая подготовку Gemini к победам в олимпиадах IMO и ICPC. В своем посте он упомянул использование «Reward heads» — технологии, при которой скрытые представления ответов модели сохраняются для последующего использования в качестве вознаграждения в RL [11:06].

Трэн утверждает, что xAI обладает уникальной концентрацией вычислительных мощностей на одного сотрудника, превосходящей даже Google [12:12]. По его мнению, Grok 4 — это крупнейшая ставка в индустрии на масштабирование RL и пост-обучение [12:25].

## 🔮 Будущее: Grok 5 и путь к AGI
[[JUMP:19:48]]

Илон Маск недавно заявил, что Grok 5 может достичь уровня AGI (общего искусственного интеллекта) [19:48]. Уэс Рот признает, что порог AGI размыт, но предлагает эмпирическое правило: если половина людей считает систему AGI, а половина — нет, значит, мы уже там [20:00].

Автор видео приводит аналогию с экспериментом OpenAI «Прятки» (Hide and Seek), чтобы показать мощь RL:

*   На 1-й итерации агенты ведут себя хаотично [20:55].
*   К 10 млн игр они начинают использовать препятствия [22:03].
*   К 400 млн итераций они строят сложные укрытия и замки [22:17].
*   После 1 млрд итераций агенты нашли «глитч» в физике симуляции, позволяющий катапультироваться через стены, о чем не знали даже разработчики [23:08].

Уэс Рот задается вопросом: какие «глитчи» в реальном мире, экономике или физике может обнаружить ИИ, если применить к нему такие же масштабы RL? Звучат предположения о сверхчеловеческом убеждении или открытии способов получения безграничной энергии [25:19]. По словам ведущего, Frontier Labs (ведущие лаборатории ИИ) должны быть серьезно обеспокоены скоростью развития xAI [28:24].