Вес Рот о Grok 4.20: «Четыре агента спорят друг с другом перед ответом»

Wes Roth 76,5 тыс. 20 мин 4 мин 17.02.2026
Главное

Илон Маск и команда xAI представили новую версию своей нейросети — Grok 4.20. Ведущий канала Wes Roth подробно разбирает уникальную архитектуру модели, которая представляет собой не одну нейросеть, а систему из четырех взаимодействующих агентов, способных вступать во внутренние дебаты для достижения наилучшего результата.

🧠 Четыре головы одного дракона: архитектура Grok 4.20 0:00

Главная инновация Grok 4.20 (также упоминаемой как Grok 4.2) заключается в том, что это не монолитная модель, а многоагентная система совместной работы . При получении сложного запроса система активирует четырех специализированных агентов одновременно. Вес Рот описывает эту структуру как пирамиду, где во главе стоит «Капитан», управляющий тремя подчиненными .

В состав системы входят:

По мнению Веса Рота, наличие такого «адвоката дьявола», как Lucas, критически важно, так как в симуляциях группы нейросетей часто склонны к чрезмерному соглашательству и самоподкреплению идей (эхо-камера) .

⚖️ Внутренние дебаты и «общество разума» 6:04

В отличие от последовательных систем, где агенты высказываются по очереди, в Grok 4.20 все четыре участника начинают думать параллельно . После формирования первичных идей запускается цикл внутреннего рецензирования (peer review).

Процесс взаимодействия выглядит следующим образом:

  1. Агенты проверяют утверждения друг друга на фактическую точность (Harper) и логику (Benjamin) .
  2. Lucas ищет скрытые предвзятости в суждениях коллег .
  3. Они итеративно корректируют друг друга до достижения консенсуса.
  4. Капитан Grok собирает лучшие элементы из каждой позиции и выдает связный ответ .

Вес Рот проводит аналогию с концепцией «общества разума» (Society of Mind) и делится личным опытом создания софта с помощью группы разных нейросетей (Claude, Codex, Gemini) . В его примере модель Gemini от Google предложила изящное и бесплатное решение (использование RSS-ленты вместо дорогого API), до которого не додумались более мощные в кодинге модели . По словам автора, Grok 4.20 реализует этот принцип внутри одной системы, что делает результат «умнее», чем сумма его частей .

⚡ Эффективность и «секретный соус» xAI 11:20

Несмотря на работу четырех агентов, Grok 4.20 не потребляет в четыре раза больше ресурсов. По данным xAI, стоимость инференса (выполнения запроса) всего в 1,5–2,5 раза выше, чем у одиночной модели . Это достигается за счет того, что агенты используют общие веса модели и общий контекст ввода.

Ключевые технические характеристики и особенности обучения:

Автор подчеркивает, что подход Grok отличается от стандартного Mixture of Experts. В MoE специальный роутер направляет вопрос одному конкретному «эксперту», в то время как в Grok 4.20 все эксперты участвуют в живой дискуссии .

📊 Реальные результаты: от биржи до бенчмарков 14:24

Илон Маск заявляет, что компания больше не фокусируется на статических тестах (бенчмарках), так как они не отражают реальную полезность ИИ . Вместо этого xAI делает упор на «агентурную производительность» — способность модели выполнять долгосрочные задачи в реальном мире.

В качестве примера Вес Рот приводит результаты Alpha Arena Season 1.5, где нейросети соревновались в торговле акциями на блокчейне . Результаты эксперимента:

Вес Рот предполагает, что успех обусловлен способностью агента Harper анализировать «пожарный шланг» данных из X в режиме реального времени, что дает преимущество в прогнозировании рыночных трендов . В текущем рейтинге LM Arena (Chatbot Arena) модель Claude Opus 4.6 занимает первое место, но автор не исключает, что после полноценного тестирования Grok 4.20 может возглавить общий зачет .

🔍 Прозрачность и «некорректные» ответы 18:44

Одной из особенностей Grok остается его готовность обсуждать темы, которые другие ИИ-лаборатории подвергают жесткой цензуре. Известный исследователь безопасности под псевдонимом Pliny the Liberator уже опубликовал системный промпт Grok 4.20 . Согласно промпту, модели разрешено давать «политически некорректные» ответы, если она может обосновать их фактами и источниками .

Вес Рот отмечает высокое качество работы с источниками: в одном из тестов Grok 4.20 выдал ответ с 28 проверенными ссылками всего за 30 секунд . Среди источников был упомянут блог NextBigFuture.com Брайана Ванга, который автор характеризует как отличный ресурс о технологиях xAI .

В завершение Вес Рот сообщает, что xAI продолжает политику открытости, публикуя системные промпты своих моделей на GitHub, чтобы пользователи могли видеть, какие инструкции управляют поведением ИИ .

💬 Цитаты

«Это не просто одна модель. На самом деле это четыре агента, спорящих друг с другом, прежде чем они заговорят с вами.»

Вес Рот 0:13

«Для получения данных в реальном времени, если вам нужны обновления здесь и сейчас, я не думаю, что существует что-то даже близко похожее на эту штуку.»

Вес Рот 2:10
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Firehose (X Firehose)
Прямой поток данных всех сообщений из социальной сети X в режиме реального времени.
Mixture of Experts (MoE)
Архитектура нейросети, состоящая из множества специализированных подсетей, из которых для конкретной задачи активируется только часть.
Reinforcement Learning (RL)
Метод машинного обучения, при котором модель учится на основе системы наград и наказаний за свои действия.
Inference (инференс)
Процесс использования уже обученной модели для получения предсказаний или ответов на запросы.
📊 Цифры
🗓 Хронология
  1. Вчера Выход бета-версии Grok 4.20 и публикация системных промптов на GitHub.
  2. Недавнее прошлое Проведение сезона 1.5 Alpha Arena, где Grok показал лучшие результаты в торговле.
⚖️ Другая сторона
Искусственный интеллект xAI Grok 4.20 Илон Маск Reinforcement Learning Colossus