Илон Маск: «Grok 5 с вероятностью 10% станет полноценным AGI»

Wes Roth 52,5 тыс. 26 мин 4 мин 17.11.2025
Главное

В новом видео технический обозреватель Уэс Рот анализирует последние достижения компании Илона Маска xAI, фокусируясь на релизе модели Grok 4.1 и амбициозных планах на Grok 5. Автор разбирает свежее интервью Маска, в котором тот оценивает шансы на достижение сильного искусственного интеллекта (AGI) и описывает концепцию «Галактической энциклопедии», а также тестирует текущую модель на эмоциональный интеллект и сложные расчеты.

🧠 Grok 5: Шанс на AGI и 6 триллионов параметров 0:00

Илон Маск делает крайне смелые прогнозы относительно следующего поколения своей нейросети — Grok 5. По его утверждению, эта модель станет самым умным ИИ в мире со значительным отрывом по всем метрикам без исключения . Релиз запланирован на первый квартал следующего года .

Ключевые технические характеристики и амбиции Grok 5:

Маск также анонсировал проект Encyclopedia Galactica (вдохновленный именами Айзека Азимова и Дугласа Адамса) . Это будет открытый репозиторий всех человеческих знаний, который планируется не только выложить в открытый доступ, но и физически сохранить — выгравировать на камне микрошрифтом и отправить копии на Луну, Марс и в глубокий космос на случай гибели земной цивилизации .

🎭 Grok 4.1: Эмоциональный интеллект и стиль 6:05

Пока Grok 5 находится в разработке, xAI выпустила обновление Grok 4.1, доступное на сайте и в мобильных приложениях . Уэс Рот отмечает, что основной упор в этой версии сделан не на сухие цифры бенчмарков, а на стиль, личность и удобство взаимодействия .

Особенности обучения и работы Grok 4.1:

  1. Инфраструктура RL: Для обучения использовался суперкомпьютер Colossus. Если обычное предобучение — это «чтение учебника», то обучение с подкреплением (RL) — это решение задач в конце главы с проверкой ответов .
  2. RL с помощью ИИ-судей: Для оценки субъективных параметров (вкус, нюансы, контекст) xAI использует метод RLAIF. Одна модель («агент-разум») выступает в роли судьи, оценивая ответы другой модели и выдавая «виртуальную похвалу» или порицание .
  3. Лидерство в EQbench: В тесте EQbench 3, который оценивает эмпатию, понимание эмоций и навыки деэскалации конфликтов, Grok 4.1 Thinking занял первое место .
  4. Сравнение ответов: Ведущий приводит пример, где на фразу пользователя «я так скучаю по своей кошке, что это причиняет боль», Grok 4.1 дает более личный и менее шаблонный ответ, чем предыдущая версия, используя более глубокие метафоры и сочувственный тон .

📉 Борьба с галлюцинациями и точность данных 16:08

Одним из наиболее значимых достижений Grok 4.1 Уэс Рот называет радикальное снижение уровня галлюцинаций . По данным разработчиков, xAI удалось добиться впечатляющих цифр:

Это делает модель одной из самых надежных для информационных запросов. В бенчмарке Vending Bench, где ИИ должен управлять виртуальным торговым автоматом (анализировать спрос, пополнять запасы, отвечать клиентам), Grok 4 показал результат, превосходящий человеческий (5-е место в общем зачете занимает человек, а Grok 4 — лидер) . Из стартового капитала в $500 модель смогла виртуально «заработать» почти $4700 .

🛰️ ИИ-центры на орбите: Энергия будущего 16:51

Уэс Рот обсуждает амбициозный план Маска по выносу вычислительных мощностей в космос. Маск утверждает, что xAI видит путь к созданию группировки спутников на солнечной энергии мощностью 100 ГВт в год .

Для понимания масштаба:

По мнению Маска, это станет самым дешевым способом эксплуатации крупномасштабного ИИ. Ведущий проверил расчеты этого плана через Grok 4.1 и GPT-5.1 (находящуюся в стадии разработки модель от OpenAI). Оба ИИ сошлись на том, что солнечные панели в космосе (на солнечно-синхронной орбите) будут в 6–10 раз эффективнее земных из-за отсутствия атмосферы, теней и смены дня и ночи . Для питания дата-центра мощностью 1 ГВт в космосе потребуется всего около 2,4–4 квадратных километров солнечных панелей .

🧪 Проблема M-Dash и «настоящий» AGI 22:28

В завершение Уэс Рот касается темы следования инструкциям, приводя курьезный, но показательный пример с длинным тире (M-dash). Долгое время даже самые продвинутые модели (включая GPT-4) не могли выполнить простую негативную инструкцию: «не используй длинное тире» . Модель соглашалась, но тут же вставляла десятки тире в текст .

Ведущий отмечает, что новые версии — и Grok 4.1, и GPT 5.1 — наконец-то научились справляться с этой задачей. «Я чувствую, что это и есть AGI: когда ChatGPT выполняет инструкцию не использовать длинное тире», — шутит Уэс Рот .

Разработчики xAI, такие как Тим Ли и Дастин Тран, подтверждают, что они на порядок увеличили масштаб обучения с подкреплением после основной тренировки . Это позволило избавиться от «шлакового» контента, излишних шаблонов, навязчивых эмодзи и ненужных цензурных ограничений (guardrails), сделав общение с ИИ более естественным .

💬 Цитаты

«Grok 5, я думаю, станет самым умным ИИ в мире со значительным отрывом по каждой метрике без исключения.»

Илон Маск 0:39

«Я чувствую, что это и есть AGI: когда ChatGPT наконец следует инструкции не использовать длинное тире.»

👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Искусственный общий интеллект, способный выполнять любую интеллектуальную задачу на уровне человека или выше.
RLAIF
Обучение с подкреплением на основе обратной связи от ИИ, где одна модель оценивает работу другой.
M-dash
Типографский символ длинного тире, на котором часто «спотыкаются» ИИ-модели при попытке ограничить его использование.
Colossus
Суперкомпьютер Илона Маска, используемый для обучения моделей Grok.
📊 Цифры
🗓 Хронология
  1. Q1 2025 Ожидаемый релиз модели Grok 5.
  2. 2027 Планируемый запуск первых спутников с ИИ-чипами в рамках проекта Google Suncatcher.
⚖️ Другая сторона
Искусственный интеллект xAI Grok 4.1 Илон Маск AGI Colossus