В новом видео технический обозреватель Уэс Рот анализирует последние достижения компании Илона Маска xAI, фокусируясь на релизе модели Grok 4.1 и амбициозных планах на Grok 5. Автор разбирает свежее интервью Маска, в котором тот оценивает шансы на достижение сильного искусственного интеллекта (AGI) и описывает концепцию «Галактической энциклопедии», а также тестирует текущую модель на эмоциональный интеллект и сложные расчеты.
🧠 Grok 5: Шанс на AGI и 6 триллионов параметров 0:00
Илон Маск делает крайне смелые прогнозы относительно следующего поколения своей нейросети — Grok 5. По его утверждению, эта модель станет самым умным ИИ в мире со значительным отрывом по всем метрикам без исключения . Релиз запланирован на первый квартал следующего года .
Ключевые технические характеристики и амбиции Grok 5:
- Масштаб модели: Grok 5 будет содержать 6 триллионов параметров, что в два раза больше, чем у текущих версий Grok 3 и 4 (по 3 трлн параметров) .
- Плотность интеллекта: По словам Маска, компания работает над увеличением «плотности интеллекта на гигабайт» и на триллион операций .
- Мультимодальность: Модель изначально строится как мультимодальная, способная работать с текстом, изображениями, аудио и, что критически важно, видео в реальном времени .
- Порог AGI: Маск заявляет, что Grok 5 — это первая модель, для которой он видит «ненулевой шанс» достижения уровня AGI (искусственного общего интеллекта). Свою оценку вероятности этого события он называет консервативной — около 10% .
Маск также анонсировал проект Encyclopedia Galactica (вдохновленный именами Айзека Азимова и Дугласа Адамса) . Это будет открытый репозиторий всех человеческих знаний, который планируется не только выложить в открытый доступ, но и физически сохранить — выгравировать на камне микрошрифтом и отправить копии на Луну, Марс и в глубокий космос на случай гибели земной цивилизации .
🎭 Grok 4.1: Эмоциональный интеллект и стиль 6:05
Пока Grok 5 находится в разработке, xAI выпустила обновление Grok 4.1, доступное на сайте и в мобильных приложениях . Уэс Рот отмечает, что основной упор в этой версии сделан не на сухие цифры бенчмарков, а на стиль, личность и удобство взаимодействия .
Особенности обучения и работы Grok 4.1:
- Инфраструктура RL: Для обучения использовался суперкомпьютер Colossus. Если обычное предобучение — это «чтение учебника», то обучение с подкреплением (RL) — это решение задач в конце главы с проверкой ответов .
- RL с помощью ИИ-судей: Для оценки субъективных параметров (вкус, нюансы, контекст) xAI использует метод RLAIF. Одна модель («агент-разум») выступает в роли судьи, оценивая ответы другой модели и выдавая «виртуальную похвалу» или порицание .
- Лидерство в EQbench: В тесте EQbench 3, который оценивает эмпатию, понимание эмоций и навыки деэскалации конфликтов, Grok 4.1 Thinking занял первое место .
- Сравнение ответов: Ведущий приводит пример, где на фразу пользователя «я так скучаю по своей кошке, что это причиняет боль», Grok 4.1 дает более личный и менее шаблонный ответ, чем предыдущая версия, используя более глубокие метафоры и сочувственный тон .
📉 Борьба с галлюцинациями и точность данных 16:08
Одним из наиболее значимых достижений Grok 4.1 Уэс Рот называет радикальное снижение уровня галлюцинаций . По данным разработчиков, xAI удалось добиться впечатляющих цифр:
- Общий уровень галлюцинаций при поиске информации снизился с 12,09% до 4,22% .
- Ошибки в фактах (Fact Score) сократились с 9,89% до 2,97% .
Это делает модель одной из самых надежных для информационных запросов. В бенчмарке Vending Bench, где ИИ должен управлять виртуальным торговым автоматом (анализировать спрос, пополнять запасы, отвечать клиентам), Grok 4 показал результат, превосходящий человеческий (5-е место в общем зачете занимает человек, а Grok 4 — лидер) . Из стартового капитала в $500 модель смогла виртуально «заработать» почти $4700 .
🛰️ ИИ-центры на орбите: Энергия будущего 16:51
Уэс Рот обсуждает амбициозный план Маска по выносу вычислительных мощностей в космос. Маск утверждает, что xAI видит путь к созданию группировки спутников на солнечной энергии мощностью 100 ГВт в год .
Для понимания масштаба:
- Вся территория США потребляет в среднем около 460 ГВт электроэнергии .
- Маск планирует добавить мощность, эквивалентную четверти всего энергопотребления США, за счет орбитальных дата-центров .
По мнению Маска, это станет самым дешевым способом эксплуатации крупномасштабного ИИ. Ведущий проверил расчеты этого плана через Grok 4.1 и GPT-5.1 (находящуюся в стадии разработки модель от OpenAI). Оба ИИ сошлись на том, что солнечные панели в космосе (на солнечно-синхронной орбите) будут в 6–10 раз эффективнее земных из-за отсутствия атмосферы, теней и смены дня и ночи . Для питания дата-центра мощностью 1 ГВт в космосе потребуется всего около 2,4–4 квадратных километров солнечных панелей .
🧪 Проблема M-Dash и «настоящий» AGI 22:28
В завершение Уэс Рот касается темы следования инструкциям, приводя курьезный, но показательный пример с длинным тире (M-dash). Долгое время даже самые продвинутые модели (включая GPT-4) не могли выполнить простую негативную инструкцию: «не используй длинное тире» . Модель соглашалась, но тут же вставляла десятки тире в текст .
Ведущий отмечает, что новые версии — и Grok 4.1, и GPT 5.1 — наконец-то научились справляться с этой задачей. «Я чувствую, что это и есть AGI: когда ChatGPT выполняет инструкцию не использовать длинное тире», — шутит Уэс Рот .
Разработчики xAI, такие как Тим Ли и Дастин Тран, подтверждают, что они на порядок увеличили масштаб обучения с подкреплением после основной тренировки . Это позволило избавиться от «шлакового» контента, излишних шаблонов, навязчивых эмодзи и ненужных цензурных ограничений (guardrails), сделав общение с ИИ более естественным .