Уэс Рот: «ИИ переиграл людей в Core War, открыв новую эру самосовершенствования»

Wes Roth 71,6 тыс. 17 мин 4 мин 10.01.2026
Главное

В новом видео Уэс Рот (Wes Roth) анализирует свежую исследовательскую работу лаборатории Sakana AI под названием «Digital Red Queen» (Цифровая Красная Королева). В центре внимания — концепция рекурсивного самосовершенствования искусственного интеллекта, где алгоритмы обучаются превосходить человеческие возможности без участия людей. По мнению автора, результаты этого эксперимента могут свидетельствовать о приближении «взрыва интеллекта», который радикально изменит правила игры в технологической сфере.

🧬 Рекурсивное самосовершенствование: путь к сверхразведке 0:00

Wes Roth отмечает, что компания Sakana AI регулярно выпускает статьи, посвященные одной ключевой теме — ИИ, который способен самостоятельно улучшать свои алгоритмы . По его словам, сейчас индустрия находится на «личиночной стадии» рекурсивного самосовершенствования .

Основные тезисы этой концепции:

В качестве примера Roth приводит AlphaGo. Когда ИИ обучали на партиях людей, он играл хорошо, но когда его заставили играть против самого себя, он развил стратегии, недоступные человеческому пониманию . По мнению ведущего, попытки людей учить ИИ могут даже замедлять его развитие, тогда как самостоятельное обучение делает его сверхчеловеческим .

⚔️ Core War: поле битвы из 1984 года 2:50

Для своего эксперимента Sakana AI выбрала Core War — необычную игру, созданную еще в 1984 году . Несмотря на визуальную примитивность, она обладает огромной глубиной и является Тьюринг-полной средой .

Суть игры Core War заключается в следующем:

Название работы «Digital Red Queen» отсылает к «Алисе в Зазеркалье» Льюиса Кэрролла . Эффект Красной Королевы подразумевает ситуацию, когда нужно бежать изо всех сил только для того, чтобы оставаться на месте. В контексте ИИ это означает непрерывную эволюционную гонку вооружений: чтобы выжить, алгоритм должен постоянно адаптироваться к стратегиям противника .

🚀 Как LLM превзошли 40 лет человеческого опыта 8:41

Sakana AI не показывала языковым моделям (LLM) примеры человеческого кода для этой игры. Вместо этого они использовали эволюционный подход, заставляя модели играть друг против друга и создавать новых, более эффективных «воинов» .

Результаты эксперимента, по словам Уэса Рота, оказались поразительными:

  1. Победа над чемпионами: После 250 итераций эволюции ИИ начал побеждать человеческих чемпионов («королей холма»), никогда ранее не встречая их кода .
  2. Переоткрытие стратегий: LLM самостоятельно изобрели все ключевые мета-стратегии, которые люди разрабатывали десятилетиями, включая методы ковровой бомбардировки памяти и саморепликацию («гидра») .
  3. Интуиция кода: Модели научились предсказывать летальность и эффективность блока кода, просто взглянув на него, без фактического запуска .

Roth подчеркивает, что этот эксперимент доказывает: лучший способ повысить интеллект моделей — не заставлять их зубрить учебники, а бросать в открытые «гонки вооружений», где адаптация критически важна для выживания .

🛡️ Кибербезопасность и «Магия» современных моделей 11:46

По мнению автора канала, последствия этого исследования выходят далеко за рамки старых видеоигр. Аналогичный подход с самообучением в изолированных средах может быть использован для поиска уязвимостей и создания средств киберзащиты .

Перспективы применения:

Уэс Рот сравнивает это с «ходом №37» в партии AlphaGo против Ли Седоля . Тогда люди посчитали ход машины ошибкой, но позже поняли, что он был гениальным и обеспечил победу. Ведущий считает, что ИИ уже демонстрирует конвергентную эволюцию, быстро достигая тех же выводов, к которым человечество шло десятилетиями .

В завершение Roth отмечает, что старые модели, такие как GPT-3.5, не справились бы с подобной задачей, в то время как современные версии (включая последние итерации Claude) показывают качественный скачок . По его мнению, через 5–10 лет решения ИИ станут для нас совершенно непрозрачными, а конкурентная среда среди программистов-людей может быть полностью разрушена доминированием кода, написанного машинами .

💬 Цитаты

«Мы находимся в личиночной стадии рекурсивного самосовершенствования.»

«Лучший способ сделать эти модели умнее — не давать им учебник, а бросать в открытую гонку вооружений.»

👥 Спикер
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Core War
Игра 1984 года, в которой программы на ассемблере сражаются за память виртуальной машины.
Рекурсивное самосовершенствование
Процесс, при котором ИИ использует свои способности для разработки еще более совершенных версий самого себя.
Тьюринг-полная среда
Система, способная реализовать любой вычислимый алгоритм при наличии достаточного времени и памяти.
📊 Цифры
🗓 Хронология
  1. 1984 Создание игры Core War.
  2. 2016 Победа AlphaGo над Ли Седолем (упоминается как пример self-play).
  3. 2024 Публикация статьи Digital Red Queen от Sakana AI.
⚖️ Другая сторона
Искусственный интеллект Sakana AI Digital Red Queen Core War Wes Roth LLM