# Уэс Рот: «ИИ переиграл людей в Core War, открыв новую эру самосовершенствования»

Источник: https://www.youtube.com/watch?v=-EgTYDKtEw8
Канал: Wes Roth
Опубликовано: 10.01.2026

---

В новом видео Уэс Рот (Wes Roth) анализирует свежую исследовательскую работу лаборатории Sakana AI под названием «Digital Red Queen» (Цифровая Красная Королева). В центре внимания — концепция рекурсивного самосовершенствования искусственного интеллекта, где алгоритмы обучаются превосходить человеческие возможности без участия людей. По мнению автора, результаты этого эксперимента могут свидетельствовать о приближении «взрыва интеллекта», который радикально изменит правила игры в технологической сфере.

## 🧬 Рекурсивное самосовершенствование: путь к сверхразведке
[[JUMP:00:00]]

Wes Roth отмечает, что компания Sakana AI регулярно выпускает статьи, посвященные одной ключевой теме — ИИ, который способен самостоятельно улучшать свои алгоритмы [0:12]. По его словам, сейчас индустрия находится на «личиночной стадии» рекурсивного самосовершенствования [0:37].

Основные тезисы этой концепции:

*   **Превосходство в исследованиях:** Теория предполагает, что в определенный момент ИИ станет лучше людей в проведении исследований в области самого ИИ [0:24].
*   **Вертикальный взлет:** Как только ИИ начнет эффективно улучшать себя сам, разрыв между этим моментом и появлением сверхинтеллекта может сократиться до минимума [1:04].
*   **Пределы человеческих данных:** Обучение на человеческих данных позволяет моделям достичь уровня лучших экспертов, но самообучение (self-play) позволяет им стать «суперлюдьми» [1:30].

В качестве примера Roth приводит AlphaGo. Когда ИИ обучали на партиях людей, он играл хорошо, но когда его заставили играть против самого себя, он развил стратегии, недоступные человеческому пониманию [1:43]. По мнению ведущего, попытки людей учить ИИ могут даже замедлять его развитие, тогда как самостоятельное обучение делает его сверхчеловеческим [2:09].

## ⚔️ Core War: поле битвы из 1984 года
[[JUMP:02:50]]

Для своего эксперимента Sakana AI выбрала Core War — необычную игру, созданную еще в 1984 году [3:04]. Несмотря на визуальную примитивность, она обладает огромной глубиной и является Тьюринг-полной средой [12:27].

Суть игры Core War заключается в следующем:

*   **Программные воины:** Игроки пишут короткие программы на языке ассемблера (называемые «воинами»), которые соревнуются за контроль над виртуальной машиной [3:57].
*   **Борьба за выживание:** Программы должны пытаться вызвать сбой (crash) у противника, одновременно защищая собственный код от перезаписи [4:10].
*   **Круговая память:** Память компьютера представлена в виде кольца (например, из 2000 ячеек), где нет разделения между кодом и данными [5:01].

Название работы «Digital Red Queen» отсылает к «Алисе в Зазеркалье» Льюиса Кэрролла [3:18]. Эффект Красной Королевы подразумевает ситуацию, когда нужно бежать изо всех сил только для того, чтобы оставаться на месте. В контексте ИИ это означает непрерывную эволюционную гонку вооружений: чтобы выжить, алгоритм должен постоянно адаптироваться к стратегиям противника [10:55].

## 🚀 Как LLM превзошли 40 лет человеческого опыта
[[JUMP:08:41]]

Sakana AI не показывала языковым моделям (LLM) примеры человеческого кода для этой игры. Вместо этого они использовали эволюционный подход, заставляя модели играть друг против друга и создавать новых, более эффективных «воинов» [8:54].

Результаты эксперимента, по словам Уэса Рота, оказались поразительными:

1.  **Победа над чемпионами:** После 250 итераций эволюции ИИ начал побеждать человеческих чемпионов («королей холма»), никогда ранее не встречая их кода [9:47].
2.  **Переоткрытие стратегий:** LLM самостоятельно изобрели все ключевые мета-стратегии, которые люди разрабатывали десятилетиями, включая методы ковровой бомбардировки памяти и саморепликацию («гидра») [10:13].
3.  **Интуиция кода:** Модели научились предсказывать летальность и эффективность блока кода, просто взглянув на него, без фактического запуска [11:08].

Roth подчеркивает, что этот эксперимент доказывает: лучший способ повысить интеллект моделей — не заставлять их зубрить учебники, а бросать в открытые «гонки вооружений», где адаптация критически важна для выживания [10:55].

## 🛡️ Кибербезопасность и «Магия» современных моделей
[[JUMP:11:46]]

По мнению автора канала, последствия этого исследования выходят далеко за рамки старых видеоигр. Аналогичный подход с самообучением в изолированных средах может быть использован для поиска уязвимостей и создания средств киберзащиты [11:46].

Перспективы применения:

*   **Автоматический поиск вирусов:** ИИ сможет самостоятельно «открывать» новые типы вредоносного ПО и тут же создавать патчи для защиты от них [12:13].
*   **Тьюринг-полные среды:** В отличие от шахмат, где количество ходов ограничено, среда программирования почти бесконечна, что дает простор для истинной машинной креативности [12:39].

Уэс Рот сравнивает это с «ходом №37» в партии AlphaGo против Ли Седоля [13:33]. Тогда люди посчитали ход машины ошибкой, но позже поняли, что он был гениальным и обеспечил победу. Ведущий считает, что ИИ уже демонстрирует конвергентную эволюцию, быстро достигая тех же выводов, к которым человечество шло десятилетиями [14:38].

В завершение Roth отмечает, что старые модели, такие как GPT-3.5, не справились бы с подобной задачей, в то время как современные версии (включая последние итерации Claude) показывают качественный скачок [15:43]. По его мнению, через 5–10 лет решения ИИ станут для нас совершенно непрозрачными, а конкурентная среда среди программистов-людей может быть полностью разрушена доминированием кода, написанного машинами [16:49].