Уэс Рот: «ИИ переиграл людей в Core War, открыв новую эру самосовершенствования»

В новом видео Уэс Рот (Wes Roth) анализирует свежую исследовательскую работу лаборатории Sakana AI под названием «Digital Red Queen» (Цифровая Красная Королева). В центре внимания — концепция рекурсивного самосовершенствования искусственного интеллекта, где алгоритмы обучаются превосходить человеческие возможности без участия людей. По мнению автора, результаты этого эксперимента могут свидетельствовать о приближении «взрыва интеллекта», который радикально изменит правила игры в технологической сфере.

🧬 Рекурсивное самосовершенствование: путь к сверхразведке 0:00

Wes Roth отмечает, что компания Sakana AI регулярно выпускает статьи, посвященные одной ключевой теме — ИИ, который способен самостоятельно улучшать свои алгоритмы . По его словам, сейчас индустрия находится на «личиночной стадии» рекурсивного самосовершенствования .

Основные тезисы этой концепции:

Превосходство в исследованиях: Теория предполагает, что в определенный момент ИИ станет лучше людей в проведении исследований в области самого ИИ .
Вертикальный взлет: Как только ИИ начнет эффективно улучшать себя сам, разрыв между этим моментом и появлением сверхинтеллекта может сократиться до минимума .
Пределы человеческих данных: Обучение на человеческих данных позволяет моделям достичь уровня лучших экспертов, но самообучение (self-play) позволяет им стать «суперлюдьми» .

В качестве примера Roth приводит AlphaGo. Когда ИИ обучали на партиях людей, он играл хорошо, но когда его заставили играть против самого себя, он развил стратегии, недоступные человеческому пониманию . По мнению ведущего, попытки людей учить ИИ могут даже замедлять его развитие, тогда как самостоятельное обучение делает его сверхчеловеческим .

⚔️ Core War: поле битвы из 1984 года 2:50

Для своего эксперимента Sakana AI выбрала Core War — необычную игру, созданную еще в 1984 году . Несмотря на визуальную примитивность, она обладает огромной глубиной и является Тьюринг-полной средой .

Суть игры Core War заключается в следующем:

Программные воины: Игроки пишут короткие программы на языке ассемблера (называемые «воинами»), которые соревнуются за контроль над виртуальной машиной .
Борьба за выживание: Программы должны пытаться вызвать сбой (crash) у противника, одновременно защищая собственный код от перезаписи .
Круговая память: Память компьютера представлена в виде кольца (например, из 2000 ячеек), где нет разделения между кодом и данными .

Название работы «Digital Red Queen» отсылает к «Алисе в Зазеркалье» Льюиса Кэрролла . Эффект Красной Королевы подразумевает ситуацию, когда нужно бежать изо всех сил только для того, чтобы оставаться на месте. В контексте ИИ это означает непрерывную эволюционную гонку вооружений: чтобы выжить, алгоритм должен постоянно адаптироваться к стратегиям противника .

🚀 Как LLM превзошли 40 лет человеческого опыта 8:41

Sakana AI не показывала языковым моделям (LLM) примеры человеческого кода для этой игры. Вместо этого они использовали эволюционный подход, заставляя модели играть друг против друга и создавать новых, более эффективных «воинов» .

Результаты эксперимента, по словам Уэса Рота, оказались поразительными:

Победа над чемпионами: После 250 итераций эволюции ИИ начал побеждать человеческих чемпионов («королей холма»), никогда ранее не встречая их кода .
Переоткрытие стратегий: LLM самостоятельно изобрели все ключевые мета-стратегии, которые люди разрабатывали десятилетиями, включая методы ковровой бомбардировки памяти и саморепликацию («гидра») .
Интуиция кода: Модели научились предсказывать летальность и эффективность блока кода, просто взглянув на него, без фактического запуска .

Roth подчеркивает, что этот эксперимент доказывает: лучший способ повысить интеллект моделей — не заставлять их зубрить учебники, а бросать в открытые «гонки вооружений», где адаптация критически важна для выживания .

🛡️ Кибербезопасность и «Магия» современных моделей 11:46

По мнению автора канала, последствия этого исследования выходят далеко за рамки старых видеоигр. Аналогичный подход с самообучением в изолированных средах может быть использован для поиска уязвимостей и создания средств киберзащиты .

Перспективы применения:

Автоматический поиск вирусов: ИИ сможет самостоятельно «открывать» новые типы вредоносного ПО и тут же создавать патчи для защиты от них .
Тьюринг-полные среды: В отличие от шахмат, где количество ходов ограничено, среда программирования почти бесконечна, что дает простор для истинной машинной креативности .

Уэс Рот сравнивает это с «ходом №37» в партии AlphaGo против Ли Седоля . Тогда люди посчитали ход машины ошибкой, но позже поняли, что он был гениальным и обеспечил победу. Ведущий считает, что ИИ уже демонстрирует конвергентную эволюцию, быстро достигая тех же выводов, к которым человечество шло десятилетиями .

В завершение Roth отмечает, что старые модели, такие как GPT-3.5, не справились бы с подобной задачей, в то время как современные версии (включая последние итерации Claude) показывают качественный скачок . По его мнению, через 5–10 лет решения ИИ станут для нас совершенно непрозрачными, а конкурентная среда среди программистов-людей может быть полностью разрушена доминированием кода, написанного машинами .