Юлиан Тогелиус: «Парадигма Quality Diversity со временем поглотит весь ИИ»

Machine Learning Street Talk 3,8 тыс. 1 ч 9 мин 5 мин 20.11.2022
Главное

В новом выпуске Machine Learning Street Talk встретились два ведущих исследователя современности: Юлиан Тогелиус и Кен Стэнли. В центре дискуссии — роль видеоигр как идеального полигона для развития искусственного интеллекта, фундаментальные ограничения обучения с подкреплением и концепция «открытого» поиска, где целью является не конкретный результат, а постоянное усложнение и разнообразие систем.

🎮 Видеоигры как карта когнитивных способностей 1:09

Юлиан Тогелиус утверждает, что видеоигры являются лучшим испытательным стендом для ИИ, поскольку они по определению тестируют способность к когнитивной адаптации . В отличие от шахмат или го, где системы вроде Deep Blue или AlphaGo достигли сверхчеловеческого уровня, но остались бесполезными за пределами своих узких задач, видеоигры предлагают широчайшее пространство дизайна.

По мнению исследователя, геймдизайнеры, создавая новые механики, фактически картографируют пространство человеческого мышления . Юлиан Тогелиус отмечает:

Кен Стэнли добавляет, что игры охватывают огромный спектр возможностей — от механик выживания до сложных социальных взаимодействий, что делает их потенциально пригодными для обучения ИИ человеческого уровня .

🏗️ Почему ИИ до сих пор не изменил игровую индустрию? 5:41

Несмотря на теоретический потенциал, внедрение передового ИИ в коммерческие игры сталкивается с серьезными трудностями. Юлиан Тогелиус, будучи сооснователем компании model.ai, признает, что «прекрасная мечта» о синергии ИИ и игр оказалась сложнее в реализации .

Основные препятствия, по словам Юлиана:

  1. Консервативность дизайна: Большинство современных жанров (RPG, шутеры) строились вокруг отсутствия полезного ИИ. Механики вроде «деревьев диалогов» были придуманы в 80-х годах из-за нехватки вычислительных мощностей и отсутствия технологий обработки естественного языка .
  2. Экономические риски: Разработка ААА-игры стоит около 100 миллионов долларов. Издатели боятся экспериментировать с непредсказуемыми агентами, которые могут сломать игровой баланс или сделать игру хуже .
  3. Узкое применение: В индустрии ИИ сейчас используется в основном для автоматизации тестирования или процедурной анимации, но не для создания принципиально нового игрового опыта .

Тем не менее, существуют исключения. Юлиан Тогелиус упоминает проект AI Dungeon Ника Уолтона как пример смелой попытки построить игру на базе современных языковых моделей (LLM) .

🧠 Миф об «Общем» интеллекте и проблема AGI 17:22

Юлиан Тогелиус скептически относится к самому термину AGI (искусственный общий интеллект). Он считает, что интеллект всегда привязан к среде. Даже человек не обладает «общим» интеллектом в абсолютном смысле: профессор из Нью-Йорка может быть беспомощным в вопросах выплавки чугуна или сбора пшеницы .

Оба собеседника критически оценивают аргумент о «взрыве интеллекта» (intelligence explosion) и супер интеллекте, популяризированный Ником Бостромом:

🤖 Новые горизонты: Роботы-сиделки и бесконечные миры 25:51

Вместо погони за абстрактным AGI, Юлиан Тогелиус предлагает сфокусироваться на постепенном расширении возможностей ИИ. Его личный «Святой Грааль» — это система, способная играть в любую игру на App Store или в библиотеке Steam на приличном уровне .

Другим важным направлением Юлиан считает создание самогенерирующихся сред. Представьте версию Grand Theft Auto, где вы идете в любом направлении, и система на лету создает новые города, людей с уникальными отношениями и нарративы, подстраиваясь под интересы игрока .

Кен Стэнли отмечает важность разделения «механического» интеллекта (робот-сиделка, который должен мыть пациента и поливать цветы) и «креативного» (создание миров) . Юлиан, выросший в семье художников, подчеркивает, что история искусства всегда была историей развития технологий — от новых пигментов до цифровых методов моделирования .

📉 Тупик глубокого обучения с подкреплением (RL) 33:17

Одной из центральных тем обсуждения стало «переобучение» (overfitting) современных нейросетей. Юлиан Тогелиус указывает на то, что агенты глубокого обучения с подкреплением (Deep RL) часто просто запоминают последовательность действий, а не учатся играть .

Основные проблемы RL по версии Юлиана:

В качестве примера приводится NetHack Challenge. В этой игре окружение меняется каждый раз, что делает невозможным простое запоминание карты. Юлиан отмечает, что символьные методы (классический ИИ с планированием) справились с этим лучше, чем нейросети .

🚀 Quality Diversity: Будущее за многообразием 44:14

Юлиан Тогелиус делает смелое заявление: парадигма «Качественного разнообразия» (Quality Diversity, QD) со временем «поглотит» весь ИИ .

Суть подхода QD:

  1. Отказ от единственного решения: Вместо поиска одной оптимальной стратегии система ищет множество эффективных, но принципиально разных решений .
  2. Эволюционный подход: В отличие от градиентного спуска, который Юлиан называет «эмпиризмом» (данные толкают модель), эволюционные алгоритмы ближе к «рационализму» (случайная генерация гипотез и их последующее тестирование) .
  3. MAP-Elites: Это алгоритм, который создает «карту» различных ниш и заполняет их лучшими представителями .

Юлиан подчеркивает, что даже в бизнесе самые эффективные методы машинного обучения (например, XGBoost) основаны на ансамблях — наборе разных моделей, а не на одном «гениальном» агенте .

🧬 Интеллект на уровне популяции 56:31

Кен Стэнли поднимает вопрос о «стреле сложности» в эволюции. Он предполагает, что целью поиска может быть не оптимизация производительности, а накопление информации о возможностях физического мира .

Юлиан Тогелиус соглашается, что интеллект стоит рассматривать не на уровне индивида, а на уровне экосистемы.

Завершая беседу, Юлиан Тогелиус выражает надежду на создание алгоритмов будущего, которые будут работать на разных шкалах: от малых градиентных шагов до крупных «мутаций», позволяющих системе выходить за рамки текущего опыта .

💬 Цитаты

«Интеллект — это способность быстро наращивать знания на базе того, что вы уже знаете.»

Юлиан Тогелиус 03:05

«Супер интеллект — это не программа в коробке, это вся наша цивилизация.»

Юлиан Тогелиус 24:18

«Парадигма Quality Diversity крайне мощная и в конечном итоге поглотит весь ИИ.»

Юлиан Тогелиус 44:27
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Искусственный общий интеллект, способный решить любую интеллектуальную задачу, доступную человеку.
Quality Diversity (QD)
Класс алгоритмов, направленных на поиск максимально широкого набора высококачественных и уникальных решений.
MAP-Elites
Популярный алгоритм QD, который распределяет решения по многомерной карте признаков.
Shortcut Rule
Тенденция моделей ИИ находить простейшие закономерности в данных для минимизации ошибки, не понимая сути задачи.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Юлиан Тогелиус Кен Стэнли Quality Diversity AGI Deep RL