Себастьян Риси: «Будущее искусственного интеллекта — в самоорганизации и самосборке»

Yannic Kilcher 41,2 тыс. 1 ч 1 мин 7 мин 26.08.2022
Главное

В эпоху доминирования гигантских централизованных нейросетей некоторые исследователи ищут альтернативные пути развития технологий, вдохновленные живой природой. Ведущий YouTube-канала Янник Кильхер (Yannic Kilcher) обсудил с профессором ИТ-университета Копенгагена Себастьяном Риси (Sebastian Risi) концепцию самоорганизующихся и самосборных систем искусственного интеллекта. В центре дискуссии — переход от жесткого сквозного контроля к локальным правилам взаимодействия, способным наделить алгоритмы беспрецедентной гибкостью, устойчивостью и способностью к непрерывному обучению.

🐜 Смена парадигмы: от централизованного контроля к природной самоорганизации 2:29

Современный мейнстрим в глубоком обучении полностью полагается на нисходящий (top-down) подход. Разработчики жестко задают целевые функции, используют глобальный градиентный спуск и навязывают моделям внешние ограничения. По мнению Себастьяна Риси, несмотря на колоссальные успехи, такие системы остаются чрезвычайно хрупкими. Изменение всего одного пикселя в игре Atari Breakout может полностью разрушить стратегию агента подкрепления, а небольшой поворот изображения заставляет классификатор путать пожарный автобус с совершенно посторонним объектом. Известны даже случаи, когда автопилот Tesla пытался врезаться в самолет, неверно распознав его контуры.

В качестве альтернативы гость предлагает обратиться к восходящим (bottom-up) механизмам коллективного интеллекта, которые повсеместно встречаются в природе. В таких системах нет единого лидера или центрального контроллера. Живые организмы демонстрируют поразительную живучесть: вы можете удалить часть элементов, но структура продолжит функционировать.

В качестве примера успешной реализации этого принципа ученые приводят эксперимент группы Радики Нагпал (Radhika Nagpal) с роботами-килоботами (Kilobots). Тысяча простейших механизмов, обладающих исключительно локальным зрением и способностью общаться только с ближайшими соседями, со временем самостоятельно собираются в сложные скоординированные фигуры — звезды, буквы или очертания гаечного ключа.

Однако у проекта килоботов есть ограничение: правила их поведения были вручную написаны инженерами. Себастьян Риси и его лаборатория ставят перед собой иную задачу: объединить концепцию коллективного разума с глубоким обучением, чтобы алгоритмы сами находили и оптимизировали локальные правила для сборки комплексных объектов. Примером идеального воплощения таких алгоритмов в природе гость называет термитов, строящих огромные прочные гнезда, и процесс морфогенеза, когда миллиарды разнообразных клеток развиваются из одной единственной путем деления и локального обмена химическими сигналами.

🧬 Клеточные автоматы и магия регенерации: как ИИ учится заживлять раны 9:14

Классической математической моделью децентрализованного взаимодействия является игра «Жизнь» Конвея (Conway's Game of Life). Ее простые, созданные вручную правила порождают удивительно сложные движущиеся и реплицирующиеся структуры, а сама система фактически представляет собой универсальный компьютер. Настоящий прорыв в этой области произошел с появлением концепции нейронных клеточных автоматов (Neural Cellular Automata, NCA), впервые детально описанной в интерактивном журнале Distill.

В NCA каждая отдельная клетка (или пиксель изображения) управляется собственной копией одной и той же нейросети. Клетка анализирует состояние своих соседей и принимает решение о том, как изменить собственный цвет. Помимо стандартных каналов RGB, у клеток есть скрытые внутренние каналы, через которые они передают информацию окружению.

Главное новшество работы исследователей из Google заключалось в том, что они сделали всю эту цепочку шагов дифференцируемой. Ранее для оптимизации правил автоматов применялась нейроэволюция, но ей было тяжело справляться со сложными контролируемыми задачами вроде выращивания детального рисунка саламандры. Благодаря автоматическому дифференцированию и обратному распространению ошибки во времени (BPTT) стало возможно эффективно обучать клетки целенаправленной сборке.

Чтобы сделать систему по-настоящему устойчивой, авторы применяют ряд математических трюков:

🏗️ От мягких роботов до Minecraft: эволюция морфогенеза в 3D 14:13

Основная слабость оригинального метода NCA, по мнению Риси, заключается в том, что цель всегда жестко задается человеком (например, картинка саламандры). В своей новой работе команда профессора объединила эволюционные алгоритмы и градиентный спуск. Эволюция отвечает за творческий поиск и генерацию разнообразия форм (например, трехногих мягких роботов для прыжков), а дифференцируемые нейронные автоматы делают эти формы ультра-отказоустойчивыми. В симуляции такому роботу можно полностью отрезать конечность, и благодаря заложенным правилам он самостоятельно запустит процесс регенерации и восстановит утраченную ногу.

Янник Кильхер поинтересовался, в каких реальных физических сценариях может пригодиться децентрализованное локальное общение, ведь в тех же автомобилях Tesla используется мощный центральный процессор. Себастьян Риси признает, что для беспилотников центральный контроль пока эффективнее, но указывает на другие перспективные сферы, граничащие с научной фантастикой:

Ученые уже перенесли эту технологию из симуляторов в физический мир, создав систему «самоклассифицирующихся бесконечных цифр». Из небольших электронных блоков собираются контуры цифр, и элементы, общаясь друг с другом, безошибочно определяют: «я — часть восьмерки» или «я — часть единицы».

Следующим шагом стало масштабирование морфогенеза в 3D-пространство игры Minecraft. Нейронный автомат успешно обучили с нуля выращивать сложные многоквартирные здания, причем все внутренние механизмы и функциональные ловушки внутри сгенерированных храмов работали идеально, без единой программной ошибки. В рамках организованного Риси конкурса Minecraft Open-Endedness Competition исследователи планируют обучать алгоритмы застройке целых городов, динамически адаптирующихся под рельеф: в маленькой коробке или ущелье вырастет компактное поселение, а на открытой равнине — мегаполис.

🧠 Генетическое бутылочное горлышко: выращивание нейросетей из «генома» 25:47

Одно из самых амбициозных направлений работы лаборатории Риси — применение клеточных автоматов для «выращивания» самих искусственных нейросетей (проект HyperNCA). Человеческий мозг не создается статичным, он формируется в процессе развития. Гость опирается на гипотезу «геномного бутылочного горлышка», сформулированную нейробиологом Тони Задором (Tony Zador). Ее суть в том, что ДНК человека содержит всего около 20 тысяч генов, но этот крошечный объем информации успешно управляет развитием мозга с триллионами синаптических связей.

Такое колоссальное сжатие данных, как считает Риси, заставляет эволюцию отсекать нежизнеспособные варианты и кодировать только те мета-правила, которые гарантируют высочайший уровень обобщения и адаптации к неизвестности. Роль подобного цифрового «генома» в их экспериментах выполняет компактный клеточный автомат. Развиваясь, он генерирует структуру весов для гораздо более крупной нейросети-агента, управляющей физическим телом робота в задачах обучения с подкреплением.

Более того, один и тот же компактный автомат (NCA) способен последовательно выращивать разные типы «мозгов» под изменяющиеся условия — эта концепция получила название «сети метаморфоз» (metamorphosis networks). В ходе тестов один цифровой геном успешно сгенерировал управляющие контроллеры для маленького, среднего и крупного четвероногого робота, избавляя инженеров от необходимости обучать каждую модель с нуля.

🗺️ Преодоление жестких целей: открытый поиск и адаптация длиною в жизнь 32:17

Традиционный градиентный спуск пасует перед децентрализованными системами из-за специфики их математического ландшафта. Как объясняет Себастьян Риси, ландшафт приспособленности (fitness landscape) в самоорганизующихся моделях имеет экстремально неровную структуру. Малейшее локальное изменение в поведении одной клетки вызывает нелинейный каскадный эффект во всей системе. По этой причине прямая оптимизация под конкретную цель здесь неэффективна.

Команда Риси делает ставку на алгоритмы «поиска разнообразия» (Quality Diversity) и метод MAP-Elites. Вместо максимизации одного показателя алгоритм ищет множество решений, радикально отличающихся друг от друга по своим поведенческим или структурным характеристикам. Такой подход требует больше вычислительных ресурсов, но позволяет успешно выходить из локальных оптимумов.

Главный недостаток современного Reinforcement Learning (RL), по мнению гостя, заключается в «замораживании» весов нейросети после окончания фазы обучения. Живой организм учится всю жизнь. Чтобы преодолеть этот барьер, ученые создали агентов, у которых базовые веса полностью случайны, но обучению подлежат исключительно локальные правила обновления синапсов — так называемые пластичные хеббовские связи.

Эксперименты показывают, что если во время выполнения задачи роботу заблокировать или ампутировать конечность, система с обученными правилами Хебба мгновенно перестраивает прохождение сигналов прямо «на лету», демонстрируя непрерывную адаптацию (lifetime learning) без необходимости дообучения на сервере. Именно в способности действовать в динамически меняющихся, агрессивных и абсолютно незнакомых средах и кроется, по словам Риси, главный потенциал децентрализованного ИИ.

🧩 В поисках здравого смысла: тесты ARC, Animal AI и советы молодым ученым 49:45

Обсуждая долгосрочные перспективы, собеседники отметили глубокую связь самоорганизующихся систем с бурно развивающимися графовыми нейросетями (GNN) и классическими самоорганизующимися картами Кохонена (SOM), которые моделируют топографические структуры коры головного мозга.

По мнению Себастьяна Риси, концепция генетического бутылочного горлышка может стать ключом к разгадке «здравого смысла» ИИ и помочь в прохождении сложнейших современных бенчмарков:

Для тех, кто хочет всерьез заняться изучением этой альтернативной ветви ИИ, профессор рекомендует начать с фундаментальной книги Мелани Митчелл (Melanie Mitchell) «Сложность: управляемая экскурсия» (Complexity: A Guided Tour), а также открыть Colab-ноутбуки из интерактивных статей Distill, чтобы лично поэкспериментировать с кодом растущих клеточных автоматов.

В финале встречи Себастьян Риси процитировал недавний совет патриарха глубокого обучения Джеффри Хинтона (Geoffrey Hinton):

«Если вы видите огромное количество умнейших людей, бегущих в одном направлении, разворачивайтесь и ищите свободную нишу».

Пока ИТ-гиганты сжигают миллиарды долларов на масштабирование языковых моделей (LLM), академическая наука на уровне университетов может совершать прорывные открытия в области компактных, эффективных и независимых от огромных серверных кластеров самосборных систем.

💬 Цитаты

«Направляющие правила для роя могут быть созданы только так, как пастух гонит стадо — путем применения силы в ключевых точках воздействия.»

Себастьян Риси 46:07

«Если вы видите огромное количество умнейших людей, бегущих в одном направлении, разворачивайтесь и ищите свободную нишу.»

Себастьян Риси 1:01:08
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Нейронные клеточные автоматы (NCA)
Вычислительные модели, где каждая клетка сетки управляется нейросетью и меняет состояние на основе сигналов от ближайших соседей.
Геномное бутылочное горлышко
Биологическая теория сжатия информации, согласно которой малое количество генов вынуждено кодировать сложные мета-правила для развития огромных структур.
Правила Хебба
Алгоритм синаптической пластичности, при котором обучение происходит локально за счет одновременной активности связанных нейронов.
Морфогенез
Процесс возникновения и развития новых форм и структур в живом организме на основе локального деления клеток.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Себастьян Риси Neural Cellular Automata HyperNCA Янник Кильхер