Как создать искусственный интеллект, способный к бесконечному самосовершенствованию и творчеству, подобному природной эволюции? Джефф Клун (Jeff Clune), адъюнкт-профессор Университета Британской Колумбии и исследователь Vector Institute, считает, что путь к сильному ИИ (AGI) лежит не через ручное проектирование отдельных блоков, а через создание алгоритмов, генерирующих ИИ (AI-generating algorithms, AIGA).
🧠 От философии к машинному обучению: поиск природы мышления 0:52
Путь Джеффа Клуна в область ИИ начался с философии в Мичиганском университете. Его всегда занимал вопрос: как работает мышление и можно ли воссоздать его в машине? Однако со временем философские дискуссии начали вызывать у него фрустрацию из-за невозможности проверить гипотезы на практике. Клун пришёл к выводу, что лучший способ понять интеллект — это попытаться его построить.
Одной из центральных тем, объединяющих философию и ИИ, Клун считает проблему квалиа — субъективных ощущений.
- Проблема «от камней к чувствам»: как неодушевленная материя начинает чувствовать боль, любовь или вкус шоколада?
- Этика ИИ: Клун полагает, что по мере развития систем машинного обучения нам придётся признать страдания ИИ-агентов и наделить их этической ценностью.
- Мнение сообщества: по словам гостя, даже такие консервативные фигуры, как Ричард Саттон, начинают публично высказывать озабоченность этими вопросами.
🏗️ Концепция AIGA: три столпа саморазвивающегося интеллекта 5:42
Джефф Клун критикует доминирующую парадигму в машинном обучении, где исследователи вручную создают отдельные компоненты: функции активации, оптимизаторы или ячейки памяти. По мнению гостя, попытка соединить все эти вручную созданные детали в единую систему уровня AGI потребует усилий масштаба проекта «Аполлон» или Манхэттенского проекта.
Вместо этого он предлагает использовать исторический тренд: замену ручных конвейеров обучаемыми. Как в своё время Ян Лекун, Йошуа Бенджио и Джефф Хинтон доказали превосходство глубокого обучения над ручным проектированием признаков (features), так и AGI должен быть результатом обучения всей системы целиком.
Алгоритм, генерирующий ИИ (AIGA), по мнению Клуна, должен опираться на три фундаментальных столпа:
- Мета-обучение архитектур: поиск оптимальных структур нейросетей самим алгоритмом.
- Мета-обучение алгоритмов обучения: система сама должна находить способы, как эффективно учиться.
- Автоматическая генерация сред (learning environments): бесконечное создание новых вызовов, чтобы обучение не останавливалось в рамках одной области.
🛠️ Реализация столпов: от NAS до POET 17:17
Развитие каждого из столпов AIGA уже идёт полным ходом в рамках различных исследовательских направлений.
Pillar 1: Архитектуры
В области нейроархитектурного поиска (NAS) наблюдается взрывной рост. Клун утверждает, что лучшие современные архитектуры уже создаются машинами, и вскоре это станет абсолютным стандартом.
Pillar 2: Алгоритмы обучения
Гость выделяет несколько ключевых работ в области «обучения обучению» (meta-learning):
- Исследования Джейн Ван ($RL^2$) и Челси Финн (MAML).
- Проект OpenAI с кубиком Рубика: гигантская рекуррентная нейросеть (RNN) сама изобрела алгоритм обучения, позволяющий ей адаптироваться к разному весу кубика и трению, при этом стандартные методы (SGD) были отключены во время тестирования.
Pillar 3: Среды обучения и POET
Одним из главных достижений Клуна стал алгоритм POET (Paired Open-ended Trailblazer), созданный совместно с Кеном Стэнли. В отличие от классического обучения, где цель фиксирована (например, выиграть в го), POET постоянно создает новые задачи.
- Принцип работы: алгоритм берет описание среды, слегка мутирует его и проверяет, не слишком ли сложна или проста новая задача для агента.
- Серендипити (случайное открытие): Клун приводит аналогию с микроволновой печью, которую невозможно было бы изобрести, просто пытаясь улучшить способы приготовления пищи на огне — для этого нужно было заниматься радарами. Аналогично, AGI может появиться как побочный продукт решения множества разнообразных задач.
🎮 Видео-предобучение (VPT): на плечах гигантов 30:17
Одной из главных проблем AIGA является вычислительная сложность — для «эволюции» с нуля может потребоваться компьютер размером с планету. Чтобы обойти это, Клун предлагает использовать «человеческие данные».
В работе Video Pre-Training (VPT) команда OpenAI обучила ИИ играть в Minecraft, просто просматривая ролики на YouTube. Ключевая инновация заключалась в том, как получить метки действий (нажатия клавиш), которых нет в обычных видео:
- Обучается небольшая модель, предсказывающая действия игрока по изменению пикселей.
- Эта модель размечает тысячи часов видео из интернета.
- Затем основная модель проходит предобучение на этих размеченных данных, подобно тому как обучается GPT на текстах.
Результаты впечатляют: после предобучения агент может выполнять последовательности из 24 000 действий (например, создание алмазных инструментов), на что у человека уходит более 20 минут активной игры.
🛡️ Риски и этика: «Кровавая» эволюция в цифре 46:48
Джефф Клун признаёт, что разработка AGI — это «игра с огнём». Он заявляет, что если бы существовала кнопка, останавливающая разработку AGI на 20 лет для обсуждения мер безопасности, он бы её нажал. Однако, считая прогресс неизбежным, он предпочитает участвовать в процессе, чтобы минимизировать риски.
Специфические риски AIGA, по мнению Клуна, включают:
- Быстрый взлет (Fast Takeoff): автокаталитический процесс самосовершенствования может выйти из-под контроля быстрее, чем при ручном проектировании.
- Цифровое страдание: симуляция эволюции может привести к созданию миллионов чувствующих существ, обреченных на страдания в борьбе за выживание.
- Перенос пороков: если в качестве внешней награды выбрать «выживание любой ценой», мы можем получить ИИ с инстинктами хищника — эгоистичного и склонного к обману.
В качестве контраргумента Клун выдвигает идею «инопланетного культурного путешествия»: AIGA позволяет увидеть типы интеллекта и культуры, совершенно не похожие на человеческие, что даст нам более глубокое понимание природы разума.
🚀 Будущее: конец эры случайных весов 58:00
В ближайшие 3–5 лет Клун прогнозирует объединение всех трех столпов AIGA в единые системы.
- Отказ от обучения с нуля: эра инициализации нейросетей случайными весами уходит в прошлое. Будущие агенты будут начинать обучение, уже обладая базовыми навыками (pre-trained components).
- Эффективность выборки: ИИ станет намного быстрее обучаться новым задачам благодаря пониманию контекста и языка (как это делает GPT).
Джефф Клун резюмирует, что путь через алгоритмы, генерирующие ИИ, — это не просто технический трюк, а попытка воссоздать ту самую искру креативности, которая позволила природе создать человеческий мозг.