Йошуа Бенжио: «GFlowNets — это обучаемая замена методам Монте-Карло»

Лауреат премии Тьюринга Йошуа Бенжио (Yoshua Bengio) в интервью Machine Learning Street Talk представил концепцию GFlowNets — инновационный фреймворк для вероятностного моделирования. Учёный обсуждает, как этот метод может заменить классические алгоритмы выборки, помочь в поиске причинно-следственных связей и приблизить искусственный интеллект к человеческому мышлению «Системы 2».

🌊 GFlowNets: «Швейцарский армейский нож» вероятностного моделирования 17:45

Йошуа Бенжио утверждает, что не был так воодушевлён новой темой в науке последние 6–7 лет . GFlowNets (Generative Flow Networks) представляют собой обучаемую замену методам Монте-Карло по схеме марковских цепей (MCMC) . В то время как традиционные методы MCMC часто «застревают» в одной области вероятностного распределения, GFlowNets используют обобщающую способность нейросетей для эффективного поиска множества «мод» (пиков высокой вероятности) .

По мнению Йошуа Бенжио, ключевые возможности GFlowNets включают:

Оценку неразрешимых величин: возможность вычислять статистические суммы (partition functions) и условные вероятности, которые требуют суммирования по экспоненциально большому количеству вариантов .
Генерацию разнообразных решений: в отличие от обучения с подкреплением (RL), нацеленного на максимизацию вознаграждения, GFlowNets обучаются генерировать объекты пропорционально их вознаграждению .
Масштабируемость: использование нейронных сетей позволяет переносить знания о структуре распределения на новые, ещё не посещённые области пространства .

🧠 Метафора доски Гальтона и нейронный контроль 19:29

Для визуализации работы GFlowNets ведущие предложили аналогию с доской Гальтона («машиной для бобов») — устройством, где шарики катятся через ряды колышков и собираются в корзинах, образуя биномиальное распределение .

Йошуа Бенжио развил эту аналогию:

В GFlowNets колышки — это не статические препятствия, а управляемые клапаны или гейты .
Нейронная сеть выступает в роли «мозга», который настраивает веса этих гейтов (вероятности перехода влево или вправо), чтобы на выходе получить любое желаемое распределение .
Главное отличие от простой таблицы вероятностей заключается в том, что одна нейросеть управляет всей огромной доской. Она понимает координаты и структуру, что позволяет ей «догадываться», как настраивать гейты в частях доски, где шарики ещё ни разу не проходили .

Бенжио подчёркивает, что пространство состояний в реальных задачах (например, при синтезе молекул) экспоненциально велико, и только благодаря «статистической силе» нейросетей становится возможным обучение на конечном числе траекторий .

⚔️ GFlowNets против AlphaZero: Диверсификация или жадность? 14:17

В контексте обучения с подкреплением (RL) GFlowNets предлагают фундаментально иной подход по сравнению с такими системами, как AlphaZero .

Основные различия в подходах:

Целевая функция: AlphaZero обучает политику для выбора наилучшего хода (максимизация ожидаемого вознаграждения). GFlowNets распределяют действия пропорционально вознаграждению .
Исследование (Exploration): традиционное RL часто отсекает низкоэффективные траектории. GFlowNets сохраняют их, просто выбирая реже, что критически важно для обнаружения «ступенек» (stepping stones) в сложных задачах поиска .
Производительность: Бенжио ссылается на результаты своих работ, согласно которым GFlowNets сходятся экспоненциально быстрее, чем MCMC и алгоритм PPO на определённых задачах, находя больше мод распределения за меньшее время .

Учёный предполагает, что если бы AlphaZero и гипотетический «FlowZero» имели одинаковые ресурсы, AlphaZero могла бы выиграть в шахматы за счёт «жадности». Однако «FlowZero» потенциально мог бы достичь более высокого рейтинга ELO в долгосрочной перспективе, находя неочевидные стратегии, которые жадные алгоритмы игнорируют на ранних этапах .

🧪 Научные открытия и причинно-следственные связи 42:53

Одной из главных мотиваций Йошуа Бенжио в разработке GFlowNets является реализация «индуктивных предубеждений Системы 2» (System 2 inductive biases) . Система 2, согласно психологу Даниэлю Канеману, отвечает за медленное, логическое и осознанное мышление.

Роль GFlowNets в развитии «Системы 2» для ИИ:

Причинно-следственное обнаружение (Causal Discovery): умение находить структуру графа причин и следствий в мире, где наблюдаются только хаотичные пиксели .
Активное обучение в науке: планирование экспериментов так, чтобы максимально снизить неопределённость в теориях при минимальном количестве вопросов к природе .
Абстракция: Бенжио считает, что введение абстрактных категорий позволяет радикально сократить длину описания данных (description length), что и является ключом к настоящему обобщению .

По мнению Бенжио, современное глубокое обучение хорошо справляется с «Системой 1» (интуитивное распознавание образов), но GFlowNets могут стать инструментом для интеграции рассуждений и логики непосредственно в нейросетевую архитектуру, представляя мысли как графы .

👁️ Сознание и «слегка осознанные» нейросети 55:00

В сообществе ИИ вызвал резонанс твит Ильи Суцкевера (OpenAI) о том, что современные крупные нейросети могут быть «слегка осознанными» . Йошуа Бенжио призывает к осторожности и смирению в этом вопросе, поскольку наука до сих пор точно не определила, что такое сознание .

Позиция Бенжио по вопросу сознания ИИ:

Разрыв в сложности: между текущими языковыми моделями и реальным сознанием существует огромная дистанция .
Сознательная обработка: вместо термина «сознание» учёный предпочитает говорить о «механизмах сознательной обработки» (conscious processing machinery) .
Теория глобального рабочего пространства (Global Workspace Theory): Бенжио опирается на эту теорию, предполагая, что сознание возникает, когда внимание выбирает узкое подмножество элементов из огромного объёма знаний для выполнения конкретной задачи .
Иллюзия дуализма: учёный разделяет взгляды Майкла Грациано, считающего субъективный опыт (квалиа) результатом работы модели внимания, которую мозг строит для самоконтроля. Это создаёт «иллюзию» дуализма .

Бенжио подчеркивает, что сознание долгое время было табу в науке, но благодаря прогрессу нейробиологии мы начинаем измерять процессы, происходящие в мозге при осознанном и неосознанном восприятии .

📈 Эволюция взглядов: От коннекционизма к символам 1:05:21

Йошуа Бенжио описывает свой путь как трансформацию от «чистого коннекциониста» 90-х годов к исследователю, стремящемуся интегрировать символьные рассуждения в нейросети .

Ключевые вехи этой трансформации:

2000-е: Осознание важности абстракции и поиск «слов» или концептов на верхних уровнях нейросетей .
2014 год: Открытие механизмов внимания, которые позволяют фокусироваться на немногих элементах, что характерно для человеческой мысли .
2017 год: Публикация работы «The Consciousness Prior», связавшей внимание, разреженные факторные графы и теорию глобального рабочего пространства .

Учёный отмечает, что его взгляды в некоторой степени сблизились с позицией критика глубокого обучения Гэри Маркуса (Gary Marcus). Оба согласны в необходимости композиционности и абстракции, однако Бенжио настаивает: эти свойства должны именно выучиваться нейросетью, а не закладываться человеком вручную в виде жестких правил .