Йошуа Бенджио о паузе в обучении ИИ и переходе от LLM к «моделям мира»

Eye on AI 13,8 тыс. 41 мин 4 мин 12.04.2023
Главное

Легендарный ученый, один из «отцов-основателей» современного глубокого обучения Йошуа Бенджио (Yoshua Bengio) стал гостем подкаста Eye on AI. В беседе с Крейгом Смитом он объяснил, почему решил подписать резонансное открытое письмо о приостановке обучения мощных моделей ИИ, а также подробно изложил свое видение следующего технологического шага: перехода от простых языковых моделей к архитектурам с «моделями мира» (World Models) и логическим выводом.

🛑 Почему Йошуа Бенджио подписал письмо о паузе в обучении ИИ 1:49

Йошуа Бенджио, известный своей взвешенной позицией и скептицизмом относительно скорого появления ИИ человеческого уровня (AGI), удивил многих коллег, став одним из самых заметных подписантов письма Future of Life Institute . По словам ученого, его решение продиктовано не внезапным страхом, а многолетним наблюдением за тем, как человечество распоряжается мощными инструментами.

Основные аргументы Бенджио:

Ученый признает, что реальная шестимесячная пауза в разработке всеми компаниями маловероятна . Однако письмо выполнило роль «тревожной кнопки», чтобы привлечь внимание правительств и запустить международную координацию. Бенджио считает, что регулирование должно быть таким же строгим, как в авиации или фармацевтике .

🌍 Проблема современных LLM: отсутствие «модели мира» 14:54

Несмотря на впечатляющие успехи трансформерных моделей, Йошуа Бенджио подчеркивает их фундаментальную ограниченность. Главная проблема — отсутствие заземления (grounding) в реальности .

По мнению Бенджио, человеческий разум четко разделяет два процесса:

  1. Знание о мире (как всё устроено).
  2. Принятие решений (механизм инференса/вывода) .

В качестве примера ученый приводит AlphaGo: система знает правила игры (маленькая модель мира), но её нейросеть тратит огромные ресурсы на инференс — просчет того, какой ход приведет к победе . В больших языковых моделях (LLM) этого разделения нет: знания и механизмы ответа перемешаны в одной гигантской сети, что ведет к оверфиттингу (переобучению) и галлюцинациям .

Бенджио приводит личный пример: «В моей жизни была всего одна автомобильная авария. Я никогда не падал с обрыва, но я могу легко представить последствия этого, потому что у меня есть абстрактная модель мира» . Современный ИИ пока не обладает такой способностью к причинно-следственному моделированию без прямого опыта.

🧠 GFlowNets: новая архитектура для разумных машин 21:43

Группа Бенджио разрабатывает новый фреймворк для обучения машин вывода — Generative Flow Networks (GFlowNets) . Это попытка объединить глубокое обучение с логикой классического ИИ, но без «ручного» написания правил.

Ключевые особенности GFlowNets:

По мнению Бенджио, ИИ должен понимать концепцию истины на фундаментальном уровне, а не просто предсказывать следующее слово на основе статистики .

🎲 Байесовский подход к реальности 28:34

Одной из самых опасных черт нынешних ИИ Бенджио считает их «самоуверенную ошибочность» . Когда ChatGPT ошибается, он делает это с полной уверенностью.

Ученый утверждает, что правильный путь — это не создание одной «идеальной» модели мира, а использование распределения вероятностей по множеству возможных моделей .

🌀 «Mind-twisting» концепция: генерация модели мира на лету 33:17

В финале беседы Йошуа Бенджио делится «взрывающей мозг» идеей, к которой пришла его группа. Возможно, нам вообще не нужна отдельная статичная нейросеть в качестве «модели мира» .

Вместо этого предлагается архитектура, где:

  1. Существует только генеративная машина вывода.
  2. Она генерирует куски модели мира на лету, в зависимости от текущей задачи .
  3. Каждая сгенерированная «теория» проверяется на соответствие наблюдаемым данным (как формула $F=ma$ проверяется в эксперименте) .

Это позволяет системе быть гибкой и пересматривать свои взгляды. Исследования в этом направлении уже ведутся: летом прошлого года вышла работа «Bayesian Structure Learning with Generative Flow Networks», где GFlowNet училась генерировать графы причинно-следственных связей .

Бенджио резюмирует, что такой подход математически более рационален, так как позволяет учитывать все возможные теории и усреднять их решения, а не слепо верить одной наиболее вероятной гипотезе .

💬 Цитаты

«Мы достигли порога теста Тьюринга... это может быть использовано крайне опасными способами, угрожающими демократии.»

Йошуа Бенджио 06:00

«В наших нейросетях нет явного места для рассуждений, особенно причинно-следственных. Это главная причина переобучения.»

Йошуа Бенджио 19:56

«Вместо отдельной нейросети-модели мира у вас может быть генеративная сеть, создающая нужные фрагменты модели на лету.»

Йошуа Бенджио 35:45
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
GFlowNets (Generative Flow Networks)
Новый класс генеративных моделей, предназначенных для обучения вероятностному выводу и поиску разнообразных решений в сложных пространствах.
World Models (Модели мира)
Внутреннее представление системы о физических и логических законах реальности, позволяющее симулировать последствия действий без прямого опыта.
Байесовская вероятность
Метод статистического вывода, при котором вероятность гипотезы обновляется по мере поступления новых данных.
Инференс (Inference)
Процесс логического вывода или принятия решения на основе имеющихся данных и модели.
📊 Цифры
🗓 Хронология
  1. весна 2023 Ожидаемое голосование по законодательству об ИИ в Канаде.
  2. лето 2022 Выход первой статьи о Bayesian Structure Learning с использованием GFlowNets.
  3. 2023 Ожидаемое принятие AI Act в Европейском союзе.
⚖️ Другая сторона
Искусственный интеллект Йошуа Бенджио GFlowNets World Models OpenAI Искусственный интеллект