Йошуа Бенджио о паузе в обучении ИИ и переходе от LLM к «моделям мира»

Легендарный ученый, один из «отцов-основателей» современного глубокого обучения Йошуа Бенджио (Yoshua Bengio) стал гостем подкаста Eye on AI. В беседе с Крейгом Смитом он объяснил, почему решил подписать резонансное открытое письмо о приостановке обучения мощных моделей ИИ, а также подробно изложил свое видение следующего технологического шага: перехода от простых языковых моделей к архитектурам с «моделями мира» (World Models) и логическим выводом.

🛑 Почему Йошуа Бенджио подписал письмо о паузе в обучении ИИ 1:49

Йошуа Бенджио, известный своей взвешенной позицией и скептицизмом относительно скорого появления ИИ человеческого уровня (AGI), удивил многих коллег, став одним из самых заметных подписантов письма Future of Life Institute . По словам ученого, его решение продиктовано не внезапным страхом, а многолетним наблюдением за тем, как человечество распоряжается мощными инструментами.

Основные аргументы Бенджио:

Риск злоупотребления: Чем мощнее технология, тем опаснее она в плохих руках. Бенджио сравнивает ИИ с биотехнологиями, которые могут принести огромную пользу, но требуют исключительной «мудрости» в управлении .
Неадекватность рыночных механизмов: Существующая конкуренция заставляет компании торопиться, игнорируя меры предосторожности .
Порог теста Тьюринга: Ученый утверждает, что мы достигли критического порога . Теперь машины могут вести диалог так, что их невозможно отличить от человека. По мнению Бенджио, это несет прямую угрозу демократии через манипуляцию общественным мнением .

Ученый признает, что реальная шестимесячная пауза в разработке всеми компаниями маловероятна . Однако письмо выполнило роль «тревожной кнопки», чтобы привлечь внимание правительств и запустить международную координацию. Бенджио считает, что регулирование должно быть таким же строгим, как в авиации или фармацевтике .

🌍 Проблема современных LLM: отсутствие «модели мира» 14:54

Несмотря на впечатляющие успехи трансформерных моделей, Йошуа Бенджио подчеркивает их фундаментальную ограниченность. Главная проблема — отсутствие заземления (grounding) в реальности .

По мнению Бенджио, человеческий разум четко разделяет два процесса:

Знание о мире (как всё устроено).
Принятие решений (механизм инференса/вывода) .

В качестве примера ученый приводит AlphaGo: система знает правила игры (маленькая модель мира), но её нейросеть тратит огромные ресурсы на инференс — просчет того, какой ход приведет к победе . В больших языковых моделях (LLM) этого разделения нет: знания и механизмы ответа перемешаны в одной гигантской сети, что ведет к оверфиттингу (переобучению) и галлюцинациям .

Бенджио приводит личный пример: «В моей жизни была всего одна автомобильная авария. Я никогда не падал с обрыва, но я могу легко представить последствия этого, потому что у меня есть абстрактная модель мира» . Современный ИИ пока не обладает такой способностью к причинно-следственному моделированию без прямого опыта.

🧠 GFlowNets: новая архитектура для разумных машин 21:43

Группа Бенджио разрабатывает новый фреймворк для обучения машин вывода — Generative Flow Networks (GFlowNets) . Это попытка объединить глубокое обучение с логикой классического ИИ, но без «ручного» написания правил.

Ключевые особенности GFlowNets:

Вероятностный вывод: Сеть учится делать логические шаги (например, строить математическое доказательство), получая награду, если результат согласуется с фактами .
Поиск истины: В отличие от LLM, которые просто имитируют текст, GFlowNets обучаются быть внутренне непротиворечивыми и рациональными .
Система 1 и Система 2: Бенджио опирается на идеи Даниэля Канемана. LLM сейчас — это интуитивная «Система 1». GFlowNets должны добавить ИИ «Систему 2» — медленное, осознанное рассуждение .

По мнению Бенджио, ИИ должен понимать концепцию истины на фундаментальном уровне, а не просто предсказывать следующее слово на основе статистики .

🎲 Байесовский подход к реальности 28:34

Одной из самых опасных черт нынешних ИИ Бенджио считает их «самоуверенную ошибочность» . Когда ChatGPT ошибается, он делает это с полной уверенностью.

Ученый утверждает, что правильный путь — это не создание одной «идеальной» модели мира, а использование распределения вероятностей по множеству возможных моделей .

Принцип науки: Ученые всегда имеют несколько конкурирующих теорий, объясняющих данные. Если теории согласуются — мы можем действовать уверенно. Если нет — нужно быть осторожным .
Масштабируемость: Хотя байесовский подход математически сложен, Бенджио считает, что огромные нейросети способны эффективно его аппроксимировать .

🌀 «Mind-twisting» концепция: генерация модели мира на лету 33:17

В финале беседы Йошуа Бенджио делится «взрывающей мозг» идеей, к которой пришла его группа. Возможно, нам вообще не нужна отдельная статичная нейросеть в качестве «модели мира» .

Вместо этого предлагается архитектура, где:

Существует только генеративная машина вывода.
Она генерирует куски модели мира на лету, в зависимости от текущей задачи .
Каждая сгенерированная «теория» проверяется на соответствие наблюдаемым данным (как формула $F=ma$ проверяется в эксперименте) .

Это позволяет системе быть гибкой и пересматривать свои взгляды. Исследования в этом направлении уже ведутся: летом прошлого года вышла работа «Bayesian Structure Learning with Generative Flow Networks», где GFlowNet училась генерировать графы причинно-следственных связей .

Бенджио резюмирует, что такой подход математически более рационален, так как позволяет учитывать все возможные теории и усреднять их решения, а не слепо верить одной наиболее вероятной гипотезе .