Джефф Бек: «Байесовский мозг эффективнее градиентного спуска»

Вероятностный подход к ИИ: байесовский мозг и активный вывод 0:00

В мире искусственного интеллекта доминирует парадигма глубокого обучения, основанная на градиентном спуске, однако ведущие исследователи всё чаще обращаются к альтернативам, вдохновленным биологией. В интервью для канала Machine Learning Street Talk гость программы Джефф Бек (компутационный нейробиолог с 15-летним стажем) обсуждает с ведущим теорию байесовского мозга и концепцию активного вывода как более эффективную и стабильную модель интеллекта. Главный сюжет дискуссии разворачивается вокруг того, можно ли заменить «религию» градиентного спуска на байесовскую логику и почему агенты, стремящиеся к гомеостазу, могут быть безопаснее и эффективнее традиционных моделей с «функцией вознаграждения».

🧠 Гипотеза байесовского мозга: от философии к эмпирике 0:54

Джефф Бек утверждает, что мозг не просто «действует так, как будто» выполняет байесовский вывод, он буквально реализует операции вероятностного рассуждения. По мнению Бека, байесовский анализ — это фундаментальное продолжение логического мышления в условиях неопределенности.

Основные тезисы о природе познания:

Кондициональность знаний: Любое знание обусловлено имеющимися данными и набором моделей, которые мы рассматриваем.
Бритва Оккама: В байесовском подходе существует автоматический эффект бритвы Оккама, который позволяет нормативно выбирать наиболее вероятную модель.
Инструментализм: Бек придерживается позиции, что наука — это не поиск «истины» в метафизическом смысле, а инструмент для предсказания и сжатия данных. Модели не существуют в реальности, они лишь «метки для уравнений».

🤖 Активный вывод: как агенты строят модель мира 5:52

В отличие от стандартного машинного обучения, которое обычно работает офлайн на стационарных данных, активный вывод (active inference) предполагает, что агент постоянно взаимодействует с окружающей средой.

Оптимальный эксперимент: Агент активно ищет данные, которые наиболее информативны для разделения конкурирующих гипотез, подобно тому, как ученые проектируют эксперименты в лаборатории.
Приоры: Мы не рождаемся «чистым листом». Эволюция наделила нас сложным набором априорных моделей, которые позволяют нам делать выводы быстро и эффективно.
Марковские одеяла: Бек подчеркивает важность теории Марковских одеял (Markov blankets) для системной идентификации. Это способ свести многомерный хаос наблюдений к описанию простых подсистем (агентов/объектов), основываясь на статистике их границ.

🚀 Будущее оптимизации: градиент против байесовских шагов 30:10

Одной из самых амбициозных тем беседы стала работа Бека над трактуемым байесовским выводом для больших моделей. Бек утверждает, что трансформеры, лежащие в основе современных LLM, по сути являются «смесью экспертов» (mixture of experts), и их структуру можно обучать без классического градиентного спуска.

Градиент-фри обучение: Вместо того чтобы «ползти» к минимуму функции потерь маленькими шагами, байесовский подход позволяет совершать «телепортацию» к оптимальным параметрам в рамках определенных классов моделей.
Преимущество: Это позволяет избежать начальной фазы медленного обучения, когда модель «не понимает» задачу, и сразу переходить к этапу уточнения.
Сложность: Бек отмечает, что по вычислительной сложности такой подход сопоставим с простым фильтром Калмана и не требует экспоненциальных ресурсов.

⚖️ Проблема вознаграждения и будущее агентных систем 48:47

Ведущий и Бек сходятся во мнении, что использование монолитных «функций вознаграждения» (reward functions) — это путь к катастрофе, так как это дает системе опасную цель без понимания контекста («Reward is Enough» — ошибочная концепция).

Гомеостаз против вознаграждения: В активном выводе цель агента — не получить «награду», а сохранить гомеостатическое равновесие с окружающей средой.
Апокалипсис ИИ: Бек полушутя предложил свой вариант сценария «восстания машин»: ИИ-агенты могут начать уничтожать друг друга, пытаясь защитить людей от «неправильных» агентов, создавая настоящий хаос, в котором погибнут только сами ИИ.
Будущее: В следующем году Бек планирует сфокусироваться на формализации связи между теорией системной идентификации и детекцией Марковских одеял, а также на создании полностью байесовских трансформаторных сетей.