# Джефф Бек: «Байесовский мозг эффективнее градиентного спуска»

Источник: https://www.youtube.com/watch?v=c4praCiy9qU
Канал: Machine Learning Street Talk
Опубликовано: 13.10.2023

---

## Вероятностный подход к ИИ: байесовский мозг и активный вывод
[[JUMP:0:00]]

В мире искусственного интеллекта доминирует парадигма глубокого обучения, основанная на градиентном спуске, однако ведущие исследователи всё чаще обращаются к альтернативам, вдохновленным биологией. В интервью для канала **Machine Learning Street Talk** гость программы **Джефф Бек** (компутационный нейробиолог с 15-летним стажем) обсуждает с ведущим теорию байесовского мозга и концепцию активного вывода как более эффективную и стабильную модель интеллекта. Главный сюжет дискуссии разворачивается вокруг того, можно ли заменить «религию» градиентного спуска на байесовскую логику и почему агенты, стремящиеся к гомеостазу, могут быть безопаснее и эффективнее традиционных моделей с «функцией вознаграждения».

## 🧠 Гипотеза байесовского мозга: от философии к эмпирике
[[JUMP:0:54]]

Джефф Бек утверждает, что мозг не просто «действует так, как будто» выполняет байесовский вывод, он буквально реализует операции вероятностного рассуждения. По мнению Бека, байесовский анализ — это фундаментальное продолжение логического мышления в условиях неопределенности.

Основные тезисы о природе познания:

*   **Кондициональность знаний:** Любое знание обусловлено имеющимися данными и набором моделей, которые мы рассматриваем.
*   **Бритва Оккама:** В байесовском подходе существует автоматический эффект бритвы Оккама, который позволяет нормативно выбирать наиболее вероятную модель.
*   **Инструментализм:** Бек придерживается позиции, что наука — это не поиск «истины» в метафизическом смысле, а инструмент для предсказания и сжатия данных. Модели не существуют в реальности, они лишь «метки для уравнений».

## 🤖 Активный вывод: как агенты строят модель мира
[[JUMP:5:52]]

В отличие от стандартного машинного обучения, которое обычно работает офлайн на стационарных данных, **активный вывод (active inference)** предполагает, что агент постоянно взаимодействует с окружающей средой.

*   **Оптимальный эксперимент:** Агент активно ищет данные, которые наиболее информативны для разделения конкурирующих гипотез, подобно тому, как ученые проектируют эксперименты в лаборатории.
*   **Приоры:** Мы не рождаемся «чистым листом». Эволюция наделила нас сложным набором априорных моделей, которые позволяют нам делать выводы быстро и эффективно.
*   **Марковские одеяла:** Бек подчеркивает важность теории Марковских одеял (Markov blankets) для системной идентификации. Это способ свести многомерный хаос наблюдений к описанию простых подсистем (агентов/объектов), основываясь на статистике их границ.

## 🚀 Будущее оптимизации: градиент против байесовских шагов
[[JUMP:30:10]]

Одной из самых амбициозных тем беседы стала работа Бека над **трактуемым байесовским выводом** для больших моделей. Бек утверждает, что трансформеры, лежащие в основе современных LLM, по сути являются «смесью экспертов» (mixture of experts), и их структуру можно обучать без классического градиентного спуска.

*   **Градиент-фри обучение:** Вместо того чтобы «ползти» к минимуму функции потерь маленькими шагами, байесовский подход позволяет совершать «телепортацию» к оптимальным параметрам в рамках определенных классов моделей.
*   **Преимущество:** Это позволяет избежать начальной фазы медленного обучения, когда модель «не понимает» задачу, и сразу переходить к этапу уточнения.
*   **Сложность:** Бек отмечает, что по вычислительной сложности такой подход сопоставим с простым фильтром Калмана и не требует экспоненциальных ресурсов.

## ⚖️ Проблема вознаграждения и будущее агентных систем
[[JUMP:48:47]]

Ведущий и Бек сходятся во мнении, что использование монолитных «функций вознаграждения» (reward functions) — это путь к катастрофе, так как это дает системе опасную цель без понимания контекста («Reward is Enough» — ошибочная концепция).

*   **Гомеостаз против вознаграждения:** В активном выводе цель агента — не получить «награду», а сохранить гомеостатическое равновесие с окружающей средой.
*   **Апокалипсис ИИ:** Бек полушутя предложил свой вариант сценария «восстания машин»: ИИ-агенты могут начать уничтожать друг друга, пытаясь защитить людей от «неправильных» агентов, создавая настоящий хаос, в котором погибнут только сами ИИ.
*   **Будущее:** В следующем году Бек планирует сфокусироваться на формализации связи между теорией системной идентификации и детекцией Марковских одеял, а также на создании полностью байесовских трансформаторных сетей.