Джефф Бек: «Байесовский мозг эффективнее градиентного спуска»

Machine Learning Street Talk 25,9 тыс. 1 ч 10 мин 3 мин 13.10.2023
Главное

Вероятностный подход к ИИ: байесовский мозг и активный вывод 0:00

В мире искусственного интеллекта доминирует парадигма глубокого обучения, основанная на градиентном спуске, однако ведущие исследователи всё чаще обращаются к альтернативам, вдохновленным биологией. В интервью для канала Machine Learning Street Talk гость программы Джефф Бек (компутационный нейробиолог с 15-летним стажем) обсуждает с ведущим теорию байесовского мозга и концепцию активного вывода как более эффективную и стабильную модель интеллекта. Главный сюжет дискуссии разворачивается вокруг того, можно ли заменить «религию» градиентного спуска на байесовскую логику и почему агенты, стремящиеся к гомеостазу, могут быть безопаснее и эффективнее традиционных моделей с «функцией вознаграждения».

🧠 Гипотеза байесовского мозга: от философии к эмпирике 0:54

Джефф Бек утверждает, что мозг не просто «действует так, как будто» выполняет байесовский вывод, он буквально реализует операции вероятностного рассуждения. По мнению Бека, байесовский анализ — это фундаментальное продолжение логического мышления в условиях неопределенности.

Основные тезисы о природе познания:

🤖 Активный вывод: как агенты строят модель мира 5:52

В отличие от стандартного машинного обучения, которое обычно работает офлайн на стационарных данных, активный вывод (active inference) предполагает, что агент постоянно взаимодействует с окружающей средой.

🚀 Будущее оптимизации: градиент против байесовских шагов 30:10

Одной из самых амбициозных тем беседы стала работа Бека над трактуемым байесовским выводом для больших моделей. Бек утверждает, что трансформеры, лежащие в основе современных LLM, по сути являются «смесью экспертов» (mixture of experts), и их структуру можно обучать без классического градиентного спуска.

⚖️ Проблема вознаграждения и будущее агентных систем 48:47

Ведущий и Бек сходятся во мнении, что использование монолитных «функций вознаграждения» (reward functions) — это путь к катастрофе, так как это дает системе опасную цель без понимания контекста («Reward is Enough» — ошибочная концепция).

💬 Цитаты

«Science is about prediction and data compression and nothing else.»

Джефф Бек 14:40

«Reward function specification is dangerous. The last thing you want to do is tell Skynet to end world hunger.»

Джефф Бек 50:33
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Байесовский вывод
Метод статистического вывода, в котором вероятности используются для представления степени уверенности в гипотезах.
Марковское одеяло
Набор переменных, которые делают подсистему независимой от остальной части системы, определяя границы агента.
Активный вывод
Теория, согласно которой агенты действуют так, чтобы минимизировать свою «свободную энергию» (удивление/ошибку предсказания).
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Jeff Beck Active Inference Bayesian Brain Transformer Markov Blanket