В новом выпуске Machine Learning Street Talk доктор Томас Парр (Thomas Parr), теоретик в области нейронаук и практикующий врач, представляет книгу «Active Inference: The Free Energy Principle in Mind, Brain, and Behavior». Исследование, написанное в соавторстве с Джованни Пеццуло и Карлом Фристоном, предлагает амбициозный взгляд на активный вывод как на единую теорию жизни и разума, объединяющую физику, биологию и когнитивистику.
📚 Две дороги к активному выводу 0:00
Книга структурирована вокруг двух концептуальных подходов, которые авторы называют «высокой» и «низкой» дорогой.
- «Низкая дорога» (Low Road): Начинается с психологии и идей Гельмгольца о бессознательных умозаключениях. Она рассматривает мозг как «машину предсказаний», которая использует внутренние модели для объяснения окружающего мира.
- «Высокая дорога» (High Road): Берет начало в физике и первых принципах. Она постулирует, что любая система, сохраняющая свою целостность во времени, должна минимизировать свободную энергию, чтобы противостоять энтропийному распаду.
По словам Томаса Парра, оба пути ведут к одному выводу: агент — это система, которая не только обновляет свои убеждения под влиянием мира, но и активно меняет мир, чтобы он соответствовал её внутренним ожиданиям. Карл Фристон в предисловии к книге описывает этот процесс поэтично: «Вы прощупываете эту страницу своими глазами просто потому, что это действие разрешит неопределенность в отношении того, что вы собираетесь делать дальше».
🧠 Почему ChatGPT — это не агент? 6:14
Обсуждая современные технологии, такие как ChatGPT, Томас Парр подчеркивает фундаментальное различие между пассивным ИИ и биологическим интеллектом. По его мнению, архитектуры глубокого обучения представляют собой форму аппроксимации функций: они эффективно предсказывают ожидаемый выход на основе входных данных.
Основные отличия активного вывода от современных LLM, по мнению гостя:
- Отсутствие активного поиска: ChatGPT не может выйти в мир, чтобы инициировать конкретные взаимодействия для собственного обучения.
- Пассивность: Глубокое обучение в основном работает с наблюдательными данными, тогда как активный вывод требует моделирования мира, в котором действия агента влияют на входящие данные.
- Неявные причины: Хотя LLM улавливают статистику языка, их «модель мира» остается неявной и лишена прозрачности, характерной для биологических систем.
Тем не менее, Парр не склонен принижать значение нейросетей, отмечая, что они могут быть полезны в качестве аппроксиматоров в рамках вариационного вывода.
⚖️ Энтропия, камни и свобода воли 17:17
Принцип свободной энергии часто называют «теорией всего» для живых систем. Он утверждает, что живые организмы существуют, пока они сопротивляются энтропийным силам.
Томас Парр уточняет, что речь не идет о стремлении к состоянию с нулевой энтропией — это было бы эквивалентно статической неподвижности. Вместо этого агент должен поддерживать энтропию в определенных границах. Существует континуум сложности:
- Камни: Имеют тривиальный интерфейс с окружающей средой и почти не меняются.
- Биологические агенты: Невероятно сложны, они планируют действия на много шагов вперед, чтобы гарантировать свое выживание в будущем.
Интересен парадокс «сопротивления энтропии через её поиск». Парр объясняет: чтобы стать более уверенным в мире, агент иногда должен искать ситуации с высокой неопределенностью (высокой энтропией), чтобы разрешить её.
Что касается вопроса о свободе воли, Томас Парр предпочитает говорить об «агентности» (agency). Он считает, что даже если наши действия предопределены, их отличает сложность динамики и уникальность траектории, которая начинается с чуть разных начальных условий.
🎯 Математика сюрприза и вариационный вывод 53:37
Центральным понятием теории является «сюрприз» (surprise), который в байесовской статистике эквивалентен отрицательной логарифмической правдоподобности модели. Чем лучше модель объясняет данные, тем меньше сюрприз.
Проблема в том, что напрямую вычислить сюрприз для сложных систем невозможно — это математически трудноразрешимая задача. Здесь на помощь приходит вариационный вывод:
- Вместо точного расчета вводится «прокси»-функция — свободная энергия.
- Свободная энергия является верхней границей сюрприза.
- Минимизируя свободную энергию, мы автоматически минимизируем сюрприз и приближаем нашу внутреннюю модель к реальности.
Томас Парр отмечает, что это создает встроенную «бритву Оккама»: свободная энергия наказывает модель за излишнюю сложность, заставляя искать самое простое и точное объяснение фактов.
🛠️ Как создаются и растут внутренние модели 1:17:38
В отличие от классического машинного обучения, где параметры подбираются автоматически, модели активного вывода часто строятся вручную на основе экспертных знаний. Однако сейчас активно развивается область структурного обучения (structure learning), позволяющая моделям достраивать себя самостоятельно.
Механизмы роста модели включают:
- Добавление новых состояний для лучшего объяснения данных.
- Использование мультимодальности (зрение, проприоцепция) для взаимного уточнения предсказаний разных органов чувств.
- Синаптический прунинг: Как и в человеческом мозге, удаление лишних связей может быть ключом к эффективности.
🕯️ Загадка сознания и «смерть» вопроса о жизни 1:28:34
Томас Парр проводит параллель между вопросами о сознании и жизни. Когда-то понятие «жизнь» казалось мистическим, но по мере развития биологии вопрос «что такое жизнь?» стал менее актуальным, так как мы поняли механизмы её функционирования. Парр предполагает, что такая же судьба ждет и «трудную проблему сознания».
По его мнению, сентиентность (способность чувствовать) — это прежде всего «интенциональность» (aboutness): когда внутренняя динамика системы отражает то, что происходит снаружи, и то, как система на это влияет. С этой точки зрения, активный вывод дает материалистический и «разумный» (no-nonsense) каркас для изучения субъективного опыта.