Карл Фристон и Максвелл Рэмстед о физике разума и биологических целях

В рамках подкаста Machine Learning Street Talk состоялась глубокая философская дискуссия, посвященная совместимости принципа свободной энергии (FEP) и автопоэтического энактивизма. Ведущий подкаста вместе с создателем принципа свободной энергии профессором Карлом Фристоном, профессором Эйденом Бакли и доктором Максвеллом Рэмстедом разобрали тезисы недавней критической статьи, указывающей на концептуальные расхождения между этими подходами. Участники беседы продемонстрировали, как современные методы математической физики позволяют примирить интернализм с экстернализмом и заложить прочный фундамент под понимание природы живых систем.

🧩 Истоки противостояния: что такое энактивизм и где разошлись пути 0:14

Энактивизм и так называемый подход «4E» (познание как воплощенное, встроенное, протяженное и энактивированное) за последние десятилетия стали крайне популярными, превратившись в доминирующую теоретическую парадигму в наиболее философски ориентированных академических кругах когнитивистики и нейронаук. Родившись в 1980-х годах из теории автопоэза Умберто Матураны и Франсиско Варелы, эта традиция изначально носила строгий механистический характер и развивалась в русле системной биологии. Позже, во многом благодаря именно Вареле, фокус сместился от жестких механизмов к феноменологии, анализу живого опыта и динамическому сопряжению организма со средой. Согласно энактивистскому подходу, познание — это не пассивное отражение реальности, а «вызывание мира к жизни» (bringing about a world) через адаптивные действия.

Однако между радикальным крылом энактивизма и сторонниками принципа свободной энергии (FEP) возникло серьезное концептуальное напряжение. Поводом для дискуссии послужила теоретическая работа Эсекьеля ди Паоло (Ezequiel di Paolo) и Рэндалла Бира под названием «Laying Down a Forking Path: Tensions between Enaction and the Free Energy Principle». По мнению авторов этой статьи, между энактивизмом и FEP существует непреодолимая развилка, заставляющая исследователей выбирать между описанием систем через чистую динамику и через теорию информации. Радикальные энактивисты полностью отвергают информационный подход и метафору мозга как компьютера.

Профессор Эйден Бакли, вспоминая тезисы из книг Карла Фристона, разделяет энактивизм на два условных направления:

«Низкий путь» (low road) энактивизма: опирается на отказ от репрезентационализма в когнитивных архитектурах, уходит корнями в робототехнику Родни Брукса и описывает агентов, встроенных в физическую среду.
«Высокий путь» (high road) энактивизма: ставит во главу угла автопоэзис и концепцию операциональной замкнутости системы.

По мнению Бакли, хотя язык критиков из лагеря ди Паоло порой кажется излишне категоричным и отстраненным, их работа предоставляет отличную возможность прояснить, как именно принцип свободной энергии позволяет выразить и квантифицировать операциональную замкнутость, которая в классическом энактивизме оставалась скорее туманным философским концептом.

🔄 Развенчание «развилки»: динамические системы против теории информации 13:06

Профессор Карл Фристон утверждает, что категорически не понимает сути декларируемого философами раскола между теорией динамических систем и теорией информации. С точки зрения математической физики, любая серьезная теория информации, считываемая как теория вероятностей, напрямую наследуется из аппарата описания случайных динамических систем. В качестве фундаментальных примеров Фристон приводит:

Мастер-уравнение (master equation).
Волновое уравнение Шрёдингера.
Уравнение Фоккера — Планка.
Прямые и обратные уравнения Колмогорова.

Все эти инструменты представляют собой информационно-теоретическое описание физических систем, и никакой пропасти между динамикой и информацией здесь нет.

Доктор Максвелл Рэмстед добавляет, что при обсуждении этой темы с профессиональными математиками они испытывают такое же недоумение. Невозможно заниматься серьезным анализом динамических систем, не обращаясь к информационно-теоретическим мерам. Например, для описания метрик и расстояний в сложных пространствах состояний исследователям неизбежно требуется аппарат «информационной длины» (information length).

По словам Рэмстеда, корни этой ложной дихотомии лежат исключительно в философской литературе конца 1980-х и начала 1990-х годов, в частности в статьях Тима ван Гельдера (Tim van Gelder) и Роберта Порта (Robert Port). Эти авторы не предложили строгих математических доказательств или теорем о несовместимости динамического и вычислительного подходов, а руководствовались лишь интуитивным ощущением. Впоследствии их тезисы превратились в априорный догматизм из-за самореферентности академической среды, где философы просто цитировали друг друга, не проверяя первоисточники. Как считает Рэмстед, разделение между динамикой и теорией информации существует лишь в воображении людей и не имеет под собой никакого математического базиса.

Эйден Бакли уточняет исторический контекст: Ван Гельдер изначально рассматривал детерминированные динамические системы в полном отсутствии шума. В таких идеализированных моделях переход к теории информации действительно неочевиден. Однако при переходе к более реалистичным стохастическим динамическим системам теория информации становится абсолютно незаменимой, полностью объединяя оба описания.

🛡️ Марковские одеяла и операциональная замкнутость: интерфейс вместо вуали 16:05

Одним из ключевых пунктов критики энактивистов является обвинение FEP в радикальном интернализме. По мнению критиков, концепция марковских одеял изолирует организм от мира, превращая реальность в своего рода «завесу Гельмгольца», за которой внутренняя система оперирует лишь косвенными намеками и репрезентациями.

Максвелл Рэмстед категорически не согласен с такой трактовкой и указывает на строгое математическое определение: марковское одеяло состоит из степеней свободы, которые одновременно разделяют и связывают системы друг с другом. Это не стена и не вуаль, а активный интерфейс взаимодействия. Интерналистская интерпретация FEP математически несостоятельна, поскольку для работы уравнений принципиально необходимо наличие внешних состояний. Если за марковским одеялом ничего нет, то системе просто не под что подстраиваться, и математический аппарат не сработает. В то же время внутренние состояния играют асимметричную роль, параметризуя «верования» (beliefs) о внешних состояниях, что внешне придает системе интерналистский вид. Таким образом, под эгидой FEP происходит примирение интернализма и экстернализма.

В своей работе о многомасштабной интеграции (Multiscale Integration) Рэмстед предложил концепцию вложенных границ. Системы, разделенные на одном уровне, интегрируются в рамках единой структуры на уровне выше:

Отдельные клетки обладают собственными границами, но объединены на временном масштабе целостного организма.
Человеческие индивиды биологически изолированы, но когнитивно и социально сопряжены в рамках сообщества активного вывода.

Кроме того, Рэмстед указывает на фундаментальную математическую дуальность, доказанную физиками (в частности, Далтоном Шакти Водевилем): минимизация вариационной свободной энергии относительно генеративной модели эквивалентна максимизации энтропии относительно набора ограничений системы. Это означает, что когда энактивисты говорят о «замыкании ограничений» (constraint closure), описанном, к примеру, в книге Алисии Хуарреро (Alicia Juarrero) «Context Changes Everything», они математически описывают тот же самый процесс, что и сторонники FEP. Генеративная модель — это не «картинка в голове», а совокупная структура зависимостей всей системы, то есть то, что энактивисты называют организацией.

Ученые также затронули проблему динамичности границ. Рэмстед анонсировал скорый выход серии работ, посвященных «блуждающим марковским одеялам» (wandering Markov blankets). Алгоритмически этот аппарат уже работает, позволяя математически очерчивать подвижные границы даже вокруг таких нестабильных объектов, как открытое пламя.

⏳ Историчность, стационарность и физика «жидкого» хаоса 33:22

Второй крупный блок претензий в статье ди Паоло касается неспособности FEP учесть «историчность» (historicity) живых систем и их зависимость от траектории развития (path dependency). Под зависимостью от траектории понимается ситуация, когда для определения будущего состояния системы важна не только ее текущая точка в пространстве состояний, но и вектор ее скорости, то есть то, откуда она пришла. По мнению критиков, FEP ошибочно постулирует обязательную стационарность распределений, что противоречит изменчивой природе жизни.

Максвелл Рэмстед называет эти обвинения полностью несостоятельными. Он объясняет, что в литературе существует два основных семейства приложений FEP:

Динамика плотности (density dynamics).
Интегралы по траекториям (path integrals).

Для иллюстрации разницы Рэмстед приводит личный пример с употреблением кофе:

«Я пью много кофе. Если замерять мое состояние случайно в течение дня, то вероятность застать меня с чашкой составит примерно 1 к 25. Но если оценивать мою траекторию на протяжении недели, делая один замер в день, то вероятность того, что я выпиваю кофе ежедневно, будет равна 100%».

Разница между мнением о вероятности мгновенных состояний и вероятностью целых траекторий (путей) принципиальна. Принцип свободной энергии изначально, еще в ранних работах Карла Фристона 2010 года, формулировался именно через интегралы по траекториям. Математика FEP изначально построена на вероятностях различных историй и контрфактических сценариев будущего. Даже в рамках динамики плотности формулы Фристона содержат члены, успешно обрабатывающие зависимость от траектории на основе изменений показателя неожиданности (surprise).

Карл Фристон добавляет, что его вдохновляла работа Ричарда Фейнмана над интегралами по траекториям. Математический аппарат Фристона описывает переход от физики равновесия XX века к открытым системам, далеким от равновесия. Главным свойством таких биологических систем является не просто историчность, а итинерантность (странствие), порождаемая соленоидальной (вихревой) динамикой.

Фристон поясняет это на наглядной аналогии:

«Представьте воду, уходящую в сливное отверстие. Диссипативный компонент (градиентный спуск) — это вода, устремляющаяся вниз, в трубы вашего дома. Но то, как она закручивается в вихрь вокруг слива по изоконтурам распределения вероятностей — это соленоидальная часть».

Живая самоорганизация характеризуется именно соленоидальными вихрями: биологическими ритмами и жизненными циклами. Если убрать случайность, соленоидальный поток превратится в классическую ньютоновскую механику (как вращение планет вокруг Солнца), а если оставить только диссипацию — мы получим квантовую механику. Живые системы работают в «режиме Златовласки» — на стыке двух миров, где царит стохастический хаос.

Кроме того, благодаря аппарату ренормализационной группы в физике FEP возникает разделение временных масштабов. Не существует единого привилегированного масштаба. На макроуровне мы можем условно принять систему за стационарную, зная, что на микроуровне бушуют сверхбыстрые флуктуации. Быстрые флуктуации воспринимаются нами как шум, требующий вероятностного описания, в то время как медленные процессы формируют стабильную структуру.

🎯 Природа целей: от репрезентаций к эмерджентному поведению 59:33

В классических когнитивных архитектурах искусственного интеллекта (GOFAI) цели всегда кодировались жестко в виде отдельных программных модулей. В рамках внешнего энактивизма, напротив, распространено мнение, что цели вообще не должны определяться эксплицитно. FEP предлагает альтернативный взгляд: цели систем являются эмерджентным свойством их физики.

Карл Фристон задается вопросом: имеет ли цель наша физиология? Стремится ли человеческий организм поддерживать температуру тела строго на уровне 37°C?. Физиологически это выглядит именно так. Но это не значит, что клетка «думает» об этой цели. Настоящие долгосрочные намерения (одеть куртку, включить термостат) возникают у систем, обладающих временной глубиной планирования.

С точки зрения физики, у крупных систем (размером от мыши до жирафа) случайные флуктуации усредняются благодаря их масштабу. У таких существ формируется четкое распределение вероятностей будущих траекторий. При математическом разложении логарифма этой вероятности — так называемой ожидаемой свободной энергии (expected free energy) — мы получаем две классические составляющие:

Ожидаемый информационный выигрыш (exploration).
Ожидаемая полезность или награда (exploitation).

Полезность определяется вероятностью возвращения системы в область своего «пуллбэк-аттрактора» (pullback attractor), то есть в те характеристики и состояния, которые физически определяют выживание данного существа. Система планирует свои действия так, чтобы просто оставаться собой, что внешне выглядит как целенаправленное вознаграждаемое поведение. На следующем этапе эволюции, обладая развитыми генеративными моделями, мозг строит мета-модель о самом себе: «Я — сущность, и у меня есть цели».

По мнению Эйдена Бакли, данный подход позволяет переосмыслить традиционное для машинного обучения понимание «награды» как монолитной потенциальной функции. Замена концепции вознаграждения богатыми верованиями о динамике траекторий открывает огромные практические перспективы для инженерии управления системами. Бакли апеллирует к кибернетической теореме хорошего регулятора (Good Regulator Theorem) Конанта и Эшби, согласно которой любая система, эффективно управляющая средой, обязана быть хорошей моделью этой среды. Ярким примером служит центробежный регулятор Уатта (Watt governor), у которого нет скрытых цифровых репрезентаций, но его физическая динамика обязана зеркально отражать флуктуации парового двигателя для его стабилизации.

Максвелл Рэмстед отмечает глубокую совместимость FEP с экологической психологией Джеймса Гибсона. Экологические психологи гораздо сильнее подкованы технически, чем классические энактивисты, и они не отвергают теорию информации, а требуют ее расширения до семантического и средового контекстов. Рэмстед прогнозирует скорое слияние экологической психологии и байесовской механики, что позволит забрать из энактивизма все лучшие идеи, отбросив тяжелый и тупиковый метафизический багаж.

🔮 На пути к «G-теории»: онтология, метафизика и квантовый релятивизм 1:21:45

В завершение беседы участники зафиксировали статус принципа свободной энергии. Максвелл Рэмстед подчеркивает необходимость разделять онтологию (описание типов существующих вещей) и метафизику. FEP — это не метафизическое откровение об устройстве объективной реальности в отрыве от наблюдателя. Это строго научная модель, карта. Более того, это канонический способ modeling систем, которые сами заняты моделированием.

Рэмстед рассказал, что сейчас исследовательская группа активно вскрывает глубокие математические пласты под FEP, объединяя принципы унитарности и максимального калибра. Эту зарождающуюся концепцию ученые условно называют «G-теорией» (G-theory) по аналогии с М-теорией в струнной физике.

В своей основе FEP является метрологическим утверждением (связанным с теорией измерений). Существующие вещи ведут себя так, будто они постоянно измеряют сами себя для удержания в стабильных границах. В квантово-информационной формулировке FEP превращается в теорию «наблюдаемости» (observerness).

Карл Фристон проводит параллели с квантовым релятивизмом Карло Ровелли (Carlo Rovelli) и концепцией онтического структурного реализма (Ontic Structural Realism) в философии:

«Реальность кроется в самом акте измерения. Но это измерение того, как мы соотносимся друг с другом через взаимное наблюдение. Инференция, измерение, синхронизация и разреженная связь — это, по сути, синонимы».

Развитие FEP движется в сторону интеграции с квантовой петлевой гравитацией и квантово-информационным подходом Криса Филдса (Chris Fields) к голографическим экранам. По ироничному замечанию Карла Фристона, по мере этого объединения наука будет становиться всё более «серой», поскольку новые формулы окончательно размоют жесткие границы между изолированными дисциплинами, веками спорившими друг с другом.