Максвелл Рамстед: «Современный ИИ заперт в пещере Платона»

В новом выпуске подкаста Machine Learning Street Talk доктор Максвелл Рамстед (Maxwell Ramstead), один из ведущих теоретиков в области активного вывода (Active Inference), и Джейсон Фокс (Jason Fox), бывший инженер Microsoft и CTO компании Noumenal, обсуждают фундаментальный кризис современной ИИ-индустрии. По их мнению, популярный подход «просто добавь LLM к роботу» обречен на провал, так как истинный интеллект неотделим от физического тела и прямого взаимодействия с реальностью.

🧱 Проблема «информационного вакуума»: почему LLM не понимают реальность 0:00

Современный искусственный интеллект, включая самые продвинутые большие языковые модели (LLM), страдает от отсутствия «воплощенности» (embodiment) . По мнению Максвелла Рамстеда, разум — это не просто алгоритм, работающий внутри процессора, а система, глубоко интегрированная в физическую среду. Тело не является «опциональным дополнением» к разуму; оно — инструмент, который задает границы и смысл познания .

Джейсон Фокс утверждает, что основная причина медленного внедрения ИИ в робототехнику заключается в том, что модели обучаются исключительно в «пространстве данных», а не в физическом мире :

Модели обучаются на симуляциях или текстах, не имея концепции физики, веса, трения или манипуляции объектами.
Язык — это «сжатие сжатия» (вторичная репрезентация), которая находится как минимум в двух шагах от реальности .
LLM успешно имитируют интеллект только потому, что люди (пользователи и разметчики) проецируют свои смыслы на их выходы .

Максвелл Рамстед сравнивает текущее состояние ИИ с «аллегорией пещеры» Платона . Подобно узникам, видящим лишь тени на стене, нейросети взаимодействуют только с корреляциями в данных, не имея доступа к процессам, которые эти данные породили .

🌍 Философия реальности: что значит «существовать» для ИИ 26:45

В дискуссии поднимается вопрос о том, что именно делает объект «реальным» для познающего субъекта. Рамстед, опираясь на Хайдеггера, Мерло-Понти и Лакана, предлагает феноменологическое определение: «Реальность — это то, обо что ты ударяешься» . Реальный объект оказывает сопротивление и фрустрирует ожидания, заставляя систему обновлять свою внутреннюю модель.

Участники обсуждают концепцию «реальных паттернов» (Real Patterns) Дэниела Деннета :

Реальным паттерном считается любая регулярность, которая позволяет сжимать данные и предсказывать будущее.
Если отбрасывание паттерна ухудшает предсказание, значит, он обладает «онтологическим статусом» .
Для робота объект — это не просто набор пикселей, а набор «аффордансов» (возможностей взаимодействия): что с ним можно сделать и как он ответит на действие .

🕸 Эмерджентность и теория ограничений 29:57

Обсуждая, как из простых физических взаимодействий рождается сложный разум, собеседники обращаются к работе Марка Бедо (Mark Bedau) 1997 года о «слабой эмерджентности» . Бедо утверждал, что эмерджентные макро-свойства автономны, но при этом полностью детерминированы нижним уровнем.

Максвелл Рамстед предлагает более современный взгляд, основанный на работах Алисии Хуарреро (Alicia Juarrero) и Макса Кистлера (Max Kistler) :

Композиция: Прямая связь «часть — целое» (как капли в облаке).
Ограничения (Constraints): Отношения, которые не являются прямой «эффективной причиной», но меняют энергетические барьеры для взаимодействий .
- Лимитирующие ограничения: как провода в процессоре, направляющие поток электронов .
- Разрешающие (enabling) ограничения: в биологии они позволяют системе достигать новых состояний стабильности, которые были бы невозможны иначе .

🧪 Принцип свободной энергии как фундамент «объектности» 41:10

Ключевой технический вклад Карла Фристона — Принцип свободной энергии (FEP) — Рамстед называет расширением второго закона термодинамики для открытых систем с границами .

В закрытой системе (например, облако газа) градиенты исчезают, наступает тепловая смерть .
При наличии границы (барьера) возникает «информационное сопряжение» или обобщенная синхрония: система вынуждена статистически «становиться похожей» на среду, чтобы минимизировать неожиданность .
Определение объекта: С точки зрения FEP, объект — это то, что имеет границу. Взаимодействие происходит только на границе, и статистика этой границы определяет тип объекта .

По мнению гостей, именно этого понимания «физических границ» не хватает современному машинному обучению, которое оперирует в абстрактном векторном пространстве .

🚀 Noumenal: маркетплейс моделей вместо монолитных LLM 1:10:31

Джейсон Фокс и Максвелл Рамстед создали компанию Noumenal, чтобы реализовать альтернативный подход к ИИ. Вместо создания одной гигантской модели-всезнайки (как GPT-4), они строят «маркетплейс моделей», вдохновленный структурой мозга .

Основные принципы Noumenal:

Композиционность: Интеллект должен состоять из набора модулей, специфичных для конкретных ситуаций и задач .
Активный вывод: Система не просто пассивно обрабатывает данные, а постоянно «прощупывает» мир, проверяя гипотезы .
Пакеты поведения (Behavior Packs): Возможность для робота «скачать» новый навык (например, манипуляцию конкретным типом объекта) из облака, если его текущая модель не справляется .
Байесовский подход: Система количественно оценивает свою неуверенность. Если паттерн данных незнаком, робот «звонит другу» — запрашивает подходящую модель у сети .

💰 Экономика данных и «момент DeepSeek» 1:15:12

Обсуждая бизнес-модель OpenAI, Рамстед выражает скепсис: «Владение весами моделей перестает быть эффективным режимом защиты бизнеса» . Он приводит в пример DeepSeek и методы дистилляции знаний: если кто угодно может обучить свою систему на ответах вашей через API, ваше преимущество тает.

Ключевые тезисы о будущем рынка ИИ:

Дефицит данных: Интернет-данные исчерпаны. Следующий этап — автономная генерация данных самими агентами в процессе исследования физического мира .
Эксплуатация пользователей: Сейчас компании (Google, OpenAI) бесплатно забирают данные у пользователей. В будущем люди захотят владеть своими данными и монетизировать модели, обученные на их специфическом опыте .
Sim-to-Real Gap: Модели, идеально работающие в симуляции, часто выходят из строя на реальном железе из-за шума датчиков и моторов. Noumenal планирует предоставлять «физические юнит-тесты» — возможность протестировать модель на реальном парке роботов перед развертыванием .

В завершение Джейсон Фокс упоминает «Тест физической местности» (Physical Terrain Test), предложенный Джимом Фаном из NVIDIA . Задача: робот заходит в комнату после бурной вечеринки (мусор, коробки из-под пиццы) и должен навести идеальный порядок и накрыть стол для романтического ужина так, чтобы результат был неотличим от работы человека. Именно это — настоящая планка для воплощенного ИИ.