В новом выпуске подкаста Machine Learning Street Talk доктор Максвелл Рамстед (Maxwell Ramstead), один из ведущих теоретиков в области активного вывода (Active Inference), и Джейсон Фокс (Jason Fox), бывший инженер Microsoft и CTO компании Noumenal, обсуждают фундаментальный кризис современной ИИ-индустрии. По их мнению, популярный подход «просто добавь LLM к роботу» обречен на провал, так как истинный интеллект неотделим от физического тела и прямого взаимодействия с реальностью.
🧱 Проблема «информационного вакуума»: почему LLM не понимают реальность 0:00
Современный искусственный интеллект, включая самые продвинутые большие языковые модели (LLM), страдает от отсутствия «воплощенности» (embodiment) . По мнению Максвелла Рамстеда, разум — это не просто алгоритм, работающий внутри процессора, а система, глубоко интегрированная в физическую среду. Тело не является «опциональным дополнением» к разуму; оно — инструмент, который задает границы и смысл познания .
Джейсон Фокс утверждает, что основная причина медленного внедрения ИИ в робототехнику заключается в том, что модели обучаются исключительно в «пространстве данных», а не в физическом мире :
- Модели обучаются на симуляциях или текстах, не имея концепции физики, веса, трения или манипуляции объектами.
- Язык — это «сжатие сжатия» (вторичная репрезентация), которая находится как минимум в двух шагах от реальности .
- LLM успешно имитируют интеллект только потому, что люди (пользователи и разметчики) проецируют свои смыслы на их выходы .
Максвелл Рамстед сравнивает текущее состояние ИИ с «аллегорией пещеры» Платона . Подобно узникам, видящим лишь тени на стене, нейросети взаимодействуют только с корреляциями в данных, не имея доступа к процессам, которые эти данные породили .
🌍 Философия реальности: что значит «существовать» для ИИ 26:45
В дискуссии поднимается вопрос о том, что именно делает объект «реальным» для познающего субъекта. Рамстед, опираясь на Хайдеггера, Мерло-Понти и Лакана, предлагает феноменологическое определение: «Реальность — это то, обо что ты ударяешься» . Реальный объект оказывает сопротивление и фрустрирует ожидания, заставляя систему обновлять свою внутреннюю модель.
Участники обсуждают концепцию «реальных паттернов» (Real Patterns) Дэниела Деннета :
- Реальным паттерном считается любая регулярность, которая позволяет сжимать данные и предсказывать будущее.
- Если отбрасывание паттерна ухудшает предсказание, значит, он обладает «онтологическим статусом» .
- Для робота объект — это не просто набор пикселей, а набор «аффордансов» (возможностей взаимодействия): что с ним можно сделать и как он ответит на действие .
🕸 Эмерджентность и теория ограничений 29:57
Обсуждая, как из простых физических взаимодействий рождается сложный разум, собеседники обращаются к работе Марка Бедо (Mark Bedau) 1997 года о «слабой эмерджентности» . Бедо утверждал, что эмерджентные макро-свойства автономны, но при этом полностью детерминированы нижним уровнем.
Максвелл Рамстед предлагает более современный взгляд, основанный на работах Алисии Хуарреро (Alicia Juarrero) и Макса Кистлера (Max Kistler) :
- Композиция: Прямая связь «часть — целое» (как капли в облаке).
- Ограничения (Constraints): Отношения, которые не являются прямой «эффективной причиной», но меняют энергетические барьеры для взаимодействий .
🧪 Принцип свободной энергии как фундамент «объектности» 41:10
Ключевой технический вклад Карла Фристона — Принцип свободной энергии (FEP) — Рамстед называет расширением второго закона термодинамики для открытых систем с границами .
- В закрытой системе (например, облако газа) градиенты исчезают, наступает тепловая смерть .
- При наличии границы (барьера) возникает «информационное сопряжение» или обобщенная синхрония: система вынуждена статистически «становиться похожей» на среду, чтобы минимизировать неожиданность .
- Определение объекта: С точки зрения FEP, объект — это то, что имеет границу. Взаимодействие происходит только на границе, и статистика этой границы определяет тип объекта .
По мнению гостей, именно этого понимания «физических границ» не хватает современному машинному обучению, которое оперирует в абстрактном векторном пространстве .
🚀 Noumenal: маркетплейс моделей вместо монолитных LLM 1:10:31
Джейсон Фокс и Максвелл Рамстед создали компанию Noumenal, чтобы реализовать альтернативный подход к ИИ. Вместо создания одной гигантской модели-всезнайки (как GPT-4), они строят «маркетплейс моделей», вдохновленный структурой мозга .
Основные принципы Noumenal:
- Композиционность: Интеллект должен состоять из набора модулей, специфичных для конкретных ситуаций и задач .
- Активный вывод: Система не просто пассивно обрабатывает данные, а постоянно «прощупывает» мир, проверяя гипотезы .
- Пакеты поведения (Behavior Packs): Возможность для робота «скачать» новый навык (например, манипуляцию конкретным типом объекта) из облака, если его текущая модель не справляется .
- Байесовский подход: Система количественно оценивает свою неуверенность. Если паттерн данных незнаком, робот «звонит другу» — запрашивает подходящую модель у сети .
💰 Экономика данных и «момент DeepSeek» 1:15:12
Обсуждая бизнес-модель OpenAI, Рамстед выражает скепсис: «Владение весами моделей перестает быть эффективным режимом защиты бизнеса» . Он приводит в пример DeepSeek и методы дистилляции знаний: если кто угодно может обучить свою систему на ответах вашей через API, ваше преимущество тает.
Ключевые тезисы о будущем рынка ИИ:
- Дефицит данных: Интернет-данные исчерпаны. Следующий этап — автономная генерация данных самими агентами в процессе исследования физического мира .
- Эксплуатация пользователей: Сейчас компании (Google, OpenAI) бесплатно забирают данные у пользователей. В будущем люди захотят владеть своими данными и монетизировать модели, обученные на их специфическом опыте .
- Sim-to-Real Gap: Модели, идеально работающие в симуляции, часто выходят из строя на реальном железе из-за шума датчиков и моторов. Noumenal планирует предоставлять «физические юнит-тесты» — возможность протестировать модель на реальном парке роботов перед развертыванием .
В завершение Джейсон Фокс упоминает «Тест физической местности» (Physical Terrain Test), предложенный Джимом Фаном из NVIDIA . Задача: робот заходит в комнату после бурной вечеринки (мусор, коробки из-под пиццы) и должен навести идеальный порядок и накрыть стол для романтического ужина так, чтобы результат был неотличим от работы человека. Именно это — настоящая планка для воплощенного ИИ.