Почему мысленный эксперимент «Китайская комната» до сих пор пугает ИИ?

Machine Learning Street Talk 22 тыс. 1 ч 39 мин 8 мин 11.10.2024
Главное

В новом эпизоде философского подкаста «Philosophical Steakhouse» ведущий др. Тим Скарфе и его постоянный собеседник Кит Даггар погружаются в глубины философии искусственного интеллекта. Центральной темой обсуждения становится знаменитый мысленный эксперимент Джона Сёрла «Китайская комната» и его непреходящее влияние на современные споры вокруг больших языковых моделей. Авторы детально разбирают онтологические границы вычислений, природу сознания и практические проблемы, с которыми сталкивается современное глубокое обучение.

🧠 Границы вычислений: большие языковые модели и машина Тьюринга 0:00

В рамках очередного философского разговора Кит Даггар и др. Тим Скарфе поднимают фундаментальный вопрос о разрыве между математическими абстракциями и их физической реализацией. Кит Даггар утверждает, что стандартные авторегрессионные языковые модели с фиксированным контекстным окном в строго техническом смысле не являются Тьюринг-полными. Несмотря на то, что на практике такие ИИ-системы могут генерировать код на Python и обрабатывать огромные объемы данных, концептуально они остаются конечными автоматами. По мнению Даггара, крайне важно проводить различие между потенциальной бесконечностью и бесконечностью актуальной.

Основные свойства этих типов бесконечности в контексте теории вычислений:

Др. Тим Скарфе указывает, что современные коммерческие модели активно обучаются работе с технологией RAG (Retrieval-Augmented Generation) для динамического расширения памяти через внешние хранилища. Однако Кит Даггар убежден, что архитектура RAG обычно не замыкает цикл вычислений. Модель лишь считывает данные из внешней базы, но не производит одновременную интерактивную запись и чтение в единую бесконечную ленту памяти.


🛑 Проблема останова и поиск в пространстве алгоритмов 14:59

Попытки обучить Тьюринг-полные системы с использованием стандартного стохастического градиентного спуска (SGD), по словам Кита Даггара, неизбежно терпят неудачу из-за фундаментальных математических барьеров. Ключевой проблемой здесь выступает классическая проблема останова Тьюринга. Тьюринг-полный алгоритм теоретически может выполняться бесконечно, и в процессе пакетного обучения нейросети инженеры сталкиваются с дилеммой: прерывать ли затянувшееся вычисление принудительно или ждать завершения неопределенный срок.

Др. Тим Скарфе предлагает альтернативный путь решения этой проблемы, ссылаясь на «гипотезу калейдоскопа» Франсуа Шолле и нативистские идеи Ноама Хомского. Он полагает, что в пространстве Тьюринга существует ограниченный набор базовых примитивов, комбинируя которые можно построить генеративную функцию полезных алгоритмов. Скарфе также упоминает идеи Даниэля Робертса из MIT, который применяет к анализу сложности нейросетей эвристики из квантовой теории поля:

Размышляя о будущем индустрии, Кит Даггар делает смелый прогноз на 50 лет вперед. По его мнению, технологическое плато чистого градиентного спуска заставит исследователей перейти к созданию сложных гибридных систем. Эти будущие ИИ-системы будут интегрировать в себе три ключевых компонента:

  1. Компоненты, обученные традиционными методами глубокого обучения.
  2. Модули, созданные методами автоматического синтеза программ и дискретного поиска.
  3. Архитектурные блоки, вручную спроектированные инженерами-людьми для обеспечения интероперабельности.

🚪 Китайская комната Джона Сёрла: мифы и реальность 29:06

Оживленная дискуссия в закрытом сообществе подкаста продемонстрировала, что взгляды философа Джона Сёрла подвергаются частому искажению. Кит Даггар разъясняет, что Сёрл никогда не отрицал принципиальную возможность создания мыслящей машины. Напротив, позиция философа заключается в том, что человеческий мозг сам является биологической машиной, способной к пониманию. Однако Сёрл утверждает, что для подлинной семантики вычислениям необходима адекватная внутренняя каузальная структура.

В своем классическом механическом эксперименте «Китайская комната» Сёрл описывает человека, запертого в помещении и манипулирующего китайскими иероглифами исключительно по инструкциям из книг. Такая система успешно проходит тест Тьюринга для внешнего наблюдателя, но сам оператор внутри комнаты не понимает ни слова по-китайски. Др. Тим Скарфе отмечает, что критики Сёрла упрекают данный мысленный эксперимент в отсутствии законченной позитивной теории семантики. Они сравнивают его с эссе Томаса Нагеля о летучей мыши, которое лишь фиксирует невозможность вообразить чужой субъективный опыт.

Тим Скарфе также цитирует позицию профессора Марка Бишопа, исследовавшего этот аргумент более 30 лет. Бишоп выдвигает жесткие философские тезисы:


🌀 Каузальная структура и сильная эмерджентность 45:15

Развивая идеи Сёрла, Кит Даггар подчеркивает критически важное различие между «вычислением» и «физической машиной». Джон Сёрл в своих лекциях упоминал, что уверен в сознательности собственной собаки не из-за её внешнего поведения, а на основании схожести их внутренних биологических механизмов. В понимании Сёрла, сознание обладает онтологической субъективностью. Это означает, что внешний наблюдатель лишен привилегированного доступа к приватным ментальным состояниям субъекта.

Собеседники подробно анализируют концепцию эмерджентности, разделяя её на два типа:

Кит Даггар открыто признает себя сторонником существования обоих типов эмерджентности. Он критикует радикальный редукционизм многих современных физиков, заявляющих, что Стандартная модель способна объяснить абсолютно все явления во Вселенной. Даггар указывает, что на практике физики сталкиваются с непреодолимыми вычислительными барьерами уже при попытке точно рассчитать квантовые взаимодействия для элементов сложнее гелия. В связи с этим Дэвид Чалмерс допускает, что сознание может оказаться единственным подлинным примером сильной эмерджентности в природе.


⏳ Ограниченные наблюдатели и глубина планирования 54:02

В качестве еще одного аргумента против возможности беспрепятственной симуляции разума на компьютерах др. Тим Скарфе приводит концепцию Стивена Вольфрама об «ограниченном в вычислительном отношении наблюдателе». По словам Скарфе, все наши научные теории и законы физики представляют собой не что иное, как «артефакты сжатия» информации. Наш мозг оперирует несопоставимо меньшими объемами вычислительной мощности, чем Вселенная, разворачивающаяся перед нами на планковских масштабах, что заставляет нас прибегать к абстракциям.

Кит Даггар разделяет упрощенный взгляд на природу вычислительной субъективности, во многом опирающийся на теорию Карла Фристона. Согласно этой гипотезе, компьютерная система обретает самосознание при выполнении следующих условий:

  1. Наличие внутренней телеметрии: Система должна получать непрерывные данные о собственном вычислительном процессе (потреблении памяти, температуре процессора, длительности циклов).
  2. Достижение темпоральной и контрфактической глубины: Возможность строить долгосрочные прогнозы и ментально просчитывать альтернативные траектории действий в прошлом и будущем.

Тим Скарфе дополняет, что Фристон связывает агентность с глубиной вложенности так называемых «марковских коконов» (Markov blankets), увеличивающих горизонт планирования. В ответ на возражения оппонентов о том, что цифровые компьютеры уже обладают богатой каузальной структуру на уровне транзисторов и тактовых частот, Кит Даггар заявляет, что вероятность случайного совпадения кремниевой каузальной структуры калькулятора со структурой, необходимой для генерации интенциональности, сознания и удержания смыслов, астрономически мала.


🧚‍♂️ Танцы с пикси и онтологический тупик 1:12:02

Значительный вклад в развитие критики чисто вычислительного разума внес профессор Марк Бишоп со своим знаменитым опровержением «Танцы с пикси» (Dancing with Pixies), базирующимся на идеях философа Хилари Патнэма. Др. Тим Скарфе излагает суть этого мысленного эксперимента: если феноменальное сознание (квалиа) возникает исключительно как следствие выполнения компьютерной программы, то шаги этого алгоритма можно математически спроецировать на микросостояния абсолютно любой открытой физической системы — например, обычного камня. Это неизбежно приводит к абсурдному панпсихизму, утверждая, будто сознание присутствует везде, а «маленькие пикси танцуют повсюду».

Кит Даггар предлагает изящное разрешение этого парадокса, указывая на критическое ограничение аргумента Патнэма — Бишопа:

По мнению Даггара, для подлинного мышления критически важно иметь устойчивую каузальную структуру, заложенную непосредственно в физическую реализацию системы, способную корректно обрабатывать контрфактические сценарии.


🎖 Нобелевская премия Джеффри Хинтона и академическая политика 1:19:40

Обсуждая недавнее присуждение Нобелевской премии по физике Джеффри Хинтону, собеседники затрагивают тему институциональных проблем науки. Кит Даггар констатирует, что современная академическая среда глубоко поражена политическими играми, кумовством, гейткипингом и борьбой за гранты. Даггар откровенно признается, что именно нежелание мириться с коррупцией и нецелевым расходованием государственных средств заставило его в свое время покинуть академическую науку. Тем не менее, оба автора сходятся во мнении, что вклад Хинтона в развитие машинного обучения неоспорим и заслуживает высочайшего признания.

Поводом для серьезных дебатов в научном мире стал сам факт вручения премии по физике за исследования в области нейросетей. Др. Тим Скарфе напоминает о скептической позиции Ноама Хомского, который считает, что модели глубокого обучения не являются полноценными научными теориями, так как они не дают глубокого объяснения природы изучаемых явлений. Кит Даггар, напротив, усматривает в успехе нейросетей глубокий физический смысл:

Скарфе также обращает внимание на прагматическое использование авторитета премии крупными технологическими гигантами. Например, Google уже ссылается на нобелевский статус своих топ-ученых в судебных разбирательствах, связанных с авторскими правами. Сам Джеффри Хинтон, как отмечает Скарфе, использует трибуну для эскалации алармизма, утверждая, что в течение десяти лет ИИ превзойдет человека в любых задачах.


📉 От экзистенциального риска к реальному вреду 1:28:38

Касаясь темы экзистенциальной угрозы ИИ, Кит Даггар озвучивает свою личную оценку вероятности гибели человечества («doom») на уровне 25%. Однако он предлагает радикально пересмотреть рамки общественной дискуссии и сместить фокус с отдаленного научно-фантастического сценария «восстания наноботов» на осязаемый текущий вред от технологий. По убеждению Даггара, более 90% населения Земли способны солидаризироваться вокруг конкретных социально-экономических проблем, порождаемых бесконтрольным внедрением алгоритмов.

Кит Даггар выделяет следующие ключевые проявления текущего вреда ИИ:

Др. Тим Скарфе солидарен с этой позицией и ссылается на критическую работу Дагмар Монне «Деконструируя миф об ИИ», а также на концепцию философа Лучано Флориди о «ре-онтологизации» человеческого существования внутри цифровой инфосферы. Согласно Флориди, тотальная миграция идентичности в цифровое пространство ведет к постепенному размыванию человеческой агентности. Резюмируя диалог, Кит Даггар призывает отказаться от идеи технократического управления обществом, когда политика диктуется исключительно узким кругом ученых. По его мнению, регулирование должно опираться на широкие демократические дискуссии и быть направлено прежде всего на обеспечение долгосрочного человеческого процветания.

💬 Цитаты

«Математическая модель черной дыры не является черной дырой. Симуляция погоды — это не погода.»

Кит Даггар 0:00

«Вся область когнитивных наук может быть определена как попытка доказать ложность аргумента Китайской комнаты.»

Кит Даггар 37:42

«Вычислительные процессы никогда не смогут дать нам молока или произвести энергию из солнечного света.»

Др. Тим Скарфе 45:03
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Потенциальная бесконечность
Процесс или процедура, которая может продолжаться неограниченно долго, но никогда не достигает завершенного бесконечного объема в данный момент времени.
Проблема останова
Классическая задача теории алгоритмов, заключающаяся в невозможности создать общую программу, которая бы определяла, завершится ли любой произвольный алгоритм или будет работать вечно.
Сильная эмерджентность
Появление у сложной системы фундаментально новых свойств или видов поведения, которые принципиально невозможно вывести или предсказать на основе анализа свойств ее отдельных частей.
Марковский кокон (Markov blanket)
В системной биологии и теории активного вывода — гипотетическая граница, отделяющая внутренние состояния системы от внешних воздействий среды.
Функционализм
Философское направление, утверждающее, что ментальные состояния определяются исключительно их функциональной ролью и каузальными связями, а не физическим субстратом.
📊 Цифры
🗓 Хронология
  1. 1980 Джон Сёрл впервые публикует мысленный эксперимент «Китайская комната» (исторический фон дискуссии).
  2. 2024 Джеффри Хинтон и Демис Хассабис получают Нобелевские премии за свои достижения в области нейросетей и ИИ.
⚖️ Другая сторона
Искусственный интеллект Джон Сёрл Chinese Room Франсуа Шолле Карл Фристон Джеффри Хинтон