Мюррей Шанахан: «Языковые модели фундаментально не похожи на людей»

В новом выпуске подкаста Machine Learning Street Talk профессор когнитивной робототехники Мюррей Шанахан подробно разбирает природу сознания, границы возможностей больших языковых моделей и концепцию «пространства возможных разумов». Основываясь на философии Людвига Витгенштейна и теории глобального рабочего пространства, исследователь объясняет, почему антропоморфизация современных ИИ-систем ошибочна и какую ключевую роль во взаимодействии разума с миром играет телесность (embodiment).

🧠 Становление исследователя: от символьного ИИ к нейробиологии 0:00

Мюррей Шанахан начал свой путь в сфере искусственного интеллекта ещё в детстве, вдохновившись классической научной фантастикой. Окончив Имперский колледж Лондона в 1984 году и получив докторскую степень в Кембридже в 1988 году, он долгое время работал в рамках классического символьного подхода (Symbolic AI),. По воспоминаниям профессора, в юности он провёл более 10 000 часов за чистым программированием, что сформировало его как инженера.

Однако на определённом этапе наступило разочарование в жёстких правилах символьных систем, что побудило учёного посвятить около десяти лет изучению реального биологического мозга и вычислительной нейробиологии,. Возвращение к ИИ произошло в начале 2010-х годов, когда взрывной рост глубокого обучения и успехи алгоритма DQN от DeepMind, научившегося играть в игры Atari с нуля, заставили Шанахана вновь поверить в перспективы этой науки,. Сегодня его научные интересы лежат на стыке ИИ, робототехники, нейробиологии и философии, и сам исследователь в шутку называет себя «странной разновидностью философа»,.

🌌 «Пространство возможных разумов» и экзотическое сознание 1:46

В своей знаковой статье «Conscious Exotica» (2016) Мюррей Шанахан развивает концепцию «пространства возможных разумов», впервые предложенную философом Аароном Сломаном в 1984 году,. Для описания и классификации этого гипотетического пространства Шанахан предлагает использовать две ключевые шкалы: общую способность к сознанию и степень сходства поведения системы с человеческим. По мнению гостя, потенциал вариативности искусственно созданных систем многократно превосходит рамки естественной биологической эволюции.

Учёный предполагает, что во Вселенной могут существовать формы сознания, настолько чуждые нам, что люди окажутся не в состоянии их распознать. При этом Шанахан, опираясь на философию Людвига Витгенштейна, отвергает радикальный дуализм и идею абсолютно скрытого, непроницаемого субъективного опыта,. Профессор разделяет тезис о том, что «ничего не скрыто»: если сознание или ментальные состояния других существ (например, летучих мышей из знаменитого мысленного эксперимента Томаса Нагеля) кажутся нам загадкой, то это барьер эмпирический, преодолимый с помощью науки, а не глубокий метафизический тупик,,.

🌾 Ошибка Ильи Суцкевера: почему пшеничное поле — это ещё не паста 40:24

Бурную дискуссию в ИИ-сообществе вызвал резонансный твит сооснователя OpenAI Ильи Суцкевера о том, что современные большие языковые модели (LLM) могут быть «слегка сознательными». Шанахан ответил на это утверждение ироничным метафорическим тезисом: «В том же смысле, в каком огромное пшеничное поле можно назвать слегка пастой». Этот ответ стал самым популярным в профиле профессора и собрал множество одобрительных реакций от публичных интеллектуалов.

Шанахан убежден, что приписывать сознание современным текстовым моделям в полной мере нельзя, поскольку они фундаментально лишены телесности (embodiment). Согласно витгенштейновскому подходу, который разделяет профессор, мы можем использовать понятие «сознание» только при соблюдении ряда условий:

Наличие телесного воплощения, позволяющего физически взаимодействовать с миром.
Проявление целенаправленного и осмысленного поведения в общей для нас реальности.
Способность к совместной социальной практике с другими носителями разума.

Сами по себе "голые" языковые модели (bare-bones LLMs) даже не являются кандидатами на обладание сознанием,. Они не воспринимают реальность напрямую и не ведут совместную деятельность, а лишь имитируют её на основе текстовой статистики,.

🔬 Теории сознания: Глобальное рабочее пространство против IIT 8:53

Шанахан является автором влиятельной книги «Embodiment and the Inner Life» (2010), которая послужила научным фундаментом для создания научно-фантастического фильма Алекса Гарленда «Из машины» (Ex Machina), где профессор выступал главным научным консультантом,. В этой работе подробно рассматривается Теория глобального рабочего пространства (Global Workspace Theory, GWT), разработанная Бернардом Баарсом и развитая Станисласом Деаном,,. Она описывает мозг как совокупность множества параллельных специализированных процессов,.

Сознание в рамках GWT возникает тогда, когда информация из локальных узлов попадает в «глобальное рабочее пространство» и транслируется (широковещательно рассылается) по всей системе, позволяя эффективно справляться с новыми задачами,. Собеседники сопоставили GWT с другой популярной концепцией — Теорией интегрированной информации (IIT) Джулио Тонони,. IIT пытается математически измерить уровень сознания в любой системе с помощью числового показателя «Фи» ($\Phi$),. По словам Шанахана, несмотря на кажущиеся противоречия, между теориями есть синергия: обе они разграничивают локальную обработку данных и холистические, глобальные процессы,. При этом гость скептически относится к идеям Роджера Пенроуза о квантовой природе сознания и гипервычислениях, называя это мнением абсолютного меньшинства в научной среде,.

⚓ Проблема заземления символов и иллюзия понимания 51:40

Центральный аргумент Шанахана против буквального признания интеллекта LLM строится на классической «проблеме заземления символов» (Symbol Grounding Problem), сформулированной Стивен Харнадом. Человеческий язык укоренен в совместной социальной практике и физическом опыте взаимодействия с реальностью,. Когда человек произносит слово «собака», за этим стоит реальный визуальный, тактильный и контекстуальный опыт.

Напротив, большие языковые модели обучаются на огромных текстовых корпусах исключительно предсказанию следующего токена,. По мнению профессора, их символы не заземлены в физическом мире. Это приводит к феноменам галлюцинаций и конфабуляций: даже мультимодальные модели, анализируя изображения, порой начинают уверенно рассуждать об объектах, которых на картинке просто нет,. Шанахан признает невероятную эмерджентную силу этих систем (например, способность GPT-3 решать математические задачи по расчету плитки для пола), но подчеркивает, что за этим стоит скрытый механизм сложнейшего статистического распределения, а не подлинное понимание сути вещей,,.

🤖 Интенциональная установка и логическое рассуждение 1:00:01

Ведущий подметил, что Шанахан готов признать за LLM способность к логическому рассуждению (reasoning), но категорически отказывает им в наличии убеждений (beliefs) и истинного понимания. Профессор объяснил это различие через «нейтральность к содержанию» в логике. Профессор выделил ключевые отличия между механизмами логического вывода и реальными ментальными состояниями:

Логическое рассуждение контент-нейтрально и может оперировать абстрактными символами без понимания их сути (как в абсурдных силлогизмах Льюиса Кэрролла).
Убеждения жестко привязаны к содержанию и требуют постоянной верификации данных во внешней среде.
Истинное знание подразумевает агентность и способность системы выходить «за рамки себя» для подтверждения фактов.

Для описания нашего взаимодействия с ИИ Шанахан предлагает использовать термин Даниела Деннета — «интенциональная установка» (intentional stance),. Мы часто используем метафоры в обиходе: например, говорим, что «Википедия знает, кто выиграл Чемпионат мира», или что наши часы «думают, будто сейчас летнее время». В случае с ИИ интенциональная установка полезна как краткое описание сложного поведения, но Шанахан предостерегает от буквального восприятия этих фраз, поскольку это ведет к ложным ожиданиям эмпатии от алгоритмов,.

🚜 Бульдозеры Чомски и будущее промпт-инжиниринга 1:08:46

В ходе беседы ведущий поделился забавным инсайдом об интервью с Ноамом Чомски: из-за технических проблем со звуком авторам канала пришлось использовать технологии дипфейков, чтобы спасти аудиозапись. Ирония заключалась в том, что на протяжении всего интервью Чомски яростно критиковал глубокое обучение, называя его бесполезным для большой науки. Знаменитый лингвист сравнил нейросети с бульдозерами, которые хороши для уборки снега, но не вносят вклад в теоретическую физику или науку как таковую, хотя в итоге и разрешил опубликовать восстановленную нейросетью запись.

Обсуждая феномен промпт-инжиниринга, Шанахан отметил, что текстовые конструкции вроде «думай шаг за шагом» заставляют модель выдавать поразительные результаты,. Введение промпта направляет модель в определенный сегмент её невероятно сложного статистического распределения токенов,. При этом профессор считает, что промпт-инжиниринг как отдельная профессия — явление временное,. По мере совершенствования систем взаимодействие с ними станет абсолютно естественным, похожим на обычное человеческое общение, и необходимость в странных текстовых «заклинаниях» отпадет сама собой,.