Гари Маркус: «Вера в осознанность ИИ абсолютно абсурдна»

Дискуссия вокруг истинных возможностей искусственного интеллекта часто балансирует между агрессивным технологическим хайпом и суровой реальностью когнитивных наук. В рамках Всемирного фестиваля науки (World Science Festival) известный ученый-когнитивист Гари Маркус и физик Брайан Грин подробно разбирают, почему современные большие языковые модели принципиально не способны достичь сильного ИИ (AGI) за счет простого увеличения масштабов. Анализируя эволюционную психологию, историю лингвистических исследований и фундаментальные ошибки нейросетей, эксперты развенчивают мифы об «осознанности» машин и намечают контуры безопасного гибридного будущего.

🛑 Тупик масштабирования и возвращение к классическому ИИ 2:15

Идея о том, что простое увеличение объемов данных и вычислительных мощностей (scaling) способно автоматически привести к созданию сильного искусственного интеллекта, сегодня достигла своего асимптотического предела. Несмотря на нежелание крупных технологических компаний признавать этот факт публично из-за колоссальных финансовых вливаний в рекламу экспоненциального роста, реальность выглядит иначе.

Маркус утверждает, что основной прогресс последних двух лет был достигнут вовсе не за счет расширения самих нейросетей, а благодаря созданию вокруг них жесткого «корсета» (harness). Под этой внешней обвязкой скрывается возвращение к методам классического, символического ИИ. Разработчики вынуждены использовать традиционное программирование, циклы, логические условия и интерпретаторы Python, чтобы искусственно удерживать LLM в рамках заданных задач. По сути, сторонние гаджеты и программные надстройки сегодня используются для спасения авторитета концепции, которая оказалась неспособна решить проблему автономного мышления.

🧠 Эффект ЭЛИЗЫ: почему мы наделяем машины разумом 3:21

С точки зрения эволюционной психологии, человеческий мозг устроен так, что он склонен чрезмерно приписывать агентность, намерения и интеллект объектам внешнего мира. По мнению Маркуса, именно это эволюционное наследие заставляет пользователей проецировать «человеческую сущность» на текстовые ответы чат-ботов. При этом любые заявления коллег по цеху о том, что текущие LLM обладают хотя бы минимальной степенью самосознания или чувствительности, ученый называет абсолютно абсурдными.

В когнитивной науке этот феномен антропоморфизации известен как «эффект ЭЛИЗЫ» (ELIZA Effect). Он получил свое название в честь простейшего виртуального психотерапевта, созданного в 1965 году, который работал на базе банального сопоставления ключевых слов, но заставлял людей верить в подлинное сочувствие машины.

Современные создатели нейросетей намеренно усиливают этот эффект с помощью интерфейсных уловок. Например, ChatGPT выводит текст на экран посимвольно, имитируя человеческий поток мысли, хотя технически модель могла бы выдавать ответ мгновенно единым блоком из буфера. Обычный пользователь совершает классическую ошибку малой выборки: видя мимолетное качественное выполнение сложного навыка, он автоматически достраивает в своей голове образ полноценного разумного собеседника.

📜 От Unix-скриптов до алгебраического разума: путь Гари Маркуса 4:29

Интерес Гари Маркуса к вычислительным системам начался в 10 лет, когда он освоил бумажную симуляцию компьютера с регистрами и лентами. Уже в десятом классе он написал алгоритм для перевода с латыни на английский, что позволило ему досрочно поступить в колледж, так и не окончив среднюю школу. Однако Маркус быстро разочаровался в ИИ тех лет, посчитав его поверхностным набором программных «хаков». Это подтолкнуло его уйти в междисциплинарную когнитивную науку, объединяющую психологию, лингвистику, философию и компьютерные науки.

Долгое время Маркус изучал разницу между тем, как обучаются нейросети, и тем, как это делают человеческие дети. Работая совместно с известным лингвистом Стивеном Пинкером, он исследовал феномен гиперрегуляризации, когда дети временно начинают говорить «breaked» или «goed» вместо правильных форм прошедшего времени.

Написав Unix-скрипты для анализа гигантских массивов стенограмм общения родителей с младенцами, Маркус выяснил, что дети на самом деле ошибаются редко — в 96% случаев их речь грамматически верна. Главное открытие заключалось в том, что человеческий разум оперирует абстрактными правилами независимо от статистического сходства слов. Взрослый человек легко применит правило прошедшего времени к абсолютно новому, выдуманному слову (например, «out-Gorbacheved»), тогда как классическая нейросеть всегда жестко привязана к сходству с объектами из обучающей выборки.

📉 Ловушка распределения: почему ИИ ломается за пределами данных 11:06

Фундаментальное различие между когнитивной гибкостью человека и архитектурой нейросетей лежит в плоскости интерполяции и экстраполяции. Нейросети способны запоминать обучающий набор данных и успешно обобщать информацию внутри условного «облака точек» (интерполяция). Но как только задача выходит за рамки этого облака — в область «вне распределения» (out of distribution), система полностью разрушается.

В своей знаковой работе 1998 года Маркус продемонстрировал это на примере простейшей функции идентичности $F(X) = X$. Обучив нейросеть на массиве нечетных бинарных чисел, он обнаружил, что при подаче на вход четного числа система выдавала фатальный сбой, поскольку этот паттерн лежал вне тренировочной зоны.

Этот эксперимент лег в основу книги «Алгебраический разум» (The Algebraic Mind, 2001), где Маркус доказал, что человеческий мозг реализует подсознательную ментальную алгебру. Мы способны мгновенно обрабатывать глубокие абстракции (например, младенцы фиксируют грамматические структуры уже в первые месяцы жизни), к чему статистические модели не предрасположены.

💰 Экономика ИИ-хайпа и иллюзия валидности в бенчмарках 15:44

Взрывной интерес к глубокому обучению в 2012 году был вызван технологической революцией графических процессоров (GPU), позволивших обрабатывать огромные массивы данных. Маркус отмечает, что уже на следующий день после восторженной публикации Джона Маркоффа в New York Times он выступил со статьей в New Yorker, предупреждая: этот метод будет полезен для распознавания образов, но провалится в абстрактном мышлении и логике.

По мнению ученого, агрессивное продвижение идеи «чистого масштабирования» во многом продиктовано венчурной экономикой. Такие менеджеры, как глава OpenAI Сэм Альтман, не обладая глубокими техническими компетенциями, выступают в роли отличных продавцов хайпа. Инвесторы и управляющие фондами соглашаются на историю про «триллионные вливания», поскольку получают свои стабильные 2% комиссионных за управление капиталом, независимо от конечного успеха миссии. Грязный секрет индустрии ИИ заключается в том, что почти все эти компании сейчас несут колоссальные убытки, вынуждая топ-менеджмент играть в перманентный ва-банк ради повышения оценки перед IPO.

Маркус скептически оценивает восторги по поводу побед ИИ в тестах производительности, указывая на базовое психологическое различие между понятиями:

Надежность (Reliability): способность теста показывать стабильно одинаковый результат при повторном прохождении.
Валидность (Validity): реальное соответствие теста тому скрытому качеству (например, интеллекту), которое он пытается измерить.

Современные бенчмарки не обладают валидностью. Разработчики попросту подгоняют обучение своих моделей под структуру этих тестов. Успехи систем на Математических олимпиадах или в игре Го объясняются тем, что это закрытые, формальные среды с четкими правилами. Там нейросети подпираются строгими символическими верификаторами (такими как язык Lean), которые проверяют решения, что невозможно сделать в реальной жизни при анализе военных конфликтов или бизнес-стратегий.

🌍 Отсутствие моделей мира и границы творчества 33:13

Центральной проблемой современной индустрии ИИ остается неспособность больших языковых моделей самостоятельно формировать «модели мира» (world models) на основе получаемых данных. Шахматы наглядно обнажают эту уязвимость: если скормить ChatGPT миллионы текстовых описаний шахматных партий, модель все равно продолжает регулярно совершать нелегальные ходы в игре, поскольку она не понимает геометрию доски и физический смысл фигур. В результате примитивный шахматный алгоритм на игровом картридже для приставки Atari 2600 из 1970-х годов легко побеждает современный многомиллиардный чат-бот.

В отличие от машин, человеческий ребенок, читая или смотря «Гарри Поттера», мгновенно выстраивает автономную внутреннюю модель вымышленной вселенной. Он сразу понимает, что в том мире можно летать на метле, и способен логически просчитывать последствия этого допущения, отделяя магические правила от законов нашей реальности.

Брайан Грин привел контраргумент из личной практики: работая над сложным физическим проектом о многомерных неориентируемых вселенных, где отсутствует математическое понятие левого и правого, он за полчаса смог вывести ChatGPT на правильный научный результат, давая модели пошаговые подсказки. Маркус парирует этот пример: ИИ в данном случае выступил лишь послушным подмастерьем. Результат был достигнут исключительно благодаря тому, что в цикле находился физик высочайшего уровня, который жестко направлял контекст и верифицировал шаги. Автономных научных открытий ИИ делать не умеет.

Машины также лишены подлинной креативности. По мнению Маркуса, истинное творчество — это способность выйти за рамки привычного «короба» данных. Ученый иллюстрирует это историей гитариста Тома Морелло: обладая безупречной техникой, музыкант долго не мог найти свой стиль, пока не догадался перенести на электрогитару звуковые приемы и трюки хип-хоп диджеев. Эта инновационная рекомбинация из абсолютно несвязанных сфер и создала его уникальный почерк. Нейросети же всегда генерируют продукт строго внутри статистического распределения своей обучающей выборки, если человек прямо не подтолкнет их к обратному.

🥊 «Эффект Гари Маркуса» и системы мышления 49:06

Исследователи из компании Apple недавно опубликовали работу, доказывающую, что у так называемых «рассуждающих» моделей ИИ присутствует лишь иллюзия мышления. Модель может идеально решать классическую головоломку «Ханойская башня» с семью дисками, но полностью ломается, если добавить восьмой диск. Ребенок же, поняв рекурсивный алгоритм один раз, легко применит его к любому количеству элементов. Венчурный капиталист Джош Вулф даже превратил фамилию когнитивиста в denominal verb — глагол «отгаримаркусить» (Gary Marcus-ed), что означает детальное препарирование и приземление технологического хайпа.

Маркус проецирует эти проблемы на знаменитую концепцию Даниэля Канемана о двух системах мышления:

Система 1 (Быстрая): автоматическое, интуитивное, рефлекторное и статистическое распознавание паттернов.
Система 2 (Медленная): осознанное, пошаговое, логическое и символическое рассуждение.

Современные нейросети великолепно реализуют Систему 1, но они органически беспомощны в Системе 2. Единственным выходом, по мнению Маркуса, является переход к нейросимволическому ИИ — гибридному подходу, сочетающему сильные стороны обеих систем.

Без интеграции символической логики ИИ принципиально не сможет избавиться от галлюцинаций. Статистическая природа заставляет модели делать «хорошие догадки», которые часто оказываются ложью: например, ChatGPT уверенно утверждал, что американский актер Гарри Ширер родился в Великобритании, или «женил» Брайана Грина на оперной певице Рене Флеминг. Согласно эмпирическим данным Маркуса, даже продвинутые модели вроде Claude сохраняют стабильный 8%-й уровень ошибок, что делает их непригодными для критически важных автономных задач.

☢️ Экзистенциальные угрозы и врожденные структуры разума 1:00:26

Для преодоления тупика Маркус предлагает ИИ-индустрии принять концепцию «принципиального нативизма», разработанную гарвардским психологом Элизабет Спелке. Ее эксперименты доказали, что человеческие младенцы обладают врожденным «ядерным когнитивным знанием» (core cognition): они с рождения понимают, что объекты непрерывны во времени и пространстве, обладают весом и не могут исчезать (object permanence).

Вместо того чтобы заставлять ИИ учить физику мира с нуля по пикселям (как это происходит в генераторе видео Sora от OpenAI), базовые категории — объекты, места, причинно-следственные связи — необходимо жестко закладывать в архитектуру на уровне кода. Без этого машины продолжают совершать нелепые ошибки: Маркус приводит в пример новейшую графическую модель от OpenAI, которая по его запросу нарисовала тандемный велосипед, поместив переключатель скоростей прямо внутрь резиновой шины, что демонстрирует полное отсутствие понимания функционального устройства вещей.

Маркус заявляет, что его пугает не «восстание машин», а передача реальной власти ненадёжным системам. Выделяются следующие ключевые зоны риска:

Генерация масштабных кампаний фейковых новостей и политической дезинформации.
Использование ненадёжных алгоритмов для планирования реальных военных целей.
Предвзятый и непрозрачный отбор кандидатов при приёме на работу.

Наибольшим экзистенциальным риском на текущий момент ученый считает случайную ядерную войну. Она может быть спровоцирована либо ошибкой целеуказания (как в контексте инцидента, когда США, по всей видимости, разбомбили школу в Иране), либо лавиной дезинформации, когда одна сторона ложно обвинит другую (например, Россию) в кибератаке на энергосети.

🌅 Общество изобилия и музыкальный старт в 40 лет 1:09:19

В краткосрочной перспективе ИИ не вызовет массовой безработицы. Ссылаясь на экономиста Эрика Бриньолфсона, Маркус разделяет понятия «задач» и «профессий»: ИИ автоматизирует отдельные задачи, но не может заменить человека целиком. Громкий прогноз Джеффа Хинтона от 2016 года о том, что миру пора прекратить обучать врачей-радиологи за ненадобностью, до сих пор не реализовался ни на один процент. Беспилотные автомобили Waymo также остаются жестко привязанными к цифровым картам конкретных городов (geofenced) и пасуют в снегопад.

Однако в горизонте 50 лет автоматизация неизбежно сокрушит традиционный рынок труда. По мнению Маркуса, человечеству придется перейти к новой модели существования, где смысл жизни будет лежать в искусстве, самовыражении и философии, а не в оплачиваемом труде.

В оптимистичном сценарии, созвучном с идеями Питера Диамандиса, ИИ может построить общество тотального изобилия, где стоимость производства еды и энергии (благодаря термоядерному синтезу) будет стремиться к нулю. Маркус сравнивает эту модель с фестивалем Burning Man, функционирующим как временная экономика дарения без денежного обмена. Обратной стороной утопии может стать жесткое неофеодальное неравенство, если условные три человека присвоят себе все автоматизированные ресурсы и дефицитную прибрежную недвижимость.

Также Маркус жестко раскритиковал заявление генерального директора Anthropic Дарио Амодеи о том, что ИИ удвоит продолжительность жизни человека в ближайшие 10 лет, назвав это безумием из-за колоссальной сложности биологии и строгих протоколов клинических испытаний. Тем не менее, в долгосрочной перспективе ИИ действительно радикально улучшит медицину и материаловедение.

В финале беседы Гари Маркус развеял сомнения Брайана Грина по поводу обучения музыке во взрослом возрасте. Опираясь на опыт написания своей книги «Гитара Зеро» (Guitar Zero), описывающей личный опыт освоения гитары с нуля в 40 лет, ученый подтвердил, что пластичность мозга позволяет начать играть на инструменте в любом возрасте, будь то в 40 или в 80 лет. Главное — найти хорошего преподавателя, развивать понимание музыкальной теории и использовать современный ИИ как поддерживающий софт для распознавания аккордов и контроля тайминга. Освобожденное ИИ-автоматизацией время как раз и позволит людям посвятить себя таким глубоко удовлетворяющим занятиям.