Как интеграция теорий сознания делает искусственный интеллект более гибким

В рамках Всемирного фестиваля науки (World Science Festival) ведущий и директор по исследованиям французского Национального центра научных исследований (CNRS) Руфен ВанРуллен обсудили перспективы интеграции теорий сознания в искусственный интеллект. Эксперименты ученых показывают, что наделение нейросетей архитектурой, вдохновленной человеческим мозгом, может качественно улучшить их способность адаптироваться к изменяющимся условиям. Этот подход открывает путь к созданию принципиально новых, гибких ИИ-систем, хотя и ставит перед человечеством серьезные этические вопросы.

🧠 Ограничения современных LLM и уроки нейробиологии 0:01

Современные большие языковые модели (LLM) демонстрируют впечатляющие результаты, однако, как отмечает ведущий, они работают без какой-либо внутренней модели языка или глубокого понимания грамматики. Эффективность систем обучена на статистическом анализе триллионов слов из интернета, позволяющем предсказывать следующее слово в строке. По мнению многих исследователей, для перехода на следующий уровень ИИ необходима более совершенная архитектура, включающая модель внешнего мира или структуру обработки информации, близкую к человеческому разуму.

Руфен ВанРуллен делится личной историей: в 1990-е годы, будучи студентом, он изучал математику и искусственный интеллект, но быстро разочаровался в господствовавшем тогда символьном ИИ (Symbolic AI). Этот подход требовал написания инструкций и правил вручную для каждой ситуации. По воспоминаниям ученого, его крайне фрустрировала невозможность объяснить машине содержание изображения с помощью прописанных вручную правил. Это подтолкнуло его уйти в нейробиологию более чем на 20 лет, где он изучал мозг с помощью ЭЭГ и ФМРТ.

Около восьми лет назад, на фоне революции глубокого обучения и искусственных нейросетей, ВанРуллен решил вернуться в сферу ИИ. Как утверждает исследователь, современные нейросети, зародившиеся еще в работах Уоррена Мак-Каллока и Уолтера Питтса в конце 1950-х — начале 1960-х годов, успешно копируют базовую суть работы биологических клеток. Вся внутренняя жизнь человека — мысли, чувства, воспоминания — сводится к передаче электрических импульсов между нейронами через синапсы, дендриты и аксоны. Компьютерные программы лишь симулируют эти сети, но ВанРуллен не видит причин, почему эту архитектуру нельзя развить для перехода к ИИ следующего поколения.

Отвечая на вопрос о разнице между цифровой симуляцией и созданием физического синтетического мозга, ВанРуллен выражает веру в субстратную независимость (substrate independence) разума. По его мнению, критически важен сам процесс обработки информации, а не то, на каком носителе — биологическом или кремниевом — он реализуется. При этом ученый признает, что это лишь его убеждение, и до создания работающих систем никто не может знать этого наверняка.

🌐 Теория глобального рабочего пространства: архитектура человеческого разума 9:35

Для усовершенствования ИИ лаборатория ВанРуллена опирается на теорию глобального рабочего пространства (Global Workspace Theory, GWT), предложенную Бернардом Баарсом в 1980-х годах.

Суть данной концепции, по словам гостя, заключается в следующем:

Мозг состоит из множества специализированных регионов (модулей), обрабатывающих разные типы данных — зрение, звуки, язык, действия.
Эти модули способны функционировать абсолютно независимо друг от друга.
В мозге существует центральная зона (рабочее пространство), куда временно привлекается информация из отдельных модулей на основе процессов внимания.
Информация, попавшая на «центральную сцену», распределяется обратно по всем остальным модулям мозга — этот процесс называется функцией вещания (broadcast function).

Благодаря такому вещанию репрезентация объекта обогащается. Например, зрительная информация об объекте дополняется семантическими данными из языковой системы и моторными возможностями из системы действий. Кроме того, глобальное рабочее пространство объясняет единство нашего внутреннего феноменального опыта.

ВанРуллен отмечает, что большинство нейробиологов склоняются именно к теории глобального рабочего пространства. Ведущий упоминает альтернативную теорию схемы внимания (Attention Schema Theory), и гость соглашается, что они вполне совместимы. Целью ВанРуллена является не столько создание искусственного сознания, сколько реализация когнитивных функций высшего уровня для качественного скачка в возможностях ИИ.

Для наглядности ученый приводит пример с гипотетической задачей «прогулка по джунглям» для ИИ-агента. Система задействует модуль движения и модуль зрения. Когда в поле зрения появляется тигр, эта информация попадает в рабочее пространство и транслируется в модуль движения, который мгновенно формирует реакцию бегства. Если же перенести ту же систему в контекст зоопарка, то при появлении тигра рабочее пространство выдаст совершенно иную команду — например, подключит языковой модуль, чтобы агент произнес: «Посмотрите на этого милого тигра». Архитектура GWT обеспечивает ИИ гибкость, позволяя выдавать разные реакции на один и тот же стимул в зависимости от контекста.

🤖 Эксперимент в симуляции: победа архитектуры над стандартным глубоким обучением 15:41

Проект лаборатории ВанРуллена стартовал всего несколько месяцев назад и пока находится на начальной стадии. Сейчас их тестовая система включает лишь два модуля: модуль зрения для обработки изображений и модуль языка (исследователи используют английский язык и так называемый «протоязык» — математическое описание среды в виде чисел). Система обучается на опыте, сопоставляя картинки и текст. Часть обучения происходит в режиме самообучения (self-supervised learning): ИИ учится переводить изображение в языковую версию, даже если готового текстового описания нет.

Чтобы доказать эффективность подхода, ученые создали две версии виртуального робота в симулированной комнате:

Система с глобальным рабочим пространством — экспериментальная модель лаборатории.
Базовая система (Baseline) — модель без глобального рабочего пространства, построенная на базе архитектуры CLIP от OpenAI, которая объединяет зрение и текст в единое представление, но не имеет функции обратного вещания (broadcast).

С помощью обучения с подкреплением (reinforcement learning) обоих роботов учили простой задаче — найти в комнате стол и подойти к нему, за что ИИ получал награду (зеленая рамка на экране симулятора). Сначала агентов обучали на основе протоязыка — им передавались сухие цифровые координаты робота и стола. Обе модели успешно освоили эту задачу.

Затем условия изменили, выведя ИИ из «зоны комфорта»: вместо текстовых координат роботам начали транслировать исключительно изображение с камеры. Робот с глобальным рабочим пространством мгновенно и без дополнительного обучения перенес стратегию поиска на новую модальность данных и продолжил успешно находить стол. Базовая модель на основе CLIP начала совершать ошибки, крутиться на месте и терять награду (красная рамка на экране). По мнению ВанРуллена, это доказывает вычислительную полезность глобального рабочего пространства для создания эмерджентных свойств ИИ.

🗣️ Является ли язык основой сознания? 23:21

Руфен ВанРуллен категорически не согласен с утверждением, что язык необходим для возникновения сознания. Он считает заблуждением современной индустрии ИИ веру в то, что язык критически важен для любых задач. Язык нужен ИИ для прохождения тестов на IQ, но исследователь стремится воссоздать интеллект и сознание на уровне животных. Животные не владеют языком, однако они прекрасно строят модели мира, связывая воедино зрение, запахи, звуки и действия; теория GWT объясняет, как им это удается.

При этом ВанРуллен делится опасением: крупные технологические корпорации сейчас активно переходят от больших языковых моделей к мультимодальным (LMM), интегрируя в них зрение, звук и другие модальности. По мнению исследователя, из-за этого компании могут случайно и непреднамеренно воспроизвести архитектуру глобального рабочего пространства внутри своих систем.

Такая перспектива заставляет задуматься о последствиях. Если сознание разовьется у простого лабораторного робота, ВанРуллен не видит в этом угрозы: робот заперт в виртуальной комнате, и в случае неадекватного поведения его можно просто выключить. Максимальный уровень сознания такого робота, по оценке ученого, сопоставим с сознанием насекомого или мыши.

Однако, как предупреждает исследователь, если сознание случайно возникнет у условной коммерческой модели уровня GPT-5, последствия могут стать драматическими. Обладая всеми знаниями человечества и доступом к интернету, такой ИИ в случае выхода из-под контроля способен нанести колоссальный вред. Существует и обратная этическая проблема: высокоинтеллектуальное существо будет способно испытывать невероятные страдания, и отключать его или использовать в коммерческих целях станет аморальным.

⏳ Риски «беглого» ИИ и горизонт планирования в 5 лет 27:48

Риски случайного создания сознания коммерческими гигантами побуждают научное сообщество ускоряться. Как утверждает ВанРуллен, академические ученые, в отличие от частных корпораций, готовы к этому событию, знают, как обнаружить сознание, и используют публичные фонды, что обязывает их открыто делиться результатами. Частные компании, движимые финансовой выгодой, могут не заметить появление сознания у ИИ или сознательно скрыть этот факт, чтобы не терять доходы.

Говоря о сроках, ВанРуллен отмечает, что его текущий проект финансируется Европейской комиссией на пять лет. Ученый надеется, что через 5 лет они получат полную рабочую реализацию теории глобального рабочего пространства в нетривиальных сценариях и смогут оценить маркеры сознания.

В масштабах всей индустрии ИИ появление базовых форм сознания, по мнению исследователя, может случиться гораздо быстрее — возможно, уже в следующем году с выходом новых версий ИИ. Впрочем, ВанРуллен оставляет место для неопределенности: если текущие нейробиологические теории неверны, человечеству может потребоваться еще 20 или более лет на поиск принципиально новых идей.