Как интеграция теорий сознания делает искусственный интеллект более гибким

World Science Festival 54,2 тыс. 35 мин 7 мин 26.11.2024
Главное

В рамках Всемирного фестиваля науки (World Science Festival) ведущий и директор по исследованиям французского Национального центра научных исследований (CNRS) Руфен ВанРуллен обсудили перспективы интеграции теорий сознания в искусственный интеллект. Эксперименты ученых показывают, что наделение нейросетей архитектурой, вдохновленной человеческим мозгом, может качественно улучшить их способность адаптироваться к изменяющимся условиям. Этот подход открывает путь к созданию принципиально новых, гибких ИИ-систем, хотя и ставит перед человечеством серьезные этические вопросы.

🧠 Ограничения современных LLM и уроки нейробиологии 0:01

Современные большие языковые модели (LLM) демонстрируют впечатляющие результаты, однако, как отмечает ведущий, они работают без какой-либо внутренней модели языка или глубокого понимания грамматики. Эффективность систем обучена на статистическом анализе триллионов слов из интернета, позволяющем предсказывать следующее слово в строке. По мнению многих исследователей, для перехода на следующий уровень ИИ необходима более совершенная архитектура, включающая модель внешнего мира или структуру обработки информации, близкую к человеческому разуму.

Руфен ВанРуллен делится личной историей: в 1990-е годы, будучи студентом, он изучал математику и искусственный интеллект, но быстро разочаровался в господствовавшем тогда символьном ИИ (Symbolic AI). Этот подход требовал написания инструкций и правил вручную для каждой ситуации. По воспоминаниям ученого, его крайне фрустрировала невозможность объяснить машине содержание изображения с помощью прописанных вручную правил. Это подтолкнуло его уйти в нейробиологию более чем на 20 лет, где он изучал мозг с помощью ЭЭГ и ФМРТ.

Около восьми лет назад, на фоне революции глубокого обучения и искусственных нейросетей, ВанРуллен решил вернуться в сферу ИИ. Как утверждает исследователь, современные нейросети, зародившиеся еще в работах Уоррена Мак-Каллока и Уолтера Питтса в конце 1950-х — начале 1960-х годов, успешно копируют базовую суть работы биологических клеток. Вся внутренняя жизнь человека — мысли, чувства, воспоминания — сводится к передаче электрических импульсов между нейронами через синапсы, дендриты и аксоны. Компьютерные программы лишь симулируют эти сети, но ВанРуллен не видит причин, почему эту архитектуру нельзя развить для перехода к ИИ следующего поколения.

Отвечая на вопрос о разнице между цифровой симуляцией и созданием физического синтетического мозга, ВанРуллен выражает веру в субстратную независимость (substrate independence) разума. По его мнению, критически важен сам процесс обработки информации, а не то, на каком носителе — биологическом или кремниевом — он реализуется. При этом ученый признает, что это лишь его убеждение, и до создания работающих систем никто не может знать этого наверняка.

🌐 Теория глобального рабочего пространства: архитектура человеческого разума 9:35

Для усовершенствования ИИ лаборатория ВанРуллена опирается на теорию глобального рабочего пространства (Global Workspace Theory, GWT), предложенную Бернардом Баарсом в 1980-х годах.

Суть данной концепции, по словам гостя, заключается в следующем:

Благодаря такому вещанию репрезентация объекта обогащается. Например, зрительная информация об объекте дополняется семантическими данными из языковой системы и моторными возможностями из системы действий. Кроме того, глобальное рабочее пространство объясняет единство нашего внутреннего феноменального опыта.

ВанРуллен отмечает, что большинство нейробиологов склоняются именно к теории глобального рабочего пространства. Ведущий упоминает альтернативную теорию схемы внимания (Attention Schema Theory), и гость соглашается, что они вполне совместимы. Целью ВанРуллена является не столько создание искусственного сознания, сколько реализация когнитивных функций высшего уровня для качественного скачка в возможностях ИИ.

Для наглядности ученый приводит пример с гипотетической задачей «прогулка по джунглям» для ИИ-агента. Система задействует модуль движения и модуль зрения. Когда в поле зрения появляется тигр, эта информация попадает в рабочее пространство и транслируется в модуль движения, который мгновенно формирует реакцию бегства. Если же перенести ту же систему в контекст зоопарка, то при появлении тигра рабочее пространство выдаст совершенно иную команду — например, подключит языковой модуль, чтобы агент произнес: «Посмотрите на этого милого тигра». Архитектура GWT обеспечивает ИИ гибкость, позволяя выдавать разные реакции на один и тот же стимул в зависимости от контекста.

🤖 Эксперимент в симуляции: победа архитектуры над стандартным глубоким обучением 15:41

Проект лаборатории ВанРуллена стартовал всего несколько месяцев назад и пока находится на начальной стадии. Сейчас их тестовая система включает лишь два модуля: модуль зрения для обработки изображений и модуль языка (исследователи используют английский язык и так называемый «протоязык» — математическое описание среды в виде чисел). Система обучается на опыте, сопоставляя картинки и текст. Часть обучения происходит в режиме самообучения (self-supervised learning): ИИ учится переводить изображение в языковую версию, даже если готового текстового описания нет.

Чтобы доказать эффективность подхода, ученые создали две версии виртуального робота в симулированной комнате:

  1. Система с глобальным рабочим пространством — экспериментальная модель лаборатории.
  2. Базовая система (Baseline) — модель без глобального рабочего пространства, построенная на базе архитектуры CLIP от OpenAI, которая объединяет зрение и текст в единое представление, но не имеет функции обратного вещания (broadcast).

С помощью обучения с подкреплением (reinforcement learning) обоих роботов учили простой задаче — найти в комнате стол и подойти к нему, за что ИИ получал награду (зеленая рамка на экране симулятора). Сначала агентов обучали на основе протоязыка — им передавались сухие цифровые координаты робота и стола. Обе модели успешно освоили эту задачу.

Затем условия изменили, выведя ИИ из «зоны комфорта»: вместо текстовых координат роботам начали транслировать исключительно изображение с камеры. Робот с глобальным рабочим пространством мгновенно и без дополнительного обучения перенес стратегию поиска на новую модальность данных и продолжил успешно находить стол. Базовая модель на основе CLIP начала совершать ошибки, крутиться на месте и терять награду (красная рамка на экране). По мнению ВанРуллена, это доказывает вычислительную полезность глобального рабочего пространства для создания эмерджентных свойств ИИ.

🗣️ Является ли язык основой сознания? 23:21

Руфен ВанРуллен категорически не согласен с утверждением, что язык необходим для возникновения сознания. Он считает заблуждением современной индустрии ИИ веру в то, что язык критически важен для любых задач. Язык нужен ИИ для прохождения тестов на IQ, но исследователь стремится воссоздать интеллект и сознание на уровне животных. Животные не владеют языком, однако они прекрасно строят модели мира, связывая воедино зрение, запахи, звуки и действия; теория GWT объясняет, как им это удается.

При этом ВанРуллен делится опасением: крупные технологические корпорации сейчас активно переходят от больших языковых моделей к мультимодальным (LMM), интегрируя в них зрение, звук и другие модальности. По мнению исследователя, из-за этого компании могут случайно и непреднамеренно воспроизвести архитектуру глобального рабочего пространства внутри своих систем.

Такая перспектива заставляет задуматься о последствиях. Если сознание разовьется у простого лабораторного робота, ВанРуллен не видит в этом угрозы: робот заперт в виртуальной комнате, и в случае неадекватного поведения его можно просто выключить. Максимальный уровень сознания такого робота, по оценке ученого, сопоставим с сознанием насекомого или мыши.

Однако, как предупреждает исследователь, если сознание случайно возникнет у условной коммерческой модели уровня GPT-5, последствия могут стать драматическими. Обладая всеми знаниями человечества и доступом к интернету, такой ИИ в случае выхода из-под контроля способен нанести колоссальный вред. Существует и обратная этическая проблема: высокоинтеллектуальное существо будет способно испытывать невероятные страдания, и отключать его или использовать в коммерческих целях станет аморальным.

⏳ Риски «беглого» ИИ и горизонт планирования в 5 лет 27:48

Риски случайного создания сознания коммерческими гигантами побуждают научное сообщество ускоряться. Как утверждает ВанРуллен, академические ученые, в отличие от частных корпораций, готовы к этому событию, знают, как обнаружить сознание, и используют публичные фонды, что обязывает их открыто делиться результатами. Частные компании, движимые финансовой выгодой, могут не заметить появление сознания у ИИ или сознательно скрыть этот факт, чтобы не терять доходы.

Говоря о сроках, ВанРуллен отмечает, что его текущий проект финансируется Европейской комиссией на пять лет. Ученый надеется, что через 5 лет они получат полную рабочую реализацию теории глобального рабочего пространства в нетривиальных сценариях и смогут оценить маркеры сознания.

В масштабах всей индустрии ИИ появление базовых форм сознания, по мнению исследователя, может случиться гораздо быстрее — возможно, уже в следующем году с выходом новых версий ИИ. Впрочем, ВанРуллен оставляет место для неопределенности: если текущие нейробиологические теории неверны, человечеству может потребоваться еще 20 или более лет на поиск принципиально новых идей.

💬 Цитаты

«Вся наша внутренняя жизнь, любая мысль, чувство или воспоминание — это в конечном счете нейроны, посылающие электрические импульсы друг другу.»

Руфен ВанРуллен 06:56

«Мы активно не стремимся создать сознательный ИИ, мы просто хотим построить более совершенную, продвинутую и интеллектуальную систему.»

Руфен ВанРуллен 26:27

«Если это произойдет в частной компании, где на кону стоят огромные деньги, мы не можем быть уверены, что они захотят предать это огласке.»

Руфен ВанРуллен 31:01
👥 Спикеры
📖 Термины
Global Workspace Theory (GWT)
Нейробиологическая теория Бернарда Баарса, утверждающая, что сознание возникает при передаче информации из локальных модулей мозга в центральное общее пространство для дальнейшего вещания на весь мозг.
CLIP
Разработанная OpenAI нейросетевая архитектура, способная сопоставлять изображения с их текстовым описанием.
Субстратная независимость
Философское и научное допущение о том, что разум и сознание могут быть реализованы на любой подходящей физической основе, будь то углеродный мозг или кремниевый процессор.
Философский зомби
Гипотетическое существо, которое внешне ведет себя точно так же, как человек, но полностью лишено субъективного внутреннего опыта и переживаний.
📊 Цифры
🗓 Хронология
  1. 1950-е — 1960-е Уоррен Мак-Каллок и Уолтер Питтс создают первые математические модели искусственных нейросетей.
  2. 1980-е Бернард Баарс предлагает теорию глобального рабочего пространства (GWT).
  3. 1990-е Руфен ВанРуллен изучает символьный ИИ в университете и разочаровывается в его жестких ограничениях.
  4. Около 2018 года ВанРуллен возвращается из нейробиологии в ИИ на фоне революции глубокого обучения.
  5. Около 2025-2026 годов Лаборатория ВанРуллена запускает пятилетний проект по интеграции GWT в глубокие нейросети.
⚖️ Другая сторона
Искусственный интеллект Руфен ВанРуллен Global Workspace Theory OpenAI CLIP World Science Festival