Анна Иванова: «ChatGPT имитирует мышление, но не понимает контекст»

The TWIML AI Podcast 3,2 тыс. 47 мин 3 мин 13.03.2023
Главное

Мыслит ли ChatGPT? Взгляд когнитивной нейробиологии 0:38

Способен ли искусственный интеллект к реальному мышлению, или он лишь мастерски имитирует человеческую речь? В этом эпизоде подкаста The TWIML AI Podcast ведущий Сэм Черрингтон беседует с Анной Ивановой, постдокторским исследователем в MIT Quest for Intelligence, чтобы обсудить, как методы когнитивной нейробиологии позволяют оценить глубину «интеллекта» больших языковых моделей (LLM), таких как ChatGPT.

Нейробиология и границы машинного обучения 1:04

Анна Иванова, чья научная деятельность до недавнего времени была сфокусирована на изучении связи языка и мышления у человека с помощью функциональной МРТ, перенесла свой опыт в сферу нейросетей. Основная цель её исследований — понять, насколько внутренние процессы моделей напоминают работу человеческого мозга и «думает» ли ChatGPT в привычном нам смысле.

Для оценки способностей моделей исследователи используют два подхода:

Иванова отмечает, что современные модели уже демонстрируют поразительное сходство с мозгом, что позволяет даже прогнозировать активность нейронов в ответ на новые фразы, не прибегая к сканированию человека в каждом эксперименте.

Формальная против функциональной компетенции 6:42

В своей работе Иванова и её коллеги проводят четкую границу между двумя типами навыков:

  1. Формальная лингвистическая компетенция: Способность модели использовать язык, следовать правилам грамматики и понимать закономерности сочетаемости слов. ChatGPT и его предшественники достигли здесь колоссальных успехов, что было подтверждено анализом их способности «обучаться» грамматике из больших массивов текста.
  2. Функциональная лингвистическая компетенция: Способность применять знания для решения задач в реальном мире, понимать намерения собеседника и обладать базовыми знаниями о физическом мире.

По мнению гостьи, модели всё ещё сильно отстают в функциональной компетенции. У человека наличие интенции (намерения) — это база общения, тогда как модели лишь имитируют паттерны, увиденные в тренировочных данных, не имея при этом цели.

Проблема здравого смысла и «ошибки репортера» 16:45

Одним из критических вопросов является «здравый смысл» (World Knowledge). Существует дискуссия: достаточно ли только текста для формирования картины мира, или необходимо визуальное восприятие?

Анна Иванова подчеркивает проблему «ошибки репортера» (reporter bias): тексты в интернете содержат информацию преимущественно о необычных событиях.

Иванова полагает, что масштабирование данных не решит эту проблему. Для настоящего прорыва системам, подобно человеку, необходимо строить «ситуационные модели» (situation modeling) — абстрактные схемы сущностей и связей, которые позволяют заполнять пробелы в знаниях.

Человеческий фактор и будущее ИИ 31:35

Почему же ChatGPT так сильно захватывает воображение людей? По мнению Ивановой, это происходит из-за того, что мы автоматически переносим наши человеческие ожидания на машину. Когда модель пишет «я грущу», мы подсознательно начинаем моделировать «состояние» собеседника, приписывая ему чувства.

Иванова призывает к осторожности: нельзя использовать слова модели как доказательство её сознания. Тем не менее, она с оптимизмом смотрит на интеграцию когнитивистики и ИИ. В будущем она планирует разработку новых бенчмарков, которые будут систематически проверять модели на понимание фундаментальных физических и психологических концепций.

💬 Цитаты

«Мы автоматически engage все наше ментальное оборудование, думая: почему этот человек это сказал, что у него было на уме?»

Анна Иванова 45:35

«Мы не хотим сверхчеловеческую модель, мы хотим модель человеческого уровня.»

Анна Иванова 44:14
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Формальная лингвистическая компетенция
Способность модели строить грамматически правильные предложения и усваивать структуру языка.
Функциональная лингвистическая компетенция
Способность использовать язык для достижения целей в реальном мире и понимания окружающей действительности.
Ошибка репортера (reporter bias)
Тенденция в текстах фокусироваться на необычных событиях, что искажает понимание модели об обыденных вещах.
Ситуационное моделирование
Способность создавать абстрактную ментальную карту событий и связей в мире.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Anna Ivanova ChatGPT когнитивная нейробиология MIT Quest for Intelligence