Лингвист Гай Эмерсон о том, как обучить ИИ истине, а не просто статистике

Machine Learning Street Talk 3,6 тыс. 1 ч 29 мин 5 мин 04.03.2022
Главное

В новом выпуске подкаста Machine Learning Street Talk вычислительный лингвист Гай Эмерсон и эксперт по ИИ Валид Саба обсуждают фундаментальные проблемы семантики и того, как машины учатся понимать смысл. Дискуссия сосредоточена на поиске баланса между статистическим распределительным подходом и строгими лингвистическими структурами, необходимыми для истинного понимания человеческого языка.


🧮 Семантика: от векторов к истинности 1:00

Большинство современных моделей машинного обучения представляют значение слова как точку в многомерном векторном пространстве. Однако Гай Эмерсон в своей докторской диссертации в Кембридже утверждает, что векторные модели не способны адекватно передать такие аспекты, как полисемия (многозначность слов, например, слово get может означать «понять», «достать» или «стать»).

Основные тезисы Гая Эмерсона относительно семантики:

Валид Саба дополняет, что главная проблема векторов — ограниченность операций над ними. По его мнению, с векторами можно вычислить только сходство, тогда как язык требует сложных композиционных операций, таких как отрицание или конъюнкция.


🌍 Проблема заземления и абстрактные концепты 12:36

Процесс связи лингвистических значений с реальным миром называется заземлением (grounding). Человек учит слово «мяч», видя перед собой физический объект и получая сенсорные данные.

В ходе дискуссии участники выделили следующие сложности этого процесса:


🧬 Врожденное против приобретенного: «Бедность стимула» 21:48

Один из центральных споров в лингвистике — аргумент Ноама Хомского о «бедности стимула» (poverty of the stimulus). Он гласит, что ребенок не получает достаточно данных извне, чтобы выучить все сложности языка, а значит, часть языковых структур является врожденной.

Позиции участников по этому вопросу:

  1. Гай Эмерсон считает это эмпирическим вопросом. Он утверждает, что эксперименты с моделями, обученными на «человеческом» объеме данных (10–100 млн токенов), показывают: многие синтаксические эффекты можно выучить без врожденных механизмов.
  2. Валид Саба настаивает, что определенные логические отношения (например, транзитивность отношения «содержаться в») не могут быть выучены просто из корпуса текстов.
  3. Кит Даггар предполагает, что то, что кажется врожденным, было «выучено» в процессе эволюции вида и закодировано в ДНК.

🎨 Универсальные ограничения: Порядок прилагательных 31:33

Интересным примером «врожденных» или эволюционных структур является порядок прилагательных. Мы говорим «прекрасная красная машина» (beautiful red car), но фраза «красная прекрасная машина» звучит неестественно. Это явление универсально для разных культур и языков.

Возможные объяснения этого феномена, предложенные в беседе:


📏 Неопределенность и «проклятие размерности» 41:46

Неопределенность (vagueness) в лингвистике — это отсутствие четких границ у слов (например, где проходит грань между красным и оранжевым цветом).

Гай Эмерсон связывает это с высокой размерностью реального мира:


🏗️ Грамматическая инженерия: HPSG 1:10:50

Гай Эмерсон является сторонником использования HPSG (Head-driven Phrase Structure Grammar) — объектно-ориентированного подхода к грамматике, который гораздо мощнее обычных контекстно-свободных грамматик (CFG).

Особенности HPSG:

Эмерсон считает перспективным направлением не ручное написание правил, а индукцию (автоматический вывод) таких грамматик из данных, сочетая строгость структуры с гибкостью машинного обучения.


⚠️ Этика и прозрачность ИИ 1:22:31

В завершение беседы участники затронули тему бурного роста популярности «экспертов по ИИ» в соцсетях. Гай Эмерсон выразил обеспокоенность тем, что многие пользователи библиотек вроде Hugging Face не понимают методологических ограничений своих моделей.

«Предвзятость (bias) — это в первую очередь социальная проблема, и только во вторую — техническая», — цитирует Гай Эмерсон Кейт Кроуфорд.

Кит Даггар и Гай Эмерсон сошлись во мнении, что инженерам необходимо быть скромнее и признавать, что понимание влияния алгоритмов на общество требует привлечения специалистов извне — юристов, социологов и профессиональных аудиторов.

💬 Цитаты

«Вы узнаете слово по компании, которую оно водит.»

Джон Руперт Фёрт (цитирует Тим Скарф) 02:21

«Предвзятость — это социальная проблема в первую очередь, и техническая — во вторую.»

Кейт Кроуфорд (цитирует Гай Эмерсон) 1:24:24

«Я не верю в значения слов.»

Сью Аткинс (цитирует Гай Эмерсон) 49:10
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Полисемия
Наличие у одного и того же слова нескольких взаимосвязанных значений.
Заземление (Grounding)
Процесс сопоставления лингвистических символов с объектами и явлениями реального мира.
HPSG
Типизированная грамматика, использующая сложные структуры признаков для описания языка.
Дистрибутивная семантика
Подход, при котором смысл слова вычисляется на основе контекстов, в которых оно встречается.
Неопределенность (Vagueness)
Отсутствие четкой границы применимости понятия к объектам.
📊 Цифры
🗓 Хронология
  1. 2018 Защита докторской диссертации Гая Эмерсона в Кембридже по теме представления смысла.
  2. 2002 Публикация работы Тортановой об источниках двусмысленности в языке.
  3. 2023 Текущий контекст обсуждения стремительного роста LLM и проблем их прозрачности.
⚖️ Другая сторона
Искусственный интеллект Guy Emerson Walid Saba HPSG дистрибутивная семантика заземление