# Лингвист Гай Эмерсон о том, как обучить ИИ истине, а не просто статистике

Источник: https://www.youtube.com/watch?v=dhM0_EKLg9k
Канал: Machine Learning Street Talk
Опубликовано: 04.03.2022

---

В новом выпуске подкаста Machine Learning Street Talk вычислительный лингвист Гай Эмерсон и эксперт по ИИ Валид Саба обсуждают фундаментальные проблемы семантики и того, как машины учатся понимать смысл. Дискуссия сосредоточена на поиске баланса между статистическим распределительным подходом и строгими лингвистическими структурами, необходимыми для истинного понимания человеческого языка.

---

## 🧮 Семантика: от векторов к истинности
[[JUMP:01:00]]

Большинство современных моделей машинного обучения представляют значение слова как точку в многомерном векторном пространстве. Однако Гай Эмерсон в своей докторской диссертации в Кембридже утверждает, что векторные модели не способны адекватно передать такие аспекты, как **полисемия** (многозначность слов, например, слово *get* может означать «понять», «достать» или «стать»).

Основные тезисы Гая Эмерсона относительно семантики:

* **Дистрибутивная гипотеза:** Идея о том, что значение слова можно узнать по «компании, которую оно водит», уходит корнями в британскую лексикологию и американский структурализм.
* **Теория истинности (Truth-conditional semantics):** Эмерсон предлагает подход, основанный на условиях истинности. Вместо того чтобы просто учить векторы, модель должна определять, при каких условиях предложение является истинным и к каким объектам оно относится.
* **Разделение слов и объектов:** В отличие от LLM, где всё представлено в виде слов, Эмерсон настаивает на разграничении между словами и объектами, которые они описывают.

Валид Саба дополняет, что главная проблема векторов — ограниченность операций над ними. По его мнению, с векторами можно вычислить только сходство, тогда как язык требует сложных композиционных операций, таких как отрицание или конъюнкция.

---

## 🌍 Проблема заземления и абстрактные концепты
[[JUMP:12:36]]

Процесс связи лингвистических значений с реальным миром называется **заземлением (grounding)**. Человек учит слово «мяч», видя перед собой физический объект и получая сенсорные данные. 

В ходе дискуссии участники выделили следующие сложности этого процесса:

* **Частичное заземление:** Кит Даггар задается вопросом, почему всё в языке должно быть заземлено физически. По его мнению, допустимо, если 90% понятий связаны с физическим миром, а 10% остаются чисто лингвистическими конструкциями.
* **Абстракции:** Как заземлить такие понятия, как «дружба» или «лидерство»? Гай Эмерсон полагает, что для этого необходима «теория разума» (theory of mind) и понимание намерений, стоящих за взаимодействием людей.
* **Метафорическое картирование:** Валид Саба отмечает, что многие абстрактные пространства в языке строятся как метафоры от физических понятий, что может быть ключом к их возникновению в процессе эволюции.

---

## 🧬 Врожденное против приобретенного: «Бедность стимула»
[[JUMP:21:48]]

Один из центральных споров в лингвистике — аргумент Ноама Хомского о «бедности стимула» (poverty of the stimulus). Он гласит, что ребенок не получает достаточно данных извне, чтобы выучить все сложности языка, а значит, часть языковых структур является врожденной.

Позиции участников по этому вопросу:

1.  **Гай Эмерсон** считает это эмпирическим вопросом. Он утверждает, что эксперименты с моделями, обученными на «человеческом» объеме данных (10–100 млн токенов), показывают: многие синтаксические эффекты можно выучить без врожденных механизмов.
2.  **Валид Саба** настаивает, что определенные логические отношения (например, транзитивность отношения «содержаться в») не могут быть выучены просто из корпуса текстов.
3.  **Кит Даггар** предполагает, что то, что кажется врожденным, было «выучено» в процессе эволюции вида и закодировано в ДНК.

---

## 🎨 Универсальные ограничения: Порядок прилагательных
[[JUMP:31:33]]

Интересным примером «врожденных» или эволюционных структур является порядок прилагательных. Мы говорим «прекрасная красная машина» (*beautiful red car*), но фраза «красная прекрасная машина» звучит неестественно. Это явление универсально для разных культур и языков.

Возможные объяснения этого феномена, предложенные в беседе:

* **Коммуникативная эффективность:** Порядок может быть обучен необходимостью быстрее передавать важную информацию или облегчать понимание для слушателя.
* **Устойчивость к шуму:** Гай Эмерсон упоминает исследования, согласно которым структура языка оптимизирована так, чтобы сообщение оставалось понятным даже при наличии помех (robustness to noise).
* **Типовая иерархия:** По предположению Валида Сабы, существует внутренняя онтологическая структура, где физические свойства всегда доминируют над абстрактными при описании объекта.

---

## 📏 Неопределенность и «проклятие размерности»
[[JUMP:41:46]]

**Неопределенность (vagueness)** в лингвистике — это отсутствие четких границ у слов (например, где проходит грань между красным и оранжевым цветом). 

Гай Эмерсон связывает это с высокой размерностью реального мира:

* В многомерном пространстве практически невозможно собрать достаточно данных, чтобы провести идеально точную границу концепта.
* Даже простое понятие «высокий» (tall) не является одномерным. Чтобы понять высоту здания или человека, нужно учитывать контекст, позу и другие параметры.
* Байесовский подход к неопределенности предполагает, что слушатель делает вероятностный вывод о значении слова, исходя из своих знаний о мире и распределения вероятностей для конкретного порога (например, что считать «высоким» в Голландии против Норвегии).

---

## 🏗️ Грамматическая инженерия: HPSG
[[JUMP:1:10:50]]

Гай Эмерсон является сторонником использования **HPSG (Head-driven Phrase Structure Grammar)** — объектно-ориентированного подхода к грамматике, который гораздо мощнее обычных контекстно-свободных грамматик (CFG).

Особенности HPSG:

* **Богатые структуры данных:** Каждый узел в дереве разбора — это не просто категория (существительное/глагол), а сложный объект с набором признаков и значений.
* **Обработка «длинного хвоста»:** Грамматики вроде *English Resource Grammar* способны обрабатывать редкие конструкции, такие как «It is incumbent upon you to speak plainly». В этом предложении требуются специфические связи между формальным подлежащим *it*, предлогом *upon* и инфинитивом.
* **Тьюринг-полнота:** Формализм HPSG теоретически позволяет вычислить любой алгоритмически разрешимый язык.

Эмерсон считает перспективным направлением не ручное написание правил, а индукцию (автоматический вывод) таких грамматик из данных, сочетая строгость структуры с гибкостью машинного обучения.

---

## ⚠️ Этика и прозрачность ИИ
[[JUMP:1:22:31]]

В завершение беседы участники затронули тему бурного роста популярности «экспертов по ИИ» в соцсетях. Гай Эмерсон выразил обеспокоенность тем, что многие пользователи библиотек вроде Hugging Face не понимают методологических ограничений своих моделей.

> «Предвзятость (bias) — это в первую очередь социальная проблема, и только во вторую — техническая», — цитирует Гай Эмерсон Кейт Кроуфорд.

Кит Даггар и Гай Эмерсон сошлись во мнении, что инженерам необходимо быть скромнее и признавать, что понимание влияния алгоритмов на общество требует привлечения специалистов извне — юристов, социологов и профессиональных аудиторов.