Марти Хёрст о будущем поиска и ИИ: почему имитация языка не делает машину разумной

The TWIML AI Podcast 2,1 тыс. 42 мин 5 мин 24.04.2023
Главное

Марти Хёрст, профессор Калифорнийского университета в Беркли с тридцатилетним стажем в области обработки естественного языка, в подкасте The TWIML AI Podcast анализирует текущий бум больших языковых моделей (LLM). Она сопоставляет современные прорывы с десятилетиями «медленного продвижения» в поиске и интерфейсах, приходя к выводу, что мы переживаем фундаментальную смену парадигмы в человеко-компьютерном взаимодействии. Главный вопрос дискуссии — являются ли LLM реальным разумом или лишь совершенным инструментом имитации, требующим жесткого контроля со стороны эксперта-человека.

🌊 Смена парадигмы: от поиска документов к генерации ответов 4:45

Марти Хёрст начала свою карьеру в конце 80-х, когда технологии NLP (обработки естественного языка) находились на стадии «медленной и тяжелой работы». В то время попытки заставить машины понимать язык были скорее научным поиском, чем бизнесом. Она вспоминает, как в 90-е годы покупка компанией Oracle стартапа в области NLP преподносилась как революция, что на тот момент выглядело нелепо. Подобный скептицизм Хёрст сохраняла и в отношении IBM Watson: несмотря на успех в викторине Jeopardy, заявления о немедленной трансформации здравоохранения этим инструментом не имели под собой реального технологического пути.

Профессор Хёрст была одним из пионеров в области пользовательских интерфейсов поиска (Search UI). Она внедрила концепцию «фасетного взаимодействия» (faceted interaction), которая сегодня является стандартом для интернет-магазинов и библиотечных каталогов, позволяя пользователям фильтровать и «нарезать» данные по разным параметрам. До этого поиск в библиотеках требовал ввода сложных командных строк, а результаты выдавались просто в хронологическом порядке.

По мнению Хёрст, долгое время целью поиска было нахождение конкретного документа или ресурса. Однако сегодня происходит сдвиг в намерениях пользователей: людям нужен не список ссылок, а прямой ответ на вопрос. Она считает, что это желание существовало всегда, но технологии не позволяли его реализовать.

🧩 Эволюция интерфейсов: почему «Ask Jeeves» опередил свое время 7:35

Хёрст проводит аналогию между поиском и развитием сенсорных экранов. Люди полюбили тачскрины не потому, что их вкусы изменились, а потому, что технологии наконец смогли поддержать естественные жесты, о которых мечтали десятилетиями. То же самое происходит с ответами на вопросы: LLM стали тем технологическим мостом, который позволил реализовать старую потребность в диалоговом интерфейсе.

Для большинства пользователей возможность общаться с машиной как с человеком — это «морское изменение» (sea change) в технологиях. Хёрст признает, что за 25–30 лет работы в NLP она никогда раньше не называла текущие изменения «трансформационными», но сейчас делает это.

⚡️ Прорыв LLM: прощание с ручным проектированием признаков 9:49

Главное технологическое отличие нынешнего момента, по мнению профессора, заключается в переходе от сложных цепочек специализированных алгоритмов к единой, относительно простой архитектуре. Раньше для каждой задачи NLP — токенизации, выделения сущностей, анализа тональности — требовался отдельный пайплайн, который часто работал нестабильно.

Теперь одна модель выполняет все эти задачи как «побочный эффект» предсказания следующего слова. Хёрст приводит пример с обработкой сравнительных оборотов в текстах. Раньше было крайне сложно написать алгоритм, который понимал бы нюансы сравнения камер в обзорах (например, «у этой модели шире угол, но пиксели менее четкие»). ChatGPT справляется с этим блестяще, хотя он не проектировался специально для анализа потребительских отзывов.

Ведущий Джон отмечает, что LLM фактически «съедают» мир ручного проектирования признаков (feature engineering), заменяя его способностями, которые выглядят как когнитивные.

🖼️ Интерактивные доски ИИ и визуализация данных 12:00

Будущее взаимодействия с ИИ Хёрст видит в концепции «AI whiteboards» (интерактивных ИИ-досок). В рабочей среде люди используют маркерные доски для объяснения сложных идей, сочетая язык и графику. Профессор считает, что мы движемся к мультимодальным моделям, которые смогут выступать полноценными соавторами в мышлении.

Однако Хёрст скептически относится к текущему уровню креативности моделей. Когда она попросила ChatGPT составить план лекции, результат был логичным, но лишенным инноваций и видения будущего.

В контексте визуализации данных Хёрст выделяет несколько ключевых идей:

🧠 Дискуссия о сознании: тест на антропоморфизм 24:20

Несмотря на впечатляющие возможности моделей, Марти Хёрст категорически не согласна называть их способности «когнитивными». Она предпочитает термин «поведение» или «возможности».

Её основные аргументы:

  1. Проблема масштаба: Человеческий мозг устроен иначе, и в нем происходят процессы, которые не сводятся к простому предсказанию последовательностей.
  2. Эффект антропоморфизма: Люди склонны наделять человеческими чертами любую технологию — даже старые автомобили. Поскольку язык — это сугубо человеческая черта, имитация речи заставляет нас верить в наличие разума у машины.
  3. Скептицизм к «единорогам»: Знаменитый пример из ранних дней GPT-3, где модель написала связную историю о единорогах, не впечатлил Хёрст. Она считает такие примеры «тщательно отобранными» (cherry-picked). По её мнению, генерация сказки — легкая задача, так как её трудно объективно оценить, в отличие от извлечения фактов или суммаризации научных статей.

Профессор признает, что её собственные прогнозы относительно этой технологии были ошибочными — она не ожидала, что простое увеличение параметров и данных приведет к таким результатам. Тем не менее, она упоминает мысленный эксперимент Джона Сёрла «Китайская комната», подчеркивая, что имитация понимания не равна самому пониманию.

🛡️ Будущее исследований: безопасность и человек в центре системы 34:31

В завершение беседы Хёрст подчеркивает важность пересечения ИИ и HCI (человеко-компьютерного взаимодействия). Она обеспокоена тем, что создатели ИИ — часто математики и физики — стремятся «вывести человека из уравнения», чтобы сделать систему чище и проще.

Основные вызовы будущего по версии Хёрст:

Совет Хёрст будущим исследователям: не гнаться за модой, а искать задачи, где человек и машина дополняют друг друга. Сама она продолжает изучать, как текст на графиках влияет на восприятие информации: недавнее исследование её команды показало, что при прогнозировании результатов выборов люди больше доверяют визуальным данным, чем пояснительному тексту.

-

💬 Цитаты

«Я занимаюсь NLP более 25 лет и никогда раньше не говорила, что это серьезное изменение. Теперь я говорю это.»

Марти Хёрст 09:36

«Люди антропоморфизируют технологии. Они дают имена своим машинам, даже если в них нет ни одного электронного компонента.»

Марти Хёрст 25:49

«Интерфейс, который мы видим сейчас — это интерфейс, который люди хотели всегда, просто у нас не было технологий для его поддержки.»

Марти Хёрст 08:30
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Фасетное взаимодействие
Интерфейс поиска, позволяющий фильтровать результаты по нескольким независимым категориям одновременно.
Китайская комната
Мысленный эксперимент, доказывающий, что имитация разумного поведения не означает наличия понимания или сознания.
SVD/LSA
Математические методы статистической обработки текста, использовавшиеся в поиске до эпохи глубокого обучения.
HCI
Дисциплина, изучающая способы взаимодействия людей с вычислительными системами.
📊 Цифры
🗓 Хронология
  1. Конец 1980-х Марти Хёрст начинает карьеру в NLP.
  2. Начало 1990-х Oracle покупает компанию в области NLP, что тогда считалось необоснованным хайпом.
  3. Октябрь 2022 Хёрст выступает с ключевым докладом о трансформации визуализации данных текстом за месяц до выхода ChatGPT.
  4. Ноябрь 2022 Релиз ChatGPT, подтвердивший прогнозы Хёрст о смене парадигмы.
⚖️ Другая сторона
Искусственный интеллект Марти Хёрст Large Language Models Human-Computer Interaction UC Berkeley Search UI