Профессор Хэл Доме о предвзятости ИИ: «Мы не можем строить технологии в отрыве от общества»

Технологии обработки естественного языка (NLP) перестали быть чисто математической задачей. Сегодня они неразрывно связаны с вопросами социальной справедливости, идентичности и власти. Хэл Доме, выдающийся исследователь из Университета Мэриленда и Microsoft Research, рассуждает о том, почему разработчикам ИИ необходимо выйти за рамки матричных вычислений и начать изучать труды социолингвистов и антропологов.

🎓 Путь от чистой математики к социальной лингвистике 0:00

Хэл Доме начал свою карьеру как математик в Университете Карнеги — Меллона. Долгое время он рассматривал NLP исключительно через призму алгоритмов и машинного обучения . Однако в последние годы его фокус сместился на вопросы этики, предвзятости и того, как язык конструирует человеческую идентичность .

По мнению Доме, язык выполняет в обществе две ключевые функции:

Инструментальная: способ общения с миром и управления устройствами (например, через умных ассистентов) .
Конститутивная: способ создания социальной идентичности .

Доме вспоминает случай из своей жизни, когда на научной конференции коллега узнал в его речи диалект Лос-Анджелеса . Этот пример иллюстрирует концепцию «doing language» (делание языка): то, как мы говорим, является такой же важной частью сообщения, как и сам контент . Именно здесь кроется главная сложность для систем ИИ: попытки алгоритмически «исправить» предвзятость могут случайно лишить пользователей возможности выражать свою идентичность .

⚖️ Проблема «стерильных» данных и социальных стереотипов 12:31

Одной из самых горячо обсуждаемых тем в сообществе ИИ является предвзятость алгоритмов. Доме подчеркивает, что проблема гораздо глубже, чем просто наличие «плохих слов» в обучающей выборке. Язык пропитан «социальным багажом», который системы ИИ неизбежно впитывают .

Гость приводит примеры скрытых опасностей:

Стирание голосов: Системы, плохо обученные на афроамериканском английском (AAE) или диалекте чикано, могут просто не распознавать такие сообщения как английскую речь, лишая людей представительства в цифровом пространстве .
Гетеронормативность: Автоисправление может автоматически заменять нейтральные или специфические фразы (например, некорректно исправляя опечатки в сторону мужского рода), основываясь на доминирующих в данных паттернах .
Иерархии в автоответах: Если на фразу «Вчера я был у врача» система генерирует вопрос «И что он сказал?», она закрепляет гендерный стереотип о том, что врач — это обязательно мужчина .

Доме утверждает, что просто «добавить больше данных» — не панацея. Он критикует современный подход, в котором эксперты предметных областей выступают лишь как «разметчики», поставляющие данные в «черный ящик» машинного обучения . По его словам, это крайне редуктивный (упрощенный) взгляд .

📖 Исследование: «Технология языка — это власть» 25:39

Обсуждая свою недавнюю работу (совместно с Сулейн Блоджетт, Слоаном Брокусом и Ханной Уоллак), Доме отмечает системные проблемы в академических статьях о предвзятости в NLP . Проанализировав 150 работ, исследователи обнаружили, что авторы часто используют расплывчатые формулировки типа «стереотипы — это плохо», не объясняя их нормативную основу .

Ключевые выводы исследования:

Определение «вредности» — это всегда вопрос ценностей, а не только математики .
Существует огромный разрыв между гипотетическим вредом (например, «предвзятость в эмбеддингах может повлиять на отбор резюме») и реальными измерениями этого вреда в работающих системах .
Исследователям необходимо четко обозначать свою философскую позицию (например, «ролзианский взгляд на справедливость»), чтобы сообщество могло вести осмысленный диалог .

🛠 Практические инструменты и «Виджиланте справедливости» 40:36

Переходя от теории к практике, Доме описывает, как крупные корпорации пытаются бороться с предвзятостью. Он упоминает термин fairness vigilantes («виджиланте справедливости») — это энтузиасты внутри команд разработчиков, которые часто на голом альтруизме и в нерабочее время пытаются исправлять этические огрехи систем .

Для системного решения проблемы Доме предлагает три уровня изменений:

Культурный: внесение критериев справедливости в систему оценки сотрудников и продвижения по службе .
Процессный: создание чек-листов и механизмов обмена опытом между разными командами (например, между разработчиками распознавания речи и машинного перевода) .
Технологический: использование инструментариев от Microsoft, Google и IBM для проверки моделей на равенство показателей (parity metrics) .

Особое внимание Доме уделяет проблеме «слепых зон» (blind spots). Часто системы выпускаются в свет, и только через 24 часа из статьи в New York Times разработчики узнают, что их алгоритм ведет себя некорректно в непредвиденной ситуации .

🏳️‍🌈 Гендерная инклюзивность и новые вызовы 52:32

Одним из самых актуальных направлений работы Доме является разрешение кореференции (определение того, к кому относится местоимение) в контексте гендерной инклюзивности . Большинство систем обучалось на архивах газет типа Wall Street Journal, где долгое время не использовалось местоимение they в единственном числе для небинарных персон .

В результате современных тестов выяснилось:

Стандартные системы в классических задачах показывают точность (F-score) в районе 60% .
На данных с использованием нео-местоимений (ze, hir) или небинарного they точность падает до 30% .
Ошибки распределены крайне неравномерно и чаще всего бьют именно по гендерно-флюидным и небинарным людям .

Доме призывает сообщество ИИ прекратить попытки «изобрести синтаксис» или «изобрести гендер» в вакууме. Вместо этого нужно обращаться к десятилетиям наработок в области гендерных исследований и квир-теории, так же как ранее разработчики использовали труды лингвистов для создания синтаксических парсеров .