Эмили Бендер и Маргарет Митчелл об опасностях гигантских языковых моделей

The TWIML AI Podcast with Sam Charrington 1,5 тыс. 58 мин 4 мин 25.03.2021
Главное

В эпоху стремительного развития искусственного интеллекта размер моделей стал считаться главным мерилом их успеха. Однако авторы резонансной научной работы об «опасностях стохастических попугаев» призывают к осторожности. Профессор лингвистики Эмили Бендер (Emily Bender) и исследователь ИИ Маргарет Митчелл (Margaret Mitchell) обсуждают, почему стремление к бесконечному масштабированию языковых моделей (Language Models) несёт в себе скрытые экологические риски, усиливает социальное неравенство и создает иллюзию разума там, где его нет.

🦜 От статистических таблиц к «стохастическим попугаям» 7:11

История языкового моделирования началась задолго до появления современных нейросетей. Эмили Бендер напоминает, что основы технологии заложил ещё Клод Шеннон, работая над распределением вероятностей слов в тексте.

Эволюция моделей прошла несколько ключевых этапов:

Эмили Бендер и её соавторы ввели термин «стохастические попугаи» для описания современных гигантских моделей. По её мнению, эти системы способны выдавать впечатляющие результаты в тестах на понимание текста, не обладая при этом никаким реальным пониманием. Они просто сшивают фрагменты данных на основе вероятностей, полученных при обучении на колоссальных массивах информации.

🌍 Экологический след и «экологический расизм» 14:32

Одной из главных претензий к бесконечному росту моделей является их энергопотребление. Ссылаясь на исследование Страбелл (2019), гости подкаста указывают, что обучение одной крупной модели (например, BERT) сопоставимо по выбросам углекислого газа с трансконтинентальным перелётом.

Основные тезисы спикеров об экологии ИИ:

⚖️ Предвзятость: дело не только в данных 23:02

Распространённое мнение о том, что ИИ «просто отражает данные интернета», Маргарет Митчелл и Эмили Бендер считают упрощением и попыткой снять с себя ответственность.

Маргарет Митчелл отмечает, что ценностные суждения закладываются уже на этапе выбора архитектуры и функций потерь (loss functions). Например, использование стандартных математических измерений ошибок (L1 или L2 loss) подразумевает, что все типы ошибок равнозначны, что само по себе является оценочным суждением разработчика.

Примеры скрытых искажений (bias), обсуждаемые в интервью:

🧠 Иллюзия разума и «фантомный интеллект» 37:31

Человеческий мозг эволюционно предрасположен к антропоморфизму — наделению неодушевленных предметов человеческими качествами. Маргарет Митчелл приводит в пример классическую иллюзию Хайдера-Зиммеля: когда людям показывают видео с движущимися треугольником и кругом, они мгновенно выстраивают нарратив о «злом» треугольнике и «преследуемом» круге.

Аналогичный эффект возникает при взаимодействии с ИИ:

🛠 Путь к исправлению: документация и «пре-мортем» 46:07

Эмили Бендер и Маргарет Митчелл предлагают конкретные практики для ответственной разработки ИИ. Ключевая идея — модель не должна быть больше, чем разработчики способны задокументировать.

Рекомендуемые подходы:

  1. Борьба с «долгом документации» (Documentation debt): Если набор данных настолько велик, что его невозможно изучить и описать, риск непредсказуемого вреда становится запредельным.
  2. Дата-карты и модели-карты (Model Cards / Data Statements): Протоколы прозрачности, описывающие, на чём обучалась система и каковы её ограничения.
  3. Метод «Пре-мортем» (Pre-mortem): Команда должна представить, что проект закончился катастрофой или громким скандалом в прессе, и проследить цепочку событий, которая к этому привела, чтобы предотвратить её в реальности.
  4. Нормативный подход к данным: Вместо того чтобы «брать всё из интернета», исследователи призывают сначала определять требования к данным, а затем собирать их под конкретные задачи.

В завершение беседы Эмили Бендер призвала научное сообщество и индустрию перераспределить ценности: вместо погони за масштабом и универсальностью стоит сфокусироваться на создании решений, которые работают эффективно и безопасно в конкретном контексте.

💬 Цитаты

«Слишком большой — это когда он слишком велик для документации.»

Эмили Бендер 47:33

«Мы эволюционировали так, чтобы видеть эту иллюзию и воспринимать её по-человечески.»

Маргарет Митчелл 39:04

«Я хочу выступить за контекст, специфичность и работу в меньших масштабах.»

Эмили Бендер 55:42
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Стохастический попугай
Метафора для языковой модели, которая объединяет слова на основе вероятностей без понимания смысла.
Модель-карта (Model Card)
Документ, содержащий ключевые характеристики и ограничения модели ИИ для обеспечения прозрачности.
Антропоморфизм
Склонность человека наделять неодушевленные предметы или программы человеческими качествами и разумом.
Пре-мортем (Pre-mortem)
Метод анализа рисков, при котором команда заранее представляет провал проекта для поиска его причин.
📊 Цифры
🗓 Хронология
  1. 2016 Начало активного использования векторных представлений слов (Word Embeddings) в NLP.
  2. 2018 Эмили Бендер отмечает, что большинство заявок на конференцию Coling использовали нейросетевые эмбеддинги.
  3. Сентябрь 2020 Начало работы над статьёй о «стохастических попугаях».
  4. Октябрь 2020 Подача статьи на конференцию FAcCT.
⚖️ Другая сторона
Искусственный интеллект Language Models Эмили Бендер Маргарет Митчелл Stochastic Parrots GPT-3