Алекс Ханна: «ИИ-хайп девальвирует человечность и скрывает реальный вред»

The TWIML AI Podcast 752 53 мин 5 мин 02.10.2023
Главное

Стремительное развитие больших языковых моделей и генеративного ИИ породило волну энтузиазма, которую многие эксперты считают избыточной и опасной. В этом выпуске подкаста TWIML AI ведущий Сэм Чаррингтон беседует с Алекс Ханной, директором по исследованиям Института распределенного ИИ (DARE), о том, как социологический подход помогает разоблачать мифы индустрии, защищать права эксплуатируемых работников и создавать технологии, которые действительно служат сообществам, а не только капиталу.

🚀 Становление DARE: от Google к независимому институту 0:00

Алекс Ханна пришла в сферу искусственного интеллекта необычным путем — через социологию. Во время работы над диссертацией она использовала методы машинного обучения для анализа новостных статей о протестах, изучая мотивацию и требования социальных движений . Получив опыт преподавания в Университете Торонто, она перешла в Google, где стала первым социологом в штате исследователей (Research Scientist) .

В Google Ханна работала в команде этического ИИ под руководством докторов Тимнит Гебру и Маргарет Митчелл. После скандального увольнения Гебру и последующих событий в компании, Алекс присоединилась к только что созданному институту DARE (Distributed AI Research Institute) в феврале 2022 года, став его третьим сотрудником .

Ключевые принципы работы DARE:

🌍 Технологии на службе сообществ: примеры проектов 6:20

Вместо создания универсальных моделей «для всего», DARE фокусируется на конкретных проблемах угнетенных групп.

Один из ключевых проектов — исследование «пространственного апартеида» в Южной Африке. Исследователь Раса Сафала (Raesetje Sefala) использует компьютерное зрение для анализа спутниковых снимков, чтобы доказать сохранение сегрегации . Хотя официально апартеид пал в середине 90-х, визуальный анализ показывает, что границы между богатыми «белыми» районами и неблагоустроенными «тауншипами» сохраняются. Эти данные помогают оценить разрыв в качестве госуслуг: времени прибытия скорой помощи, доступности школ и больниц .

Другие важные инициативы:

Ханна выделяет проект Te Hiku Media в Новой Зеландии как эталонный пример . Коренное сообщество маори само собирает данные у своих старейшин для обучения моделей перевода, сохраняя при этом цифровой суверенитет и не передавая данные Big Tech корпорациям .

⚖️ Политика внутри датасетов: критика научной методологии 21:15

В совместной работе «Есть ли у наборов данных политика?» (Do datasets have politics?) Алекс Ханна и соавторы проанализировали сотни наборов данных для компьютерного зрения за последние 20 лет . Исследование выявило системные перекосы в том, как ученые проектируют данные:

  1. Универсальность против специфичности. Разработчики стремятся охватить всё сразу, из-за чего люди «на полях» (marginalized communities) помечаются как «краевые случаи» (edge cases) и игнорируются .
  2. Скорость против тщательности. Исследователи предпочитают дешевую разметку через Amazon Mechanical Turk качественной экспертной работе .
  3. Мнимая беспристрастность. По мнению Ханны, «непредвзятых» данных не существует — любой набор данных отражает определенный взгляд на мир, и отказ признать это лишь маскирует проблему .
  4. Культ модели. В академической среде работа над архитектурой нейросети считается престижной, а кропотливый сбор данных — технической рутиной. Поэтому описанию данных в статьях часто уделяют лишь пару абзацев .

🫧 Анатомия ИИ-хайпа: от «разумности» к опасным галлюцинациям 27:04

Алекс Ханна утверждает, что нынешний цикл хайпа вокруг ИИ — явление не новое, но достигшее опасного накала со времен запуска ChatGPT . Она вспоминает историю Джозефа Вейценбаума, создателя чат-бота Элиза (Eliza) в 1960-х годах. Вейценбаум был потрясен тем, как легко люди верили в «разумность» простейшего алгоритма, и стал ярым критиком ИИ-оптимистов .

По мнению гостьи, современный хайп подпитывается лидерами индустрии:

Алекс подчеркивает, что за этим «шумом» скрываются реальные траты и риски. Согласно данным PitchBook, в индустрию инвестировано около 44 миллиардов долларов, а оценки компаний достигают триллионов .

⚠️ Смертельно опасные сценарии применения 32:56

Ханна приводит примеры того, как безответственное внедрение чат-ботов наносит прямой физический вред:

Алекс Ханна настаивает на том, что нельзя называть LLM (большие языковые модели) технологией общего назначения (General Purpose Technology). По её мнению, этот термин — маркетинговый ход OpenAI, заставляющий людей верить, что сырой инструмент из коробки можно использовать в любой критической сфере без глубокой доработки и надзора .

🏠 Сопротивление воображения: технологии будущего 46:50

Завершая беседу, Ханна отвергает обвинения в пессимизме. «Я люблю компьютеры с четырех лет и у меня есть степень в CS», — признается она . Проблема не в самой технологии, а в её политической экономии — в том, кто получает прибыль и власть.

Участники дискуссии сошлись во мнении, что:

Противодействие хайпу, по словам Ханны, — это борьба за то, чтобы технология служила людям, а не загоняла их в рамки алгоритмической эксплуатации.

💬 Цитаты

«Наш фокус в том, чтобы превращать мыслителей в бойцов, а бойцов в мыслителей.»

Алекс Ханна 13:17

«Данные не являются нейтральными — они всегда несут в себе политику и определенный взгляд на мир.»

Алекс Ханна 25:31

«Если чат-бот на Amazon скажет, что ядовитый гриб можно есть, и кто-то умрет — это будет смерть на совести разработчиков.»

Алекс Ханна 35:17
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Стохастический попугай
Теория о том, что большие языковые модели лишь статистически предсказывают следующее слово, не понимая смысла текста.
Эпистемология
Раздел философии, изучающий природу знаний и способы их получения.
Пространственный апартеид
Сохранение физической и социальной сегрегации определенных групп населения в городской среде.
📊 Цифры
🗓 Хронология
  1. 1976 Джозеф Вейценбаум публикует критическую книгу об ИИ.
  2. декабрь 2021 Тимнит Гебру объявляет о создании института DARE.
  3. февраль 2022 Алекс Ханна официально присоединяется к DARE в качестве директора по исследованиям.
  4. ноябрь 2022 Запуск ChatGPT, спровоцировавший новый виток глобального ИИ-хайпа.
⚖️ Другая сторона
Искусственный интеллект Distributed AI Research Institute Alex Hanna OpenAI Google Research GPT-4