Стремительное развитие больших языковых моделей и генеративного ИИ породило волну энтузиазма, которую многие эксперты считают избыточной и опасной. В этом выпуске подкаста TWIML AI ведущий Сэм Чаррингтон беседует с Алекс Ханной, директором по исследованиям Института распределенного ИИ (DARE), о том, как социологический подход помогает разоблачать мифы индустрии, защищать права эксплуатируемых работников и создавать технологии, которые действительно служат сообществам, а не только капиталу.
🚀 Становление DARE: от Google к независимому институту 0:00
Алекс Ханна пришла в сферу искусственного интеллекта необычным путем — через социологию. Во время работы над диссертацией она использовала методы машинного обучения для анализа новостных статей о протестах, изучая мотивацию и требования социальных движений . Получив опыт преподавания в Университете Торонто, она перешла в Google, где стала первым социологом в штате исследователей (Research Scientist) .
В Google Ханна работала в команде этического ИИ под руководством докторов Тимнит Гебру и Маргарет Митчелл. После скандального увольнения Гебру и последующих событий в компании, Алекс присоединилась к только что созданному институту DARE (Distributed AI Research Institute) в феврале 2022 года, став его третьим сотрудником .
Ключевые принципы работы DARE:
- ИИ не является неизбежным. Технология должна рассматриваться как инструмент, полезный лишь в определенных, зачастую узких контекстах .
- Децентрализация знаний. Институт признает «живой опыт» (lived experience) такой же формой экспертизы, как и ученую степень PhD .
- Трансформация ролей. Ханна цитирует генерала Гордона Бейкера: «Наша цель — превращать мыслителей в бойцов, а бойцов в мыслителей». В контексте DARE это означает превращение исследователей в защитников прав (advocates) и наоборот .
🌍 Технологии на службе сообществ: примеры проектов 6:20
Вместо создания универсальных моделей «для всего», DARE фокусируется на конкретных проблемах угнетенных групп.
Один из ключевых проектов — исследование «пространственного апартеида» в Южной Африке. Исследователь Раса Сафала (Raesetje Sefala) использует компьютерное зрение для анализа спутниковых снимков, чтобы доказать сохранение сегрегации . Хотя официально апартеид пал в середине 90-х, визуальный анализ показывает, что границы между богатыми «белыми» районами и неблагоустроенными «тауншипами» сохраняются. Эти данные помогают оценить разрыв в качестве госуслуг: времени прибытия скорой помощи, доступности школ и больниц .
Другие важные инициативы:
- Языковые технологии для Африканского Рога. Асмелаш Абате работает над созданием систем распознавания речи и перевода для языков тигринья и амхарский, которыми пренебрегают крупные корпорации (Google и Meta) .
- Защита прав складских рабочих. Эдриан Уильямс изучает «кражу заработной платы» через системы наблюдения за водителями Amazon .
- Права «разметчиков». Кристал Кауфман (организация Turkopticon) занимается защитой прав людей, которые вручную маркируют данные для обучения ИИ за мизерную плату .
Ханна выделяет проект Te Hiku Media в Новой Зеландии как эталонный пример . Коренное сообщество маори само собирает данные у своих старейшин для обучения моделей перевода, сохраняя при этом цифровой суверенитет и не передавая данные Big Tech корпорациям .
⚖️ Политика внутри датасетов: критика научной методологии 21:15
В совместной работе «Есть ли у наборов данных политика?» (Do datasets have politics?) Алекс Ханна и соавторы проанализировали сотни наборов данных для компьютерного зрения за последние 20 лет . Исследование выявило системные перекосы в том, как ученые проектируют данные:
- Универсальность против специфичности. Разработчики стремятся охватить всё сразу, из-за чего люди «на полях» (marginalized communities) помечаются как «краевые случаи» (edge cases) и игнорируются .
- Скорость против тщательности. Исследователи предпочитают дешевую разметку через Amazon Mechanical Turk качественной экспертной работе .
- Мнимая беспристрастность. По мнению Ханны, «непредвзятых» данных не существует — любой набор данных отражает определенный взгляд на мир, и отказ признать это лишь маскирует проблему .
- Культ модели. В академической среде работа над архитектурой нейросети считается престижной, а кропотливый сбор данных — технической рутиной. Поэтому описанию данных в статьях часто уделяют лишь пару абзацев .
🫧 Анатомия ИИ-хайпа: от «разумности» к опасным галлюцинациям 27:04
Алекс Ханна утверждает, что нынешний цикл хайпа вокруг ИИ — явление не новое, но достигшее опасного накала со времен запуска ChatGPT . Она вспоминает историю Джозефа Вейценбаума, создателя чат-бота Элиза (Eliza) в 1960-х годах. Вейценбаум был потрясен тем, как легко люди верили в «разумность» простейшего алгоритма, и стал ярым критиком ИИ-оптимистов .
По мнению гостьи, современный хайп подпитывается лидерами индустрии:
- Блейк Лемойн (бывший инженер Google) утверждал, что модель LaMDA обладает сознанием .
- Илья Суцкевер (OpenAI) писал в соцсетях, что нейросети «могут быть слегка сознательными» .
- Сэм Альтман (OpenAI) использует риторику «стохастических попугаев» в ироничном ключе, чтобы размыть критику .
Алекс подчеркивает, что за этим «шумом» скрываются реальные траты и риски. Согласно данным PitchBook, в индустрию инвестировано около 44 миллиардов долларов, а оценки компаний достигают триллионов .
⚠️ Смертельно опасные сценарии применения 32:56
Ханна приводит примеры того, как безответственное внедрение чат-ботов наносит прямой физический вред:
- Диетология и расстройства. Национальная ассоциация по расстройствам пищевого поведения (NEDA) уволила сотрудников горячей линии, заменив их чат-ботом Tessa. Бот начал давать советы по снижению веса людям, страдающим анорексией, что прямо противопоказано в таких кризисных ситуациях .
- Грибы-убийцы. На Amazon наводнили книги по идентификации грибов для любителей, сгенерированные ИИ. По словам Ханны со ссылкой на 404 Media, если такая книга ошибочно назовет ядовитый гриб съедобным, это приведет к реальным смертям .
- Медицинская диагностика. Компании вроде Google (Med-PaLM 2) хвастаются успешной сдачей медицинских экзаменов, но Ханна считает это подменой понятий. Экзамен — это лишь входной билет в профессию, он не заменяет годы клинической практики и ответственности перед пациентом .
Алекс Ханна настаивает на том, что нельзя называть LLM (большие языковые модели) технологией общего назначения (General Purpose Technology). По её мнению, этот термин — маркетинговый ход OpenAI, заставляющий людей верить, что сырой инструмент из коробки можно использовать в любой критической сфере без глубокой доработки и надзора .
🏠 Сопротивление воображения: технологии будущего 46:50
Завершая беседу, Ханна отвергает обвинения в пессимизме. «Я люблю компьютеры с четырех лет и у меня есть степень в CS», — признается она . Проблема не в самой технологии, а в её политической экономии — в том, кто получает прибыль и власть.
Участники дискуссии сошлись во мнении, что:
- Внедрение ИИ не должно автоматически означать отказ от «традиционных способов» связи между людьми.
- Регулирование должно основываться на защите интересов сообществ, а не только на управлении корпоративными рисками (как в случае с фреймворком NIST) .
- Технологии перевода, хотя и создавались в эпоху Холодной войны для шпионажа, могут быть переосмыслены как инструмент доступа к знаниям для «наших бабушек», не владеющих английским языком [10:35, 48:37].
Противодействие хайпу, по словам Ханны, — это борьба за то, чтобы технология служила людям, а не загоняла их в рамки алгоритмической эксплуатации.