Ян Лекун против Twitter: почему «белый Обама» вызвал скандал в мире ИИ

В июне 2020 года в сообществе исследователей искусственного интеллекта разгорелся масштабный спор, вызванный публикацией алгоритма Pulse. Поводом для конфликта стала некорректная работа нейросети с изображением Барака Обамы, переросшая в глубокую дискуссию о природе предвзятости (bias) в машинном обучении и ответственности учёных.

🖼️ Алгоритм Pulse и «белый Обама» 0:00

Технология Pulse, представленная на конференции CVPR, предназначена для апсемплинга — создания реалистичного изображения высокого разрешения из сильно пикселизированного исходника . Алгоритм работает на основе генеративно-состязательных сетей (GAN) и принципа «циклической согласованности»: результат должен быть таким, чтобы при обратном сжатии он в точности соответствовал исходному пикселизированному кадру .

Проблемы начались, когда пользователи стали тестировать систему на лицах известных людей. В частности, при обработке сильно размытого фото Барака Обамы нейросеть выдала изображение мужчины с типично европейскими чертами лица .

По мнению Янника Килхера, этот результат был ожидаемым:

Система обучалась на датасете Flickr-Faces-HQ (FFHQ).
Данный набор данных состоит преимущественно из лиц европеоидной расы.
При выходе за пределы модальности обучающей выборки нейросеть начинает выдавать некорректные или «усреднённые» по её мнению результаты .

🧠 Позиция Яна Лекуна: «Виноваты данные» 1:38

Один из пионеров глубокого обучения Ян Лекун прокомментировал ситуацию в Twitter, заявив, что предвзятость систем машинного обучения напрямую проистекает из предвзятости данных . По его мнению, если бы ту же систему обучили на датасете из Сенегала, результат апсемплинга всегда имел бы африканские черты лица .

Янник Килхер в своём анализе разделяет два типа предвзятости:

Статистическая предвзятость — строгое математическое определение. Она возникает, когда результат модели не отражает распределение входных данных из-за архитектуры модели, функции потерь или процесса оптимизации (например, при регуляризации для снижения дисперсии) .
Социальная предвзятость — когда системы, например, распознавания лиц, работают хуже для определённых этнических групп .

Килхер утверждает, что социальная предвзятость может содержаться только в датасете . По его словам, другие части конвейера (модель или оптимизация) могут лишь усиливать или смягчать её, но сами по себе они «социально нейтральны» . С этой точки зрения Ян Лекун прав: для решения конкретной проблемы с Pulse достаточно заменить или сбалансировать обучающую выборку .

⚖️ Исследователи против инженеров 5:25

В ходе дискуссии возник вопрос ответственности. Ян Лекун возразил оппонентам, указав на разницу между наукой и производством. По мнению Лекуна, ответственность за предвзятость лежит в первую очередь на инженерах, внедряющих продукты, а не на исследователях, описывающих методы в академических работах .

С этим тезисом не согласились многие участники дискуссии. По словам Ашиша Васвани (Ashish Vaswani), современные исследователи часто невольно «питают» продукты не-технологических компаний, которые бездумно используют предобученные модели типа BERT или ResNet из интернета, игнорируя контекст их создания . Таким образом, академическая работа может иметь прямые негативные последствия в реальном мире.

🌩️ Реакция сообщества и этика ИИ 7:37

Заявление Лекуна вызвало резкую критику со стороны экспертов по этике ИИ. Тимнит Гебру (Timnit Gebru) призвала учёного не сводить все проблемы только к датасетам и «послушать представителей маргинализированных сообществ» . Она утверждает, что вред от ИИ — гораздо более сложное явление, которое нельзя решить простой заменой данных.

Николя Ле Ру (Nicolas Le Roux), входивший ранее в диссертационный совет Лекуна, также выразил несогласие, назвав «постоянное пренебрежение вредом, наносимым сообществом ML», глубоко проблематичным . По мнению Ле Ру:

Причины предвзятости многочисленны.
Фокус исключительно на данных отвлекает внимание от системных проблем в области ИИ .

Ян Лекун в ответ подчеркнул, что он не отрицает существования других проблем, но настаивает на эффективности технического решения. По его словам, выравнивание частоты категорий в выборке — гораздо более действенный метод, чем «хакинг» функций потерь (Loss function) .

🕵️ Технология слежки или инструмент спасения? 12:00

Мередит Уиттакер (Meredith Whittaker) высказала ещё более радикальную точку зрения, назвав технологию Pulse «расистской» по своей сути . С её точки зрения, подобные системы предназначены для того, чтобы власть могла контролировать и выслеживать людей, и никакие «разнообразные датасеты» этого не изменят .

Янник Килхер возражает против такой категоричности. Он приводит контраргументы:

Pulse не восстанавливает реальное лицо человека по пикселям, а лишь генерирует «наиболее вероятное» лицо на основе статистики. Поэтому технология малопригодна для опознания преступников полицией .
Подобные системы могут использоваться в мирных целях, например, для поиска пропавших детей по некачественным записям с камер видеонаблюдения .

📉 Риски для научной среды 13:06

Подводя итог, Килхер призывает прекратить «охоту на ведьм» в отношении Яна Лекуна . Он считает, что агрессивная критика за отсутствие упоминания всех возможных социальных проблем в каждом техническом твите вредит науке.

По мнению Килхера, это приведет к негативным последствиям для отрасли:

Маленькие лаборатории, не имеющие ресурсов для создания идеально сбалансированных датасетов, побоятся публиковать код или исследования из-за страха критики .
Это даст преимущество только гигантским корпорациям с огромными бюджетами .

Ведущий подчеркнул, что важно иметь возможность обсуждать конкретные технические решения проблем, не превращая каждую дискуссию в дебаты об идеологической ортодоксии .