Янник Кильхер: «Почему алгоритмы не могут распознать преступника по лицу»

Yannic Kilcher 6,4 тыс. 32 мин 2 мин 14.05.2020
Главное

🔍 Анализ научного исследования об автоматическом выявлении преступников по фото 0:00

В своём видеообзоре автор YouTube-канала Янник Кильхер разбирает скандальную научную работу, посвящённую попыткам алгоритмического выявления криминальных наклонностей человека по его фотографии. Исследование, которое вызвало волну критики в академической среде, утверждает, что с помощью глубокого обучения можно классифицировать людей на «преступников» и «законопослушных граждан» с высокой точностью. Кильхер детально анализирует методологию авторов статьи, указывая на фундаментальные ошибки в сборе данных и интерпретации результатов.

🧪 Методология и спорные утверждения 1:23

Авторы исследования обучали свёрточные нейронные сети (CNN) и другие модели на выборке из 1856 фотографий китайских мужчин в возрасте от 18 до 55 лет. Они утверждали, что для обучения использовались стандартные ID-фотографии, а не полицейские снимки («магшоты»), что должно было исключить влияние специфического освещения или условий съёмки.

Янник Кильхер отмечает, что авторы даже попытались выявить «физиогномические особенности» преступников, такие как меньшее расстояние между глазами, специфический угол наклона рта и повышенная кривизна верхней губы. Ведущий иронизирует, что, согласно этим выводам, достаточно просто нахмуриться, чтобы алгоритм классифицировал вас как преступника.

📉 Проблемы с данными и «эффект улыбки» 12:00

Центральный аргумент критики Кильхера заключается в том, что алгоритм обучился не распознавать «криминальные черты», а различать способы формирования наборов данных.

  1. Разные источники: Фотографии «преступников» были получены из полицейских архивов и ведомств общественной безопасности, где принято фотографироваться с серьёзным выражением лица.
  2. Сбор «непреступников»: Фотографии законопослушных людей собирались из интернета (веб-скрейпинг) с сайтов различных компаний, где люди зачастую улыбаются или выглядят более расслабленно.
  3. Результат: Нейросеть фактически научилась отличать официальные ID-снимки от корпоративных фотографий или селфи, а не идентифицировать личность преступника.

🧠 Критика валидации 17:04

Кильхер отдельно останавливается на методах, которыми авторы пытались доказать отсутствие ошибок в своей работе. Они проводили тесты с «рандомизированными метками» (случайным образом назначая статус преступника или не-преступника), чтобы показать, что модель не просто подстраивается под шум.

💡 Заключение и выводы 31:51

Янник Кильхер называет результаты исследования «абсолютным мусором» и призывает научное сообщество более критически подходить к вопросам сбора данных и «бритве Оккама». Основной урок видео заключается в том, что при получении подозрительно точных результатов в задачах классификации всегда нужно искать более простое объяснение, связанное с артефактами данных, а не со сложными «внутренними свойствами» объектов исследования.

💬 Цитаты

«Если вы решили, что эти четверо преступники, то вы правы, а остальные трое — законопослушные граждане.»

Янник Кильхер 00:14

«Эта часть исследования — абсолютный мусор.»

Янник Кильхер 31:51
👥 Спикер
📖 Термины
CNN
Свёрточная нейронная сеть, глубокая модель, часто используемая для распознавания изображений.
Магшот (mugshot)
Фотография арестованного, сделанная полицией после задержания.
Физиогномика
Псевдонаучный метод определения характера и склонностей человека по чертам лица.
Бритва Оккама
Принцип, согласно которому при прочих равных условиях следует выбирать самое простое объяснение.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Yannic Kilcher computer vision deep learning physiognomy