Янник Кильхер: «Почему алгоритмы не могут распознать преступника по лицу»

🔍 Анализ научного исследования об автоматическом выявлении преступников по фото 0:00

В своём видеообзоре автор YouTube-канала Янник Кильхер разбирает скандальную научную работу, посвящённую попыткам алгоритмического выявления криминальных наклонностей человека по его фотографии. Исследование, которое вызвало волну критики в академической среде, утверждает, что с помощью глубокого обучения можно классифицировать людей на «преступников» и «законопослушных граждан» с высокой точностью. Кильхер детально анализирует методологию авторов статьи, указывая на фундаментальные ошибки в сборе данных и интерпретации результатов.

🧪 Методология и спорные утверждения 1:23

Авторы исследования обучали свёрточные нейронные сети (CNN) и другие модели на выборке из 1856 фотографий китайских мужчин в возрасте от 18 до 55 лет. Они утверждали, что для обучения использовались стандартные ID-фотографии, а не полицейские снимки («магшоты»), что должно было исключить влияние специфического освещения или условий съёмки.

Ключевые заявления авторов:
- Преступные и законопослушные лица образуют два «отчётливо различных многообразия» (manifolds).
- Вариативность лиц преступников значительно выше, чем у законопослушных граждан.
- Лица «обычных» людей более похожи друг на друга, следуя некоему «закону нормальности».

Янник Кильхер отмечает, что авторы даже попытались выявить «физиогномические особенности» преступников, такие как меньшее расстояние между глазами, специфический угол наклона рта и повышенная кривизна верхней губы. Ведущий иронизирует, что, согласно этим выводам, достаточно просто нахмуриться, чтобы алгоритм классифицировал вас как преступника.

📉 Проблемы с данными и «эффект улыбки» 12:00

Центральный аргумент критики Кильхера заключается в том, что алгоритм обучился не распознавать «криминальные черты», а различать способы формирования наборов данных.

Разные источники: Фотографии «преступников» были получены из полицейских архивов и ведомств общественной безопасности, где принято фотографироваться с серьёзным выражением лица.
Сбор «непреступников»: Фотографии законопослушных людей собирались из интернета (веб-скрейпинг) с сайтов различных компаний, где люди зачастую улыбаются или выглядят более расслабленно.
Результат: Нейросеть фактически научилась отличать официальные ID-снимки от корпоративных фотографий или селфи, а не идентифицировать личность преступника.

🧠 Критика валидации 17:04

Кильхер отдельно останавливается на методах, которыми авторы пытались доказать отсутствие ошибок в своей работе. Они проводили тесты с «рандомизированными метками» (случайным образом назначая статус преступника или не-преступника), чтобы показать, что модель не просто подстраивается под шум.

По мнению Кильхера, это лишь доказывает работоспособность самого классификатора (он может отличить «А» от «Б», если в данных есть системная разница), но не подтверждает, что эта разница связана с криминальным поведением.
Ведущий подчёркивает, что авторы работы не провели необходимые контрольные тесты, такие как проверка классификатора на «задержанных, но не осуждённых» людях, что позволило бы отделить юридический статус от особенностей фотосъёмки.

💡 Заключение и выводы 31:51

Янник Кильхер называет результаты исследования «абсолютным мусором» и призывает научное сообщество более критически подходить к вопросам сбора данных и «бритве Оккама». Основной урок видео заключается в том, что при получении подозрительно точных результатов в задачах классификации всегда нужно искать более простое объяснение, связанное с артефактами данных, а не со сложными «внутренними свойствами» объектов исследования.