Чарльз Исбелл: «Машинное обучение должно повзрослеть и стать настоящей инженерией»

Машинное обучение переросло рамки узкой дисциплины для «хакеров компиляторов» и стало полноценной инженерной отраслью, определяющей жизни миллиардов людей. Чарльз Исбелл, декан Колледжа вычислительной техники Технологического института Джорджии (Georgia Tech), утверждает: игнорировать социальный контекст при разработке алгоритмов сегодня не только неэтично, но и технически безграмотно.

🛠️ От «хакинга» к инженерной зрелости 7:24

В своем докладе на конференции NeurIPS Чарльз Исбелл проводит фундаментальную аналогию: современные специалисты по машинному обучению (ML) часто напоминают «хакеров компиляторов» — людей, сосредоточенных на узкой задаче оптимизации кода и трансляции языков . По мнению Исбелла, этот подход был уместен на ранних этапах, но сейчас он стал опасным.

Главные тезисы трансформации подхода:

Системное мышление: Инженер-программист, в отличие от хакера, обязан понимать спецификации, требования и то, как его продукт будет взаимодействовать с другими системами .
Ответственность за данные: Исбелл считает интеллектуально нечестным аргумент «алгоритм не виноват, это данные плохие». Если ученый знает о предвзятости выборки, он обязан создать алгоритм, способный корректировать эти ошибки, а не прятаться за «прокси-проблемами» ради публикации статьи .
Неизбежность гиперпараметров: Спикер подчеркивает, что выбор каждого «тумблера» в модели (например, коэффициентов $\lambda$ или $\gamma$) влияет на итоговый результат. Игнорирование этого влияния или использование значений «по умолчанию» (как признался сам Исбелл, вспоминая свои работы 90-х годов с параметром 0.7) — это отказ от управления качеством системы .

👥 Дилемма разнообразия: почему комфорт мешает качеству 19:14

Одной из самых острых тем дискуссии стала необходимость привлечения в индустрию людей с разным жизненным опытом. Исбелл настаивает, что разнообразие — это не просто социальный жест, а условие технической выживаемости продукта.

Собеседники обсудили психологический аспект работы в инклюзивных командах. Исбелл привел пример из собственного опыта: работа в группе с людьми, имеющими схожие взгляды, приносит больше удовольствия и шуток, но ограничивает видение проблемы . И наоборот, группы с полярными взглядами часто менее счастливы из-за постоянных споров, но именно они выдают наиболее устойчивые и инновационные решения .

Ключевые выводы о роли «человека в комнате»:

Предупреждение катастроф: Недостаточно просто «сходить и спросить мнение» у разных групп. Эксперты из этих сообществ должны быть внутри процесса разработки, чтобы вовремя сказать: «Это не данные о преступности, это данные об арестах, и это разные вещи» .
Эффект Google: Обсуждая недавние скандалы в крупных корпорациях (включая уход Тимнит Гебру), Исбелл отмечает, что лидерам необходимо создавать «безопасные пространства» для сложных дискуссий, где критика не воспринимается как личное оскорбление .
Пример с «белым» Обамой: В качестве иллюстрации текущих проблем Исбелл упомянул алгоритмы Pulse и StyleGAN, которые из-за смещенных выборок превращали фотографии Барака Обамы и самого Исбелла в европеоидных мужчин .

🎓 Образование как долгосрочный патч 38:28

Для Чарльза Исбелла будущее ML лежит в области образования. Он убежден, что технические проблемы решатся сами собой, если в «комнате принятия решений» окажутся правильные люди.

В Технологическом институте Джорджии Исбелл внедряет концепцию «ответственных вычислений» (Responsible Computing) . В отличие от классических курсов этики, которые студенты часто проходят формально на последнем курсе, в Georgia Tech курс профессиональной ответственности сделали обязательным пререквизитом для разработки проектов на третьем курсе .

Стратегия изменения учебного плана:

Контекстуальное обучение: Студенты должны задумываться о приватности и социальных последствиях до того, как приступят к изучению продвинутого ИИ или кибербезопасности .
Стигма «последнего курса»: Исбелл утверждает, что оставлять этику на финал обучения — значит подавать сигнал студентам, что этот предмет второстепенен .
Широкий охват: Онлайн-магистратура (OMSCS), в которой обучается более 11 000 студентов, позволяет масштабировать эти принципы на мировом уровне, делая качественное образование доступным по цене около $6600 против стандартных $45 000 .

🔮 Будущее: между авиакатастрофами и оптимизмом 33:38

Исбелл проводит аналогию с авиастроением, где инженеры буквально помешаны на безопасности. Однако он с горечью отмечает, что большинство отраслей приходят к строгим стандартам только после крупных катастроф (как это произошло в аэрокосмической отрасли или медицине) .

Несмотря на текущие конфликты в индустрии и сложность математических определений «справедливости» (fairness), которые могут различаться даже между США и Канадой из-за культурных особенностей, гость остается оптимистом . Его главный призыв к ML-сообществу — не убегать от сложности социальных систем, а принять их как новый, самый интересный вызов в истории вычислительной техники .