Чарльз Исбелл: «Машинное обучение должно повзрослеть и стать настоящей инженерией»

The TWIML AI Podcast 624 48 мин 3 мин 05.01.2021
Главное

Машинное обучение переросло рамки узкой дисциплины для «хакеров компиляторов» и стало полноценной инженерной отраслью, определяющей жизни миллиардов людей. Чарльз Исбелл, декан Колледжа вычислительной техники Технологического института Джорджии (Georgia Tech), утверждает: игнорировать социальный контекст при разработке алгоритмов сегодня не только неэтично, но и технически безграмотно.

🛠️ От «хакинга» к инженерной зрелости 7:24

В своем докладе на конференции NeurIPS Чарльз Исбелл проводит фундаментальную аналогию: современные специалисты по машинному обучению (ML) часто напоминают «хакеров компиляторов» — людей, сосредоточенных на узкой задаче оптимизации кода и трансляции языков . По мнению Исбелла, этот подход был уместен на ранних этапах, но сейчас он стал опасным.

Главные тезисы трансформации подхода:

👥 Дилемма разнообразия: почему комфорт мешает качеству 19:14

Одной из самых острых тем дискуссии стала необходимость привлечения в индустрию людей с разным жизненным опытом. Исбелл настаивает, что разнообразие — это не просто социальный жест, а условие технической выживаемости продукта.

Собеседники обсудили психологический аспект работы в инклюзивных командах. Исбелл привел пример из собственного опыта: работа в группе с людьми, имеющими схожие взгляды, приносит больше удовольствия и шуток, но ограничивает видение проблемы . И наоборот, группы с полярными взглядами часто менее счастливы из-за постоянных споров, но именно они выдают наиболее устойчивые и инновационные решения .

Ключевые выводы о роли «человека в комнате»:

  1. Предупреждение катастроф: Недостаточно просто «сходить и спросить мнение» у разных групп. Эксперты из этих сообществ должны быть внутри процесса разработки, чтобы вовремя сказать: «Это не данные о преступности, это данные об арестах, и это разные вещи» .
  2. Эффект Google: Обсуждая недавние скандалы в крупных корпорациях (включая уход Тимнит Гебру), Исбелл отмечает, что лидерам необходимо создавать «безопасные пространства» для сложных дискуссий, где критика не воспринимается как личное оскорбление .
  3. Пример с «белым» Обамой: В качестве иллюстрации текущих проблем Исбелл упомянул алгоритмы Pulse и StyleGAN, которые из-за смещенных выборок превращали фотографии Барака Обамы и самого Исбелла в европеоидных мужчин .

🎓 Образование как долгосрочный патч 38:28

Для Чарльза Исбелла будущее ML лежит в области образования. Он убежден, что технические проблемы решатся сами собой, если в «комнате принятия решений» окажутся правильные люди.

В Технологическом институте Джорджии Исбелл внедряет концепцию «ответственных вычислений» (Responsible Computing) . В отличие от классических курсов этики, которые студенты часто проходят формально на последнем курсе, в Georgia Tech курс профессиональной ответственности сделали обязательным пререквизитом для разработки проектов на третьем курсе .

Стратегия изменения учебного плана:

🔮 Будущее: между авиакатастрофами и оптимизмом 33:38

Исбелл проводит аналогию с авиастроением, где инженеры буквально помешаны на безопасности. Однако он с горечью отмечает, что большинство отраслей приходят к строгим стандартам только после крупных катастроф (как это произошло в аэрокосмической отрасли или медицине) .

Несмотря на текущие конфликты в индустрии и сложность математических определений «справедливости» (fairness), которые могут различаться даже между США и Канадой из-за культурных особенностей, гость остается оптимистом . Его главный призыв к ML-сообществу — не убегать от сложности социальных систем, а принять их как новый, самый интересный вызов в истории вычислительной техники .

💬 Цитаты

«Мы больше не можем позволить себе — ни интеллектуально, ни этически — игнорировать тот факт, что строим реальные системы.»

Чарльз Исбелл 14:48

«Алгоритмы имеют предвзятость по определению. Вопрос в настройке гиперпараметров, которую нельзя избежать.»

Чарльз Исбелл 29:37

«Разнообразные группы менее счастливы, потому что их постоянно заставляют сомневаться в своих взглядах, но именно они добиваются лучших результатов.»

Чарльз Исбелл 21:47
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Гиперпараметры
Внешние настройки алгоритма, которые задаются разработчиком вручную перед началом обучения модели.
Латентные переменные
Скрытые факторы, которые нельзя измерить напрямую, но которые влияют на наблюдаемые данные в ML.
MOOC
Массовые открытые онлайн-курсы, доступные широкому кругу слушателей через интернет.
StyleGAN / Pulse
Алгоритмы генерации и улучшения качества изображений на основе нейросетей.
📊 Цифры
🗓 Хронология
  1. Сентябрь 2016 Первое появление Чарльза Исбелла в подкасте TWIML (4-й эпизод).
  2. 2014 Запуск программы онлайн-магистратуры OMSCS в Georgia Tech.
  3. 2020 Участие Исбелла в подкасте Малкольма Гладуэлла и доклад на NeurIPS.
⚖️ Другая сторона
Искусственный интеллект Charles Isbell Georgia Tech Machine Learning OMSCS NeurIPS