Ирен Чен: «Машинное обучение в медицине — это не только алгоритмы, но и борьба с неравенством»

The TWIML AI Podcast 894 39 мин 4 мин 29.04.2021
Главное

Справедливость и равенство в медицинском обслуживании становятся критически важными темами по мере того, как алгоритмы машинного обучения (ML) внедряются в клиническую практику. В этом выпуске подкаста The TWIML AI Podcast ведущий Сэм Чаррингтон беседует с Ирен Чен, докторантом Массачусетского технологического института (MIT), о том, как бороться с предвзятостью алгоритмов и использовать искусственный интеллект для выявления социальных проблем, таких как домашнее насилие.

🎓 Путь на стыке математики, технологий и медицины 0:00

Ирен Чен начала свою академическую карьеру в Гарварде, изучая прикладную математику с упором на информатику и экономику . После выпуска она два года проработала в Dropbox, где получила опыт наблюдения за алгоритмами «в масштабе» и осознала, как принимаются важные решения о внедрении технологий в бизнес-процессы .

Этот опыт подтолкнул её к возвращению в науку для решения более фундаментальных и этически сложных задач. Сейчас она получает степень PhD в MIT по направлению электротехники и информатики (EECS), одновременно обучаясь по сертификационной программе в Гарвардской медицинской школе (HST) . По словам Чен, такое сочетание позволяет ей не только владеть техническим аппаратом, но и понимать «боли» врачей, изучая патологию, физиологию и проходя клиническую стажировку .

🏥 Специфика машинного обучения в здравоохранении 3:02

Машинное обучение в медицине существенно отличается от классических задач, таких как классификация изображений кошек и собак. Чен выделяет несколько ключевых проблем, с которыми сталкиваются исследователи:

⚖️ Проблема предвзятости данных и алгоритмическая справедливость 6:41

Основная часть исследований Ирен сосредоточена на вопросах справедливости (equity) и инклюзивности. Одним из первых её проектов в MIT была разработка алгоритма оценки риска смертности пациентов в отделениях интенсивной терапии (ICU) . Исследование показало, что модель была менее точной для определенных расовых групп .

Как утверждает гостья, причины такой несправедливости разделяются на два типа:

  1. Малый объем выборки: Для некоторых этнических групп (например, азиатского населения, составлявшего всего 2% в датасете против 70% белого населения) просто не хватает данных для обучения .
  2. Системные искажения (Noise): Для определенных групп собирается меньше измерений или проявляется историческое недоверие к системе здравоохранения, что делает данные для них более «зашумленными» .

Чен подчеркивает, что задача инженера — не просто создать модель, но и провести аудит, чтобы понять, для каких групп алгоритм работает хуже, и обсудить эти риски с клиническими партнерами перед внедрением .

🛡️ ИИ против домашнего насилия: проект по выявлению рисков 16:27

Одним из самых амбициозных проектов Ирен является разработка системы раннего обнаружения насилия со стороны интимного партнера (Intimate Partner Violence, IPV) . Работа ведется совместно с врачами из Brigham and Women’s Hospital в Бостоне .

Система анализирует медицинские маркеры, такие как специфические переломы локтевой кости (ulna fracture), которые часто коррелируют с физическим насилием . Цель проекта — создать «флаг» для врача, который станет поводом для деликатного разговора с пациентом и предоставления ресурсов помощи.

Риски и этические дилеммы проекта:

🤝 Взаимодействие человека и ИИ в клинике 25:51

Обсуждая внедрение технологий, участники затронули вопрос доверия врачей к ИИ. Чен ссылается на исследования взаимодействия дерматологов с алгоритмами:

Ирен считает, что модель не должна существовать в вакууме. В лаборатории её научного руководителя Дэвида Зонтага (David Sontag) в MIT врачи работают бок о бок с программистами . Это позволяет разработчикам сразу получать обратную связь: например, врач может сказать, что модель предсказывает очевидные вещи, и это заставляет исследователей пересматривать цели задачи .

🧪 Вероятностные методы и будущее области 30:01

Ирен активно продвигает идею вероятностного машинного обучения. По её мнению, модель не должна просто выдавать ответ «да» или «нет». Критически важно наличие «оценок неопределенности» . Она приводит аналогию с Siri: когда помощник говорит «я не знаю», это вызывает больше доверия, чем случайный неправильный ответ . В медицине прозрачность алгоритма в ситуациях неуверенности помогает врачу принимать более взвешенные решения .

В завершение Ирен дала рекомендации для новичков:

По оценке гостьи, с 2016 года область «справедливого машинного обучения» (Fairness in ML) выросла из крошечного воркшопа на конференции NeurIPS в самостоятельную дисциплину с собственными конференциями и тысячами исследователей .

💬 Цитаты

«Машинное обучение на данных здравоохранения — это как всё, что вы знаете о машинном обучении, но к чему добавили знак вопроса.»

«Наличие оценок неопределенности в модели крайне важно... когда Siri говорит «я не знаю», это вызывает больше доверия, чем неправильный ответ.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Риск-стратификация
Процесс разделения пациентов на группы по степени вероятности наступления негативного медицинского события.
NeurIPS
Крупнейшая научная конференция по искусственному интеллекту и машинному обучению.
Lóngitudinal analysis
Исследование, в котором одни и те же объекты изучаются в течение длительного времени.
📊 Цифры
🗓 Хронология
  1. 2016 Ирен Чен замечает, что область «справедливости в ML» почти не представлена на профильных конференциях.
  2. 2021 Год записи интервью; область алгоритмической справедливости становится мейнстримом на конференциях уровня NeurIPS.
  3. 2022 Ожидаемый год окончания PhD программы Ирен Чен в MIT.
⚖️ Другая сторона
Искусственный интеллект Irene Chen MIT Machine Learning Healthcare NeurIPS