Ирен Чен: «Машинное обучение в медицине — это не только алгоритмы, но и борьба с неравенством»

Справедливость и равенство в медицинском обслуживании становятся критически важными темами по мере того, как алгоритмы машинного обучения (ML) внедряются в клиническую практику. В этом выпуске подкаста The TWIML AI Podcast ведущий Сэм Чаррингтон беседует с Ирен Чен, докторантом Массачусетского технологического института (MIT), о том, как бороться с предвзятостью алгоритмов и использовать искусственный интеллект для выявления социальных проблем, таких как домашнее насилие.

🎓 Путь на стыке математики, технологий и медицины 0:00

Ирен Чен начала свою академическую карьеру в Гарварде, изучая прикладную математику с упором на информатику и экономику . После выпуска она два года проработала в Dropbox, где получила опыт наблюдения за алгоритмами «в масштабе» и осознала, как принимаются важные решения о внедрении технологий в бизнес-процессы .

Этот опыт подтолкнул её к возвращению в науку для решения более фундаментальных и этически сложных задач. Сейчас она получает степень PhD в MIT по направлению электротехники и информатики (EECS), одновременно обучаясь по сертификационной программе в Гарвардской медицинской школе (HST) . По словам Чен, такое сочетание позволяет ей не только владеть техническим аппаратом, но и понимать «боли» врачей, изучая патологию, физиологию и проходя клиническую стажировку .

🏥 Специфика машинного обучения в здравоохранении 3:02

Машинное обучение в медицине существенно отличается от классических задач, таких как классификация изображений кошек и собак. Чен выделяет несколько ключевых проблем, с которыми сталкиваются исследователи:

Неопределенность меток: В отличие от фото питомца, диагноз (метка) может быть ошибочным или отсутствовать, если пациент не посещал врача .
Зашумленность и неполнота данных: Пациенты переезжают, меняют клиники, а приём лекарств может искажать результаты анализов .
Скудность выборок: Несмотря на разговоры о Big Data, при переходе к конкретному хроническому заболеванию выборка может сократиться до нескольких тысяч человек .
Высокие ставки: Ошибка классификации в медицине ведет к неправильному лечению, что гораздо опаснее ошибки алгоритма на YouTube .

⚖️ Проблема предвзятости данных и алгоритмическая справедливость 6:41

Основная часть исследований Ирен сосредоточена на вопросах справедливости (equity) и инклюзивности. Одним из первых её проектов в MIT была разработка алгоритма оценки риска смертности пациентов в отделениях интенсивной терапии (ICU) . Исследование показало, что модель была менее точной для определенных расовых групп .

Как утверждает гостья, причины такой несправедливости разделяются на два типа:

Малый объем выборки: Для некоторых этнических групп (например, азиатского населения, составлявшего всего 2% в датасете против 70% белого населения) просто не хватает данных для обучения .
Системные искажения (Noise): Для определенных групп собирается меньше измерений или проявляется историческое недоверие к системе здравоохранения, что делает данные для них более «зашумленными» .

Чен подчеркивает, что задача инженера — не просто создать модель, но и провести аудит, чтобы понять, для каких групп алгоритм работает хуже, и обсудить эти риски с клиническими партнерами перед внедрением .

🛡️ ИИ против домашнего насилия: проект по выявлению рисков 16:27

Одним из самых амбициозных проектов Ирен является разработка системы раннего обнаружения насилия со стороны интимного партнера (Intimate Partner Violence, IPV) . Работа ведется совместно с врачами из Brigham and Women’s Hospital в Бостоне .

Система анализирует медицинские маркеры, такие как специфические переломы локтевой кости (ulna fracture), которые часто коррелируют с физическим насилием . Цель проекта — создать «флаг» для врача, который станет поводом для деликатного разговора с пациентом и предоставления ресурсов помощи.

Риски и этические дилеммы проекта:

Стигма: Пациенты часто боятся сообщать о насилии из-за недоверия к системе или страха последствий .
Метки: Исследователи сталкиваются с проблемой: если обучать модель только на тех, кто сам признался в насилии, алгоритм может не заметить скрытую группу пострадавших .
Последствия срабатывания: Чен отмечает, что определение порога чувствительности системы (sensitivity vs specificity) — это не просто математическая задача, а вопрос общественной безопасности .

🤝 Взаимодействие человека и ИИ в клинике 25:51

Обсуждая внедрение технологий, участники затронули вопрос доверия врачей к ИИ. Чен ссылается на исследования взаимодействия дерматологов с алгоритмами:

Опытные врачи редко меняют свое мнение под влиянием подсказок ИИ .
Молодые специалисты, напротив, более склонны доверять системе, даже если она выдает ошибочный результат .

Ирен считает, что модель не должна существовать в вакууме. В лаборатории её научного руководителя Дэвида Зонтага (David Sontag) в MIT врачи работают бок о бок с программистами . Это позволяет разработчикам сразу получать обратную связь: например, врач может сказать, что модель предсказывает очевидные вещи, и это заставляет исследователей пересматривать цели задачи .

🧪 Вероятностные методы и будущее области 30:01

Ирен активно продвигает идею вероятностного машинного обучения. По её мнению, модель не должна просто выдавать ответ «да» или «нет». Критически важно наличие «оценок неопределенности» . Она приводит аналогию с Siri: когда помощник говорит «я не знаю», это вызывает больше доверия, чем случайный неправильный ответ . В медицине прозрачность алгоритма в ситуациях неуверенности помогает врачу принимать более взвешенные решения .

В завершение Ирен дала рекомендации для новичков:

Открытые данные: Использовать датасеты вроде MIMIC (Beth Israel Deaconess Medical Center), которые содержат деперсонализированные данные о десятках тысяч пациентов .
Коллаборации: Не пытаться быть «одиноким гением». Современная наука в этой области — это смесь экспертизы специалистов по ML, врачей, биологов и даже антропологов .

По оценке гостьи, с 2016 года область «справедливого машинного обучения» (Fairness in ML) выросла из крошечного воркшопа на конференции NeurIPS в самостоятельную дисциплину с собственными конференциями и тысячами исследователей .