# Ирен Чен: «Машинное обучение в медицине — это не только алгоритмы, но и борьба с неравенством»

Источник: https://www.youtube.com/watch?v=H55zNBM3sf0
Канал: The TWIML AI Podcast
Опубликовано: 29.04.2021

---

Справедливость и равенство в медицинском обслуживании становятся критически важными темами по мере того, как алгоритмы машинного обучения (ML) внедряются в клиническую практику. В этом выпуске подкаста **The TWIML AI Podcast** ведущий **Сэм Чаррингтон** беседует с **Ирен Чен**, докторантом Массачусетского технологического института (MIT), о том, как бороться с предвзятостью алгоритмов и использовать искусственный интеллект для выявления социальных проблем, таких как домашнее насилие.

## 🎓 Путь на стыке математики, технологий и медицины
[[JUMP:0:00]]

Ирен Чен начала свою академическую карьеру в Гарварде, изучая прикладную математику с упором на информатику и экономику [0:52]. После выпуска она два года проработала в **Dropbox**, где получила опыт наблюдения за алгоритмами «в масштабе» и осознала, как принимаются важные решения о внедрении технологий в бизнес-процессы [1:19].

Этот опыт подтолкнул её к возвращению в науку для решения более фундаментальных и этически сложных задач. Сейчас она получает степень PhD в MIT по направлению электротехники и информатики (EECS), одновременно обучаясь по сертификационной программе в Гарвардской медицинской школе (HST) [2:11]. По словам Чен, такое сочетание позволяет ей не только владеть техническим аппаратом, но и понимать «боли» врачей, изучая патологию, физиологию и проходя клиническую стажировку [2:24].

## 🏥 Специфика машинного обучения в здравоохранении
[[JUMP:3:02]]

Машинное обучение в медицине существенно отличается от классических задач, таких как классификация изображений кошек и собак. Чен выделяет несколько ключевых проблем, с которыми сталкиваются исследователи:

*   **Неопределенность меток:** В отличие от фото питомца, диагноз (метка) может быть ошибочным или отсутствовать, если пациент не посещал врача [3:40].
*   **Зашумленность и неполнота данных:** Пациенты переезжают, меняют клиники, а приём лекарств может искажать результаты анализов [3:52].
*   **Скудность выборок:** Несмотря на разговоры о Big Data, при переходе к конкретному хроническому заболеванию выборка может сократиться до нескольких тысяч человек [5:37].
*   **Высокие ставки:** Ошибка классификации в медицине ведет к неправильному лечению, что гораздо опаснее ошибки алгоритма на YouTube [4:33].

## ⚖️ Проблема предвзятости данных и алгоритмическая справедливость
[[JUMP:6:41]]

Основная часть исследований Ирен сосредоточена на вопросах справедливости (equity) и инклюзивности. Одним из первых её проектов в MIT была разработка алгоритма оценки риска смертности пациентов в отделениях интенсивной терапии (ICU) [7:18]. Исследование показало, что модель была менее точной для определенных расовых групп [8:11].

Как утверждает гостья, причины такой несправедливости разделяются на два типа:

1.  **Малый объем выборки:** Для некоторых этнических групп (например, азиатского населения, составлявшего всего 2% в датасете против 70% белого населения) просто не хватает данных для обучения [9:55].
2.  **Системные искажения (Noise):** Для определенных групп собирается меньше измерений или проявляется историческое недоверие к системе здравоохранения, что делает данные для них более «зашумленными» [10:08].

Чен подчеркивает, что задача инженера — не просто создать модель, но и провести аудит, чтобы понять, для каких групп алгоритм работает хуже, и обсудить эти риски с клиническими партнерами перед внедрением [11:13].

## 🛡️ ИИ против домашнего насилия: проект по выявлению рисков
[[JUMP:16:27]]

Одним из самых амбициозных проектов Ирен является разработка системы раннего обнаружения насилия со стороны интимного партнера (Intimate Partner Violence, IPV) [17:45]. Работа ведется совместно с врачами из **Brigham and Women’s Hospital** в Бостоне [19:34].

Система анализирует медицинские маркеры, такие как специфические переломы локтевой кости (ulna fracture), которые часто коррелируют с физическим насилием [18:28]. Цель проекта — создать «флаг» для врача, который станет поводом для деликатного разговора с пациентом и предоставления ресурсов помощи.

**Риски и этические дилеммы проекта:**

*   **Стигма:** Пациенты часто боятся сообщать о насилии из-за недоверия к системе или страха последствий [18:57].
*   **Метки:** Исследователи сталкиваются с проблемой: если обучать модель только на тех, кто сам признался в насилии, алгоритм может не заметить скрытую группу пострадавших [22:45].
*   **Последствия срабатывания:** Чен отмечает, что определение порога чувствительности системы (sensitivity vs specificity) — это не просто математическая задача, а вопрос общественной безопасности [24:29].

## 🤝 Взаимодействие человека и ИИ в клинике
[[JUMP:25:51]]

Обсуждая внедрение технологий, участники затронули вопрос доверия врачей к ИИ. Чен ссылается на исследования взаимодействия дерматологов с алгоритмами:

*   Опытные врачи редко меняют свое мнение под влиянием подсказок ИИ [26:03].
*   Молодые специалисты, напротив, более склонны доверять системе, даже если она выдает ошибочный результат [26:41].

Ирен считает, что модель не должна существовать в вакууме. В лаборатории её научного руководителя **Дэвида Зонтага** (David Sontag) в MIT врачи работают бок о бок с программистами [27:50]. Это позволяет разработчикам сразу получать обратную связь: например, врач может сказать, что модель предсказывает очевидные вещи, и это заставляет исследователей пересматривать цели задачи [29:20].

## 🧪 Вероятностные методы и будущее области
[[JUMP:30:01]]

Ирен активно продвигает идею вероятностного машинного обучения. По её мнению, модель не должна просто выдавать ответ «да» или «нет». Критически важно наличие «оценок неопределенности» [30:41]. Она приводит аналогию с **Siri**: когда помощник говорит «я не знаю», это вызывает больше доверия, чем случайный неправильный ответ [31:20]. В медицине прозрачность алгоритма в ситуациях неуверенности помогает врачу принимать более взвешенные решения [32:14].

В завершение Ирен дала рекомендации для новичков:

*   **Открытые данные:** Использовать датасеты вроде **MIMIC** (Beth Israel Deaconess Medical Center), которые содержат деперсонализированные данные о десятках тысяч пациентов [34:02].
*   **Коллаборации:** Не пытаться быть «одиноким гением». Современная наука в этой области — это смесь экспертизы специалистов по ML, врачей, биологов и даже антропологов [37:21].

По оценке гостьи, с 2016 года область «справедливого машинного обучения» (Fairness in ML) выросла из крошечного воркшопа на конференции **NeurIPS** в самостоятельную дисциплину с собственными конференциями и тысячами исследователей [38:40].