Как Стэнфордский университет внедряет ИИ в медицину: фреймворк FURM и борьба с ошибками

Stanford Online 10,9 тыс. 49 мин 5 мин 11.12.2024
Главное

Искусственный интеллект обещает революцию в медицине, однако путь от алгоритма до реальной пользы для пациента полон этических и операционных ловушек. На вебинаре Stanford Online профессор Стэнфордского университета Нигам Шах представил системный подход к внедрению ИИ, который выходит далеко за рамки написания кода и фокусируется на создании справедливых, полезных и надежных моделей (FURM).

🧬 Данные как фундамент: концепция «таймлайна пациента» 1:16

Главный тезис доктора Нигама Шаха заключается в том, что любой алгоритм машинного обучения ровно настолько хорош, насколько хороши данные, на которых он обучен . В Стэнфордском университете данные рассматривают не как разрозненные записи, а как «объекты временной шкалы пациента» (patient timeline objects) .

Такой подход обнажает ключевые проблемы медицинских данных:

⚖️ Классификация против прогнозирования: почему важна семантика 3:47

Нигам Шах настаивает на строгом разграничении медицинских задач, которые часто путают в индустрии. Он выделяет два основных направления: решение о том, нужно ли лечить (оранжевая зона), и как именно лечить (синяя зона) .

Особое внимание профессор уделяет разнице между классификацией (диагнозом) и прогнозированием (прогнозом):

  1. Классификация: Анализ текущего состояния. Например, утверждение «на снимке пневмония» — это классификация, так как болезнь уже присутствует в момент съемки .
  2. Прогнозирование: Оценка будущих событий. Это настоящий взгляд в будущее, определяющий риск развития осложнений .

Шах приводит в пример «предсказатели сепсиса», которые, по его мнению, на самом деле являются классификаторами . Они лишь фиксируют факт наличия сепсиса, который врачи еще не заметили. Эта педантичность важна для практики: если врач думает, что он прогнозирует, он пытается предотвратить событие; если он понимает, что классифицирует — он фокусируется на немедленном лечении .

🏥 От науки к доставке помощи: уровни внедрения ИИ 6:16

ИИ в здравоохранении может служить трем целям: развитию науки, совершенствованию врачебной практики или улучшению доставки медицинской помощи .

Для иллюстрации Шах описывает модель для пациентов с сердечной недостаточностью:

Одним из успешных примеров интеграции данных в практику стал проект Green Button («Зеленая кнопка») в Стэнфордском университете . Идея заключалась в возможности отправить запрос по сложному случаю и получить отчет, основанный на анализе миллионов аналогичных историй болезни из базы данных . Доктор Шах отмечает, что 80% клинических решений врачи принимают, не имея под рукой опубликованных данных по конкретному случаю . Проект Green Button позже перерос в стартап Anthropos Health, который сократил время подготовки таких отчетов с дней до часов, а с применением генеративного ИИ — до минут .

🚀 Фреймворк FURM: как сделать ИИ устойчивым 13:10

По мнению Шаха, ценность ИИ возникает только тогда, когда за оценкой риска следует ответное действие . Он представил модель FURM (Fair, Useful, Reliable Models — Справедливые, Полезные, Надежные Модели), которая используется в Stanford Health Care .

Проблема современной медицины, как утверждает гость, заключается в том, что 50% всех руководств по ИИ сфокусированы на том, как построить модель (техническая часть), и почти ничего не говорят об этике, рабочих процессах и устойчивости . Шах приводит шокирующую цифру: на валидацию модели ЭКГ, которая определяет приоритетность пациентов в приемном покое, ушло 10 лет и 28 миллионов долларов . Такая организация работы, по его словам, просто неустойчива .

Фреймворк FURM предполагает три этапа:

  1. Открытие (Discovery): Решение научных задач.
  2. Разработка (Development): Оценка достижимой выгоды (сколько пациентов реально получат пользу, учитывая нагрузку на персонал) .
  3. Распространение (Dissemination): Масштабирование и изменение бизнес-моделей.

Критически важным элементом является предварительное моделирование рабочего процесса . Прежде чем внедрять классификатор, больница должна четко знать: кто именно будет реагировать на его уведомления, есть ли у этого сотрудника свободное время и каков порог для принятия решения .

🤖 Генеративный ИИ в медицине: надежды и разочарования 24:09

Появление больших языковых моделей (LLM) в 2022 году изменило ландшафт, но Шах призывает к осторожности. Он предлагает рассматривать историю болезни (EHR) как «язык», где вместо слов используются коды диагнозов и процедур .

Исследования в Стэнфордском университете показали неоднозначные результаты:

В то же время Шах представил специализированные модели Climber и Motor . Обученные на временных шкалах пациентов, они показывают точность на 3–19% выше классических методов, обучаются в 8 раз быстрее и требуют на 95% меньше данных .

❓ Ответы на вопросы: этика, инженерия и «галлюцинации» 31:28

В ходе сессии вопросов и ответов доктор Шах затронул несколько прикладных аспектов:

В завершение Шах подчеркнул, что Стэнфордский университет не обучает собственные модели с нуля из-за огромных затрат, а фокусируется на дообучении (fine-tuning) открытых моделей и, что более важно, на жесткой верификации их полезности .

💬 Цитаты

«Ваш ИИ или машинное обучение хороши лишь настолько, насколько хороши данные, на которых они обучены.»

Нигам Шах 01:28

«Ценность ИИ возникает из ответных действий. Сама по себе модель — это просто оценка риска.»

Нигам Шах 12:43

«Мои друзья-врачи не могут объяснить мне, как работает тайленол. Но мы доверяем ему, потому что он был протестирован столько раз.»

Нигам Шах 45:27
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
EHR (Electronic Health Record)
Электронная медицинская карта пациента, содержащая историю посещений, анализы и назначения.
Feature Engineering
Процесс выбора и преобразования необработанных данных в переменные, которые ИИ может использовать для обучения.
Sepsis predictor
Алгоритм, предназначенный для раннего выявления сепсиса (заражения крови) у госпитализированных пациентов.
Explainability (Объяснимость)
Способность модели ИИ предоставить человеку понятное обоснование того, почему она приняла именно такое решение.
📊 Цифры
🗓 Хронология
  1. 2015 Стэнфорд внедрил модель прогнозирования медицинских расходов для управления группами пациентов.
  2. 2022 Появление больших языковых моделей (LLM), изменивших подход к работе с текстами в медицине.
  3. Май 2024 Проведение вебинара о создании справедливых и надежных моделей ИИ.
⚖️ Другая сторона
Биология и медицина Нигам Шах Stanford University Искусственный интеллект в здравоохранении Large Language Models Электронная медицинская карта