Как Стэнфорд внедряет ИИ в медицину: фреймворк FURM и проект Green Button

Stanford Online 10,9 тыс. 49 мин 5 мин 11.12.2024
Главное

На вебинаре Стэнфордского университета профессор медицины и главный специалист по данным Stanford Health Care доктор Нигам Шах представил системный подход к интеграции искусственного интеллекта в клиническую практику. Основное внимание было уделено переходу от создания теоретических моделей к внедрению инструментов, которые приносят реальную пользу пациентам, остаются финансово устойчивыми и этически безупречными.

📈 Данные как основа: концепция «объекта временной шкалы пациента» 1:16

По мнению доктора Нигама Шаха, любая модель ИИ или машинного обучения (ML) ценна лишь настолько, насколько качественны данные, на которых она обучалась . В Stanford Health Care данные рассматриваются не как разрозненные записи, а как «объекты временной шкалы пациента» (patient timeline objects).

Ключевые характеристики этих данных:

🧠 Классификация против Прогнозирования: терминологическая ловушка 3:47

В здравоохранении ИИ решает две основные задачи: помогать врачу решить, нужно ли лечить пациента, и как именно это делать. Однако доктор Шах указывает на критическую проблему подмены понятий в индустрии .

  1. Классификация (диагностика): Определение состояния, которое уже существует. Например, анализ рентгеновского снимка на наличие пневмонии — это классификация, а не предсказание, так как болезнь уже развилась на момент съемки .
  2. Прогнозирование (прогноз): Оценка будущих событий.
  3. Кейс о сепсисе: По словам Шаха, большинство существующих «предикторов сепсиса» на самом деле являются классификаторами . Они не предсказывают появление сепсиса в будущем, а просто фиксируют тот факт, что он уже есть у пациента, но медицинская команда об этом еще не знает. Эта семантическая разница критична: если вы думаете, что предсказываете, вы стремитесь к профилактике; если вы знаете, что классифицируете — вы фокусируетесь на лечении .

🏥 Сетка медицинского прогресса и проект Green Button 6:16

Для оценки полезности ИИ доктор Шах использует матрицу, разделяющую прогресс на три уровня: наука, медицинская практика и оказание помощи (delivery).

Одним из успешных примеров реализации этой концепции стал проект Green Button в Стэнфорде. Его суть — в возможности врача запросить консультацию на основе анализа миллионов похожих клинических случаев в режиме реального времени .

🛠️ Фреймворк FURM: как сделать ИИ справедливым и полезным 15:00

Чтобы избежать создания бесполезных моделей, в Stanford Health Care используют методологию FURM (Fair, Useful, Reliable Models) — справедливые, полезные и надежные модели .

Процесс FURM включает три стадии:

  1. Анализ «Что и Зачем»: До начала разработки оцениваются финансовые перспективы, этические риски и симулируется рабочий процесс (workflow) .
  2. Создание модели: Техническая разработка алгоритма.
  3. Оценка влияния: Проверка того, изменила ли модель реальные показатели здоровья .

Доктор Шах подчеркивает, что текущая модель медицинских исследований неустойчива. Например, на валидацию модели сортировки пациентов в отделении неотложной помощи (ЭКГ-тестирование) ушло 10 лет и 28 миллионов долларов . Система FURM призвана ускорить этот процесс, делая упор на «достижимую выгоду» (achievable benefit) с учетом ограниченных ресурсов больницы .

Этика и управление 21:34

Для ответственного внедрения ИИ Шах предлагает структуру управления, состоящую из четырех компонентов:

🤖 Революция LLM: ИИ как язык медицинских записей 24:09

С появлением больших языковых моделей (LLM) взгляд на электронные медицинские карты (EHR) изменился. Доктор Шах предлагает рассматривать историю болезни как последовательность токенов из словаря медицинских кодов (ICD, CPT, LOINC) .

В Stanford Online исследовали два направления использования LLM:

  1. Общие модели (чат и суммаризация):

    • При сравнении ответов GPT-3.5 и GPT-4 на медицинские вопросы врачи отметили прогресс GPT-4, но в 40–50% случаев медики не могли однозначно решить, прав ИИ или нет .
    • Проект MedAlign показал, что при выполнении задач по извлечению данных из EHR (например, поиск неврологических дефицитов после инсульта) частота ошибок составляет 35% даже в идеальных условиях .
  2. Специализированные модели прогнозирования (CLIMBER и MOTOR):

    • Стэнфорд обучил модели на последовательностях медицинских кодов («языке EHR»).
    • Результаты: точность на 3–19% выше, чем у классических методов (логистическая регрессия, случайный лес).
    • Обучение проходит в 8 раз быстрее и требует на 95% меньше данных .

❓ Ответы на вопросы: практика и нюансы 31:28

В ходе сессии вопросов и ответов доктор Шах прояснил несколько важных аспектов:

Примеры применения в других областях 39:50

Шах подытожил, что ключевой задачей академических центров сегодня является не просто создание моделей (что делают техгиганты за миллионы долларов), а жесткая верификация их преимуществ для реального здравоохранения .

💬 Цитаты

«Ваш ИИ или машинное обучение хороши лишь настолько, насколько хороши данные, на которых они обучались.»

Нигам Шах 01:28

«Мой друг-врач не может объяснить мне, как работает парацетамол. Но мы доверяем ему, потому что он был протестирован столько раз.»

Нигам Шах 45:27

«У ИИ-инструмента должна быть функция управления: группа людей, чья работа — говорить «нет».»

Нигам Шах 23:16
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
FURM
Fair, Useful, Reliable Models — стэнфордская методология оценки ИИ на справедливость, полезность и надежность.
EHR
Electronic Health Record — электронная медицинская карта пациента.
LOINC
Logical Observation Identifiers Names and Codes — международный стандарт идентификации лабораторных и клинических наблюдений.
SaMD
Software as a Medical Device — программное обеспечение, используемое в медицинских целях без участия аппаратной части.
📊 Цифры
⚖️ Другая сторона
Биология и медицина Stanford University Nigam Shah FURM framework LLM in healthcare Green Button project