Питер Ли из Microsoft: «Пациенты будут возмущены, если врач не использует ИИ в качестве второго мнения»

Stanford Online 10,9 тыс. 50 мин 5 мин 29.07.2025
Главное

Будущее медицины уже не в простом увеличении вычислительных мощностей, а в создании «рассуждающих» агентов, способных вести диалог и учитывать экономическую целесообразность лечения. Президент Microsoft Research Питер Ли обсуждает с экспертами Stanford Online, почему ИИ-агенты превосходят врачей в диагностике и как технология ambient listening спасает систему здравоохранения от выгорания.

🤖 Новая эра ИИ: от предобучения к «времени на раздумья» 1:45

Обсуждение началось с анализа текущего состояния рынка ИИ, в частности недавнего запуска модели Grok от xAI. По данным бенчмарков, представленных в ходе дискуссии, новые модели начинают обходить GPT-4 Pro и Gemini 2.5 Pro в мультимодальных тестах . Однако Питер Ли считает, что фокус индустрии смещается: если раньше основной прорыв связывали с этапом предобучения (pre-training), то сейчас центр инноваций переместился в область постобучения и вычислений во время инференса (inference-time compute) .

Ключевые тезисы Питера Ли о развитии моделей:

🧪 Проблема оценки: ИИ как «идеальный интерн» 5:28

Одной из главных сложностей остается оценка качества моделей. Питер Ли отметил, что индустрия страдает от «закона Гудхарта»: когда метрика становится целью, она перестает быть хорошей метрикой . В Microsoft Research разрабатывают экспериментальный подход Adele, использующий методы психометрики для оценки ИИ, что отличается от стандартных стресс-тестов на логику и знания .

Спикеры предложили оценивать ИИ не как калькулятор, а как коллегу или интерна. По мнению Ли, «хороший интерн» в облике ИИ должен обладать следующими качествами:

  1. Активное слушание: знать, когда задать уточняющий вопрос, чтобы не тратить время руководителя .
  2. Память: способность учиться на опыте, запоминать предпочтения пользователя (что нравится, а что нет) .
  3. Управление полномочиями (Entitlements): понимание, какие инструменты ему разрешено использовать, и умение самостоятельно обучаться работе с ними .

🩺 Прорыв в диагностике: агенты MAI и экономика тестов 14:24

Особое внимание участники уделили исследованию команды MAI (Microsoft AI) в области «последовательной диагностики». В отличие от статичных тестов, здесь модель начинает работу с минимального промпта (например: «18-летняя девушка жалуется на кашель») .

Особенности механизма работы такого ИИ:

При этом Ли признает, что остаются открытые вопросы: например, как модель поведет себя с абсолютно здоровым пациентом, которому нужен просто отдых и чай, а не медицинское вмешательство .

✍️ Революция «Ambient Listening» и борьба с бюрократией 18:19

Огромный пласт работы Microsoft связан с технологиями фонового прослушивания (ambient listening) и автоматического заполнения медицинских карт. Питер Ли поделился личной историей времен COVID-19: после удаления новообразования на щеке он обнаружил в своей карте запись, что процедура была необходима, так как образование мешало носить маску . По мнению Ли, это было типичное «ап-кодинг» (завышение сложности кода услуги) для получения оплаты от страховой.

Внедрение ИИ в этот процесс (проекты EmpowerMD, Dragon Copilot) может изменить систему:

Питер Ли также выступил с критикой технологического оптимизма прошлого, отметив, что за последние 8 лет технократы и политики часто лишь увеличивали когнитивную нагрузку на врачей (например, через мандаты на стандарты данных FHIR), вместо того чтобы реально помогать им .

🏥 Практический кейс: неделя вместо месяцев 29:35

Потрясающим примером эффективности генеративного ИИ стал опыт работы с Providence Health System (51 госпиталь). Ранее для сбора данных в онкологические реестры требовались усилия трех десятков медсестер, которые вручную анализировали неструктурированные заметки .

Прорыв произошел с появлением GPT-4:

🔮 Будущее медицины: два года до глобальных перемен 33:16

Питер Ли и ведущие обсудили, станет ли использование ИИ обязательным (стандартом медицинской помощи). По мнению Ли, через несколько лет пациенты будут всерьез обеспокоены, если узнают, что их врач не использует ИИ в качестве «второго мнения» для снижения риска ошибок .

Прогнозы участников:

В завершение Ли выразил осторожный оптимизм: либо ИИ поможет реализовать преимущества ранней диагностики и снизит нагрузку на систему, либо, напротив, будет находить у людей слишком много мелких отклонений, что создаст избыточное давление на и без того перегруженное здравоохранение .

💬 Цитаты

«В течение считанных лет пациенты будут встревожены, если обнаружат, что их врачи не пользуются помощью ИИ.»

«Для ИИ-интерна важна способность учиться на опыте и запоминать, что вам нравится, а что нет.»

«Технологии часто лишь увеличивали когнитивную нагрузку на провайдеров услуг. Мы должны перестать это делать.»

👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Ambient Listening
Технология фонового прослушивания диалога врача и пациента для автоматического создания медицинских заметок.
Post-training
Этап доработки ИИ-модели после основного обучения (предобучения) для настройки на специфические задачи и поведение.
FHIR
Международный стандарт обмена медицинской информацией (Fast Healthcare Interoperability Resources).
Up-coding
Практика завышения сложности оказанной медицинской услуги в документации для получения больших выплат от страховой компании.
📊 Цифры
🗓 Хронология
  1. 2018 Запуск проекта EmpowerMD в Microsoft для создания ИИ-помощника врача.
  2. Март 2023 Публикация книги Питера Ли «ИИ-революция в медицине».
  3. Июль 2024 Запуск модели Grok и обсуждение новых бенчмарков в подкасте.
⚖️ Другая сторона
Биология и медицина Питер Ли Microsoft Research GPT-4 Stanford Online Ambient Listening