# Питер Ли из Microsoft: «Пациенты будут возмущены, если врач не использует ИИ в качестве второго мнения»

Источник: https://www.youtube.com/watch?v=4shJQtkL3Ms
Канал: Stanford Online
Опубликовано: 29.07.2025

---

Будущее медицины уже не в простом увеличении вычислительных мощностей, а в создании «рассуждающих» агентов, способных вести диалог и учитывать экономическую целесообразность лечения. Президент Microsoft Research Питер Ли обсуждает с экспертами Stanford Online, почему ИИ-агенты превосходят врачей в диагностике и как технология ambient listening спасает систему здравоохранения от выгорания.

## 🤖 Новая эра ИИ: от предобучения к «времени на раздумья»
[[JUMP:01:45]]

Обсуждение началось с анализа текущего состояния рынка ИИ, в частности недавнего запуска модели Grok от xAI. По данным бенчмарков, представленных в ходе дискуссии, новые модели начинают обходить GPT-4 Pro и Gemini 2.5 Pro в мультимодальных тестах [02:37]. Однако Питер Ли считает, что фокус индустрии смещается: если раньше основной прорыв связывали с этапом предобучения (pre-training), то сейчас центр инноваций переместился в область постобучения и вычислений во время инференса (inference-time compute) [04:08].

Ключевые тезисы Питера Ли о развитии моделей:

*   **Высокие ставки предобучения:** Полномасштабный запуск предобучения новой модели сегодня сопоставим по рискам и стоимости с разработкой новой архитектуры кремниевого процессора [04:34].
*   **Гибкость постобучения:** Именно на этапе после основного обучения у исследователей появляется больше возможностей для внедрения инновационных идей.
*   **Важность базы:** По мнению Ли, для надежной работы «рассуждающих» парадигм (reasoning models) исходная базовая модель всё равно должна быть чрезвычайно высокого качества [05:16].

## 🧪 Проблема оценки: ИИ как «идеальный интерн»
[[JUMP:05:28]]

Одной из главных сложностей остается оценка качества моделей. Питер Ли отметил, что индустрия страдает от «закона Гудхарта»: когда метрика становится целью, она перестает быть хорошей метрикой [05:42]. В Microsoft Research разрабатывают экспериментальный подход Adele, использующий методы психометрики для оценки ИИ, что отличается от стандартных стресс-тестов на логику и знания [06:39].

Спикеры предложили оценивать ИИ не как калькулятор, а как коллегу или интерна. По мнению Ли, «хороший интерн» в облике ИИ должен обладать следующими качествами:

1.  **Активное слушание:** знать, когда задать уточняющий вопрос, чтобы не тратить время руководителя [08:00].
2.  **Память:** способность учиться на опыте, запоминать предпочтения пользователя (что нравится, а что нет) [08:12].
3.  **Управление полномочиями (Entitlements):** понимание, какие инструменты ему разрешено использовать, и умение самостоятельно обучаться работе с ними [08:25].

## 🩺 Прорыв в диагностике: агенты MAI и экономика тестов
[[JUMP:14:24]]

Особое внимание участники уделили исследованию команды MAI (Microsoft AI) в области «последовательной диагностики». В отличие от статичных тестов, здесь модель начинает работу с минимального промпта (например: «18-летняя девушка жалуется на кашель») [15:19].

Особенности механизма работы такого ИИ:

*   **Интерактивность:** модель должна сама задавать вопросы, назначать анализы и направлять к специалистам [15:34].
*   **Экономический фильтр:** в систему встроены «штрафы» за стоимость назначенных обследований. Это заставляет ИИ быть прагматичным, а не просто заказывать все возможные тесты [15:49].
*   **Эффективность:** Питер Ли подчеркнул, что согласно результатам исследования, такая система справляется с диагностикой в 4,5 раза лучше врачей-людей [16:33].

При этом Ли признает, что остаются открытые вопросы: например, как модель поведет себя с абсолютно здоровым пациентом, которому нужен просто отдых и чай, а не медицинское вмешательство [16:58].

## ✍️ Революция «Ambient Listening» и борьба с бюрократией
[[JUMP:18:19]]

Огромный пласт работы Microsoft связан с технологиями фонового прослушивания (ambient listening) и автоматического заполнения медицинских карт. Питер Ли поделился личной историей времен COVID-19: после удаления новообразования на щеке он обнаружил в своей карте запись, что процедура была необходима, так как образование мешало носить маску [18:46]. По мнению Ли, это было типичное «ап-кодинг» (завышение сложности кода услуги) для получения оплаты от страховой.

Внедрение ИИ в этот процесс (проекты EmpowerMD, Dragon Copilot) может изменить систему:

*   **Снижение нагрузки:** врачи, собиравшиеся увольняться из-за бюрократии, остаются в профессии благодаря экономии времени на документации [26:14].
*   **Контроль качества:** автоматизированные системы позволят лучше проводить аудит и мониторинг медицинских записей на уровне всей системы здравоохранения, выявляя мошенничество или ошибки [21:00].
*   **Связь с доходами:** Ли считает, что следующим шагом станет прямая интеграция ИИ-заметок с показателями качества (quality measures), что напрямую влияет на выручку клиник [21:38].

Питер Ли также выступил с критикой технологического оптимизма прошлого, отметив, что за последние 8 лет технократы и политики часто лишь увеличивали когнитивную нагрузку на врачей (например, через мандаты на стандарты данных FHIR), вместо того чтобы реально помогать им [25:19].

## 🏥 Практический кейс: неделя вместо месяцев
[[JUMP:29:35]]

Потрясающим примером эффективности генеративного ИИ стал опыт работы с Providence Health System (51 госпиталь). Ранее для сбора данных в онкологические реестры требовались усилия трех десятков медсестер, которые вручную анализировали неструктурированные заметки [28:53].

Прорыв произошел с появлением GPT-4:

*   Руководитель проекта Хойонг Пун (Hoyong Pun) изначально создал операционную систему для Providence классическими методами машинного обучения.
*   Получив доступ к GPT-4, он смог воссоздать весь этот сложный функционал всего за одну неделю [30:26].

## 🔮 Будущее медицины: два года до глобальных перемен
[[JUMP:33:16]]

Питер Ли и ведущие обсудили, станет ли использование ИИ обязательным (стандартом медицинской помощи). По мнению Ли, через несколько лет пациенты будут всерьез обеспокоены, если узнают, что их врач *не* использует ИИ в качестве «второго мнения» для снижения риска ошибок [35:08].

Прогнозы участников:

*   **Двухлетний горизонт:** В течение двух лет пациенты в технологичных центрах (таких как Стэнфорд) смогут полноценно общаться со своими медицинскими картами через порталы (например, MyChart от Epic) на естественном языке [36:26].
*   **Исчезновение специальностей:** Ли напомнил, что технологии редко уничтожают медицинские специальности (кроме френологии или кровопускания), но ИИ может изменить баланс [42:10].
*   **Возвращение универсалов:** Существует гипотеза, что «супер-интеллектуальный» ИИ позволит врачам общей практики (терапевтам) эффективно заменять узких специалистов в 50 различных областях, так как ИИ возьмет на себя хранение и обработку колоссального объема знаний [43:58].

В завершение Ли выразил осторожный оптимизм: либо ИИ поможет реализовать преимущества ранней диагностики и снизит нагрузку на систему, либо, напротив, будет находить у людей слишком много мелких отклонений, что создаст избыточное давление на и без того перегруженное здравоохранение [46:48].