Питер Ли из Microsoft: «Пациенты будут возмущены, если врач не использует ИИ в качестве второго мнения»

Будущее медицины уже не в простом увеличении вычислительных мощностей, а в создании «рассуждающих» агентов, способных вести диалог и учитывать экономическую целесообразность лечения. Президент Microsoft Research Питер Ли обсуждает с экспертами Stanford Online, почему ИИ-агенты превосходят врачей в диагностике и как технология ambient listening спасает систему здравоохранения от выгорания.

🤖 Новая эра ИИ: от предобучения к «времени на раздумья» 1:45

Обсуждение началось с анализа текущего состояния рынка ИИ, в частности недавнего запуска модели Grok от xAI. По данным бенчмарков, представленных в ходе дискуссии, новые модели начинают обходить GPT-4 Pro и Gemini 2.5 Pro в мультимодальных тестах . Однако Питер Ли считает, что фокус индустрии смещается: если раньше основной прорыв связывали с этапом предобучения (pre-training), то сейчас центр инноваций переместился в область постобучения и вычислений во время инференса (inference-time compute) .

Ключевые тезисы Питера Ли о развитии моделей:

Высокие ставки предобучения: Полномасштабный запуск предобучения новой модели сегодня сопоставим по рискам и стоимости с разработкой новой архитектуры кремниевого процессора .
Гибкость постобучения: Именно на этапе после основного обучения у исследователей появляется больше возможностей для внедрения инновационных идей.
Важность базы: По мнению Ли, для надежной работы «рассуждающих» парадигм (reasoning models) исходная базовая модель всё равно должна быть чрезвычайно высокого качества .

🧪 Проблема оценки: ИИ как «идеальный интерн» 5:28

Одной из главных сложностей остается оценка качества моделей. Питер Ли отметил, что индустрия страдает от «закона Гудхарта»: когда метрика становится целью, она перестает быть хорошей метрикой . В Microsoft Research разрабатывают экспериментальный подход Adele, использующий методы психометрики для оценки ИИ, что отличается от стандартных стресс-тестов на логику и знания .

Спикеры предложили оценивать ИИ не как калькулятор, а как коллегу или интерна. По мнению Ли, «хороший интерн» в облике ИИ должен обладать следующими качествами:

Активное слушание: знать, когда задать уточняющий вопрос, чтобы не тратить время руководителя .
Память: способность учиться на опыте, запоминать предпочтения пользователя (что нравится, а что нет) .
Управление полномочиями (Entitlements): понимание, какие инструменты ему разрешено использовать, и умение самостоятельно обучаться работе с ними .

🩺 Прорыв в диагностике: агенты MAI и экономика тестов 14:24

Особое внимание участники уделили исследованию команды MAI (Microsoft AI) в области «последовательной диагностики». В отличие от статичных тестов, здесь модель начинает работу с минимального промпта (например: «18-летняя девушка жалуется на кашель») .

Особенности механизма работы такого ИИ:

Интерактивность: модель должна сама задавать вопросы, назначать анализы и направлять к специалистам .
Экономический фильтр: в систему встроены «штрафы» за стоимость назначенных обследований. Это заставляет ИИ быть прагматичным, а не просто заказывать все возможные тесты .
Эффективность: Питер Ли подчеркнул, что согласно результатам исследования, такая система справляется с диагностикой в 4,5 раза лучше врачей-людей .

При этом Ли признает, что остаются открытые вопросы: например, как модель поведет себя с абсолютно здоровым пациентом, которому нужен просто отдых и чай, а не медицинское вмешательство .

✍️ Революция «Ambient Listening» и борьба с бюрократией 18:19

Огромный пласт работы Microsoft связан с технологиями фонового прослушивания (ambient listening) и автоматического заполнения медицинских карт. Питер Ли поделился личной историей времен COVID-19: после удаления новообразования на щеке он обнаружил в своей карте запись, что процедура была необходима, так как образование мешало носить маску . По мнению Ли, это было типичное «ап-кодинг» (завышение сложности кода услуги) для получения оплаты от страховой.

Внедрение ИИ в этот процесс (проекты EmpowerMD, Dragon Copilot) может изменить систему:

Снижение нагрузки: врачи, собиравшиеся увольняться из-за бюрократии, остаются в профессии благодаря экономии времени на документации .
Контроль качества: автоматизированные системы позволят лучше проводить аудит и мониторинг медицинских записей на уровне всей системы здравоохранения, выявляя мошенничество или ошибки .
Связь с доходами: Ли считает, что следующим шагом станет прямая интеграция ИИ-заметок с показателями качества (quality measures), что напрямую влияет на выручку клиник .

Питер Ли также выступил с критикой технологического оптимизма прошлого, отметив, что за последние 8 лет технократы и политики часто лишь увеличивали когнитивную нагрузку на врачей (например, через мандаты на стандарты данных FHIR), вместо того чтобы реально помогать им .

🏥 Практический кейс: неделя вместо месяцев 29:35

Потрясающим примером эффективности генеративного ИИ стал опыт работы с Providence Health System (51 госпиталь). Ранее для сбора данных в онкологические реестры требовались усилия трех десятков медсестер, которые вручную анализировали неструктурированные заметки .

Прорыв произошел с появлением GPT-4:

Руководитель проекта Хойонг Пун (Hoyong Pun) изначально создал операционную систему для Providence классическими методами машинного обучения.
Получив доступ к GPT-4, он смог воссоздать весь этот сложный функционал всего за одну неделю .

🔮 Будущее медицины: два года до глобальных перемен 33:16

Питер Ли и ведущие обсудили, станет ли использование ИИ обязательным (стандартом медицинской помощи). По мнению Ли, через несколько лет пациенты будут всерьез обеспокоены, если узнают, что их врач не использует ИИ в качестве «второго мнения» для снижения риска ошибок .

Прогнозы участников:

Двухлетний горизонт: В течение двух лет пациенты в технологичных центрах (таких как Стэнфорд) смогут полноценно общаться со своими медицинскими картами через порталы (например, MyChart от Epic) на естественном языке .
Исчезновение специальностей: Ли напомнил, что технологии редко уничтожают медицинские специальности (кроме френологии или кровопускания), но ИИ может изменить баланс .
Возвращение универсалов: Существует гипотеза, что «супер-интеллектуальный» ИИ позволит врачам общей практики (терапевтам) эффективно заменять узких специалистов в 50 различных областях, так как ИИ возьмет на себя хранение и обработку колоссального объема знаний .

В завершение Ли выразил осторожный оптимизм: либо ИИ поможет реализовать преимущества ранней диагностики и снизит нагрузку на систему, либо, напротив, будет находить у людей слишком много мелких отклонений, что создаст избыточное давление на и без того перегруженное здравоохранение .