Грэм Уокер: «ИИ заставит нас перестать зубрить цикл Кребса в медвузах»

В новом выпуске серии «AI Water Cooler» от Stanford Online эксперты обсуждают стремительную трансформацию здравоохранения под влиянием больших языковых моделей. Грэм Уокер из Kaiser Permanente вместе с коллегами из Стэнфорда и Microsoft анализирует, почему врачи массово переходят на использование ИИ, несмотря на сохраняющийся риск галлюцинаций, и как технологии заставляют пересматривать десятилетние традиции медицинского образования.

🦄 Эволюция моделей: от «единорогов» до борьбы с галлюцинациями 2:27

Обсуждение началось с анализа возможностей новейших итераций нейросетей, в частности GPT-4.5. Мэттью Лундгрен напомнил о знаменитом тесте «единорога TikZ» из работы Себастьяна Бубека «Sparks of AGI» . Если первая версия GPT-4 выдавала лишь отдаленно напоминающее животное изображение, то современные модели справляются с визуализацией гораздо точнее, хотя технически остаются текстовыми процессорами .

Ключевые технические выводы участников:

Насыщение бенчмарков: Мэттью Лундгрен отмечает, что мы больше не видим гигантских скачков в производительности, как это было при переходе от GPT-3.5 к GPT-4 . Улучшения становятся инкрементальными, так как модели приближаются к потолку существующих тестов.
Снижение уровня галлюцинаций: По данным, представленным Лундгреном, уровень ошибок (галлюцинаций) в специализированных наборах данных, таких как SimpleQA, снижается, что позволяет инженерам строить меньше «вспомогательных лесов» (scaffolding) вокруг приложений .
Скепсис практиков: Грэм Уокер выразил удивление тем, что уровень галлюцинаций в некоторых тестах все еще достигает 37% . По его мнению, люди начинают доверять ИИ не потому, что он стал идеальным, а потому, что его ответы достигли «приемлемого порога» для человеческого восприятия.
Проблема «AI-ответов» в поиске: Уокер критикует Google за встраивание ИИ-ответов непосредственно в поисковую выдачу . Он отмечает, что пользователи (и даже врачи) часто не отличают проверенный факт с государственного сайта (например, census.gov) от сгенерированного нейросетью текста, принимая последний на веру без верификации .

🛠 Паралич выбора и специализация инструментов 6:39

Современный рынок ИИ-инструментов напоминает эпоху раннего интернета с десятками поисковиков вроде AltaVista и Ask Jeeves . Сегодня врачи сталкиваются с «параличом выбора» из-за обилия моделей (GPT-4.5, Claude 3.7, DeepSeek), обновляющихся каждые несколько недель .

Грэм Уокер поделился своим набором инструментов, за который приходится платить около $300 в месяц в виде подписок :

ChatGPT: Используется для генерации уникальных идей и первичных черновиков. Уокер иронично называет его ответы «комплиментом с подвохом», так как модель часто переписывает текст автора полностью, считая свой вариант лучше .
Claude: Предпочтителен для редактирования. В отличие от ChatGPT, Claude бережнее относится к авторскому слогу, очищая его и делая более связным без радикальных изменений .
DeepSeek: По наблюдениям Уокера, эта открытая модель позволяет пользователю «больше вольностей» и меньше ограничена этическими фильтрами. Например, она легче соглашается обсуждать потенциально опасные сценарии поведения по сравнению с закрытыми моделями OpenAI или Anthropic .

Мэттью Лундгрен добавил, что новые возможности глубокого исследования (Deep Research) в моделях становятся «геймчейнджером», когда ИИ получает доступ к медицинским библиотекам и научным журналам .

🏥 Теневое внедрение: 2/3 врачей уже используют ИИ 17:54

Согласно данным опроса Американской медицинской ассоциации (AMA), использование ИИ в клинической практике продемонстрировало взрывной рост. Если ранее только треть врачей проявляла интерес к технологии, то теперь две трети (2/3) признаются, что используют ИИ в работе .

Особенности этого внедрения:

Отсутствие официального доступа: Большинство медицинских организаций до сих пор не предоставили сотрудникам корпоративные инструменты ИИ . Врачи используют личные смартфоны для работы с моделями.
OpenEvidence против UpToDate: Стартап OpenEvidence, недавно привлекший значительное финансирование, уже заявляет о том, что его инструментами пользуются 25% врачей . Это прямой конкурент классического справочника UpToDate, позволяющий задавать открытые вопросы и получать ответы со ссылками на реальные исследования .
Риски «фрагментарных» данных: Грэм Уокер предупреждает, что ИИ может выдать верный ответ для абстрактного пациента, но критически ошибиться в частном случае — например, при лечении беременной женщины или ребенка . Модель может не учесть нюансы, которые врач-человек считывает мгновенно.

Грэм Уокер полагает, что такая быстрая адаптация в США вызвана «дисфункциональностью системы здравоохранения» . Врачи настолько перегружены административной работой и оформлением страховых разрешений (prior auth), что готовы использовать любой инструмент, способный сэкономить время .

🎓 Реформа образования и «скилл-атрофия» 28:00

ИИ ставит под вопрос саму структуру медицинского образования. Собеседники сошлись во мнении, что традиция заучивания огромных объемов данных изживает себя.

Аргументы Грэма Уокера против академического консерватизма:

Цикл Кребса и плечевое сплетение: Уокер задается вопросом, зачем современному врачу детально помнить все ходы цикла Кребса или переплетения нервов в плечевом сплетении, если эта информация доступна мгновенно . «Важно знать, что цикл Кребса существует, так как передозировка аспирина блокирует окислительное фосфорилирование, но нужно ли помнить всю схему?» .
Раздувание учебников: Пособие First Aid для экзамена Step 1 сейчас в два раза толще, чем было в 2004 году . Нагрузка на память студентов стала запредельной и, по мнению Уокера, нерациональной.

Мэттью Лундгрен, однако, выразил опасение по поводу «атрофии навыков» . Он привел аналогию с GPS: спустя 20 лет использования навигаторов многие люди не могут сориентироваться даже в собственном районе без карты . Существует риск, что врачи потеряют способность обрабатывать сложные концепции, если полностью переложат когнитивную нагрузку на модели.

💊 Будущее: может ли ИИ выписывать рецепты? 32:41

Одной из самых горячих тем обсуждения стал законопроект, предлагающий разрешить ИИ-моделям самостоятельно выписывать рецепты на лекарства .

Позиции участников разделились между осторожностью и признанием реальности:

Мэттью Лундгрен считает, что закон вряд ли будет принят в ближайшее время, но видит в нем сигнал о достижении «зазубренного края» (jagged frontier) — момента, когда возможности ИИ начинают напрямую влиять на реальный мир с огромными юридическими последствиями .
Грэм Уокер отмечает лицемерие текущей системы: в телемедицинских компаниях врачи часто просто «прокликивают» чекбоксы, подготовленные алгоритмом, за считанные секунды . Человеческого труда в такой выписке рецепта минимум, но страховые компании платят за это большие деньги.
Альтернативное решение: Уокер предлагает лицензировать не только отдельных врачей, но и больницы как организации. «Пусть больница берет на себя риск и использует ИИ для выдачи лекарств под свою ответственность» .

В завершение беседы эксперты подчеркнули, что главная ценность ИИ сейчас — не в замене врача, а в роли «эмпатичного коуча» или виртуального фармацевта, который может проверить список лекарств в реальном времени во время обхода в реанимации .