# Грэм Уокер: «ИИ заставит нас перестать зубрить цикл Кребса в медвузах»

Источник: https://www.youtube.com/watch?v=TC64U_rzEuI
Канал: Stanford Online
Опубликовано: 27.03.2025

---

В новом выпуске серии «AI Water Cooler» от Stanford Online эксперты обсуждают стремительную трансформацию здравоохранения под влиянием больших языковых моделей. Грэм Уокер из Kaiser Permanente вместе с коллегами из Стэнфорда и Microsoft анализирует, почему врачи массово переходят на использование ИИ, несмотря на сохраняющийся риск галлюцинаций, и как технологии заставляют пересматривать десятилетние традиции медицинского образования.

## 🦄 Эволюция моделей: от «единорогов» до борьбы с галлюцинациями
[[JUMP:02:27]]

Обсуждение началось с анализа возможностей новейших итераций нейросетей, в частности GPT-4.5. Мэттью Лундгрен напомнил о знаменитом тесте «единорога TikZ» из работы Себастьяна Бубека «Sparks of AGI» [02:40]. Если первая версия GPT-4 выдавала лишь отдаленно напоминающее животное изображение, то современные модели справляются с визуализацией гораздо точнее, хотя технически остаются текстовыми процессорами [02:53].

Ключевые технические выводы участников:

*   **Насыщение бенчмарков:** Мэттью Лундгрен отмечает, что мы больше не видим гигантских скачков в производительности, как это было при переходе от GPT-3.5 к GPT-4 [03:21]. Улучшения становятся инкрементальными, так как модели приближаются к потолку существующих тестов.
*   **Снижение уровня галлюцинаций:** По данным, представленным Лундгреном, уровень ошибок (галлюцинаций) в специализированных наборах данных, таких как SimpleQA, снижается, что позволяет инженерам строить меньше «вспомогательных лесов» (scaffolding) вокруг приложений [04:01].
*   **Скепсис практиков:** Грэм Уокер выразил удивление тем, что уровень галлюцинаций в некоторых тестах все еще достигает 37% [04:28]. По его мнению, люди начинают доверять ИИ не потому, что он стал идеальным, а потому, что его ответы достигли «приемлемого порога» для человеческого восприятия.
*   **Проблема «AI-ответов» в поиске:** Уокер критикует Google за встраивание ИИ-ответов непосредственно в поисковую выдачу [05:09]. Он отмечает, что пользователи (и даже врачи) часто не отличают проверенный факт с государственного сайта (например, census.gov) от сгенерированного нейросетью текста, принимая последний на веру без верификации [05:23].

## 🛠 Паралич выбора и специализация инструментов
[[JUMP:06:39]]

Современный рынок ИИ-инструментов напоминает эпоху раннего интернета с десятками поисковиков вроде AltaVista и Ask Jeeves [07:08]. Сегодня врачи сталкиваются с «параличом выбора» из-за обилия моделей (GPT-4.5, Claude 3.7, DeepSeek), обновляющихся каждые несколько недель [07:34].

Грэм Уокер поделился своим набором инструментов, за который приходится платить около $300 в месяц в виде подписок [08:14]:

1.  **ChatGPT:** Используется для генерации уникальных идей и первичных черновиков. Уокер иронично называет его ответы «комплиментом с подвохом», так как модель часто переписывает текст автора полностью, считая свой вариант лучше [08:57].
2.  **Claude:** Предпочтителен для редактирования. В отличие от ChatGPT, Claude бережнее относится к авторскому слогу, очищая его и делая более связным без радикальных изменений [09:13].
3.  **DeepSeek:** По наблюдениям Уокера, эта открытая модель позволяет пользователю «больше вольностей» и меньше ограничена этическими фильтрами. Например, она легче соглашается обсуждать потенциально опасные сценарии поведения по сравнению с закрытыми моделями OpenAI или Anthropic [09:41].

Мэттью Лундгрен добавил, что новые возможности глубокого исследования (Deep Research) в моделях становятся «геймчейнджером», когда ИИ получает доступ к медицинским библиотекам и научным журналам [11:39].

## 🏥 Теневое внедрение: 2/3 врачей уже используют ИИ
[[JUMP:17:54]]

Согласно данным опроса Американской медицинской ассоциации (AMA), использование ИИ в клинической практике продемонстрировало взрывной рост. Если ранее только треть врачей проявляла интерес к технологии, то теперь две трети (2/3) признаются, что используют ИИ в работе [18:23].

Особенности этого внедрения:

*   **Отсутствие официального доступа:** Большинство медицинских организаций до сих пор не предоставили сотрудникам корпоративные инструменты ИИ [18:37]. Врачи используют личные смартфоны для работы с моделями.
*   **OpenEvidence против UpToDate:** Стартап OpenEvidence, недавно привлекший значительное финансирование, уже заявляет о том, что его инструментами пользуются 25% врачей [12:21]. Это прямой конкурент классического справочника UpToDate, позволяющий задавать открытые вопросы и получать ответы со ссылками на реальные исследования [12:35].
*   **Риски «фрагментарных» данных:** Грэм Уокер предупреждает, что ИИ может выдать верный ответ для абстрактного пациента, но критически ошибиться в частном случае — например, при лечении беременной женщины или ребенка [14:45]. Модель может не учесть нюансы, которые врач-человек считывает мгновенно.

Грэм Уокер полагает, что такая быстрая адаптация в США вызвана «дисфункциональностью системы здравоохранения» [18:51]. Врачи настолько перегружены административной работой и оформлением страховых разрешений (prior auth), что готовы использовать любой инструмент, способный сэкономить время [19:07].

## 🎓 Реформа образования и «скилл-атрофия»
[[JUMP:28:00]]

ИИ ставит под вопрос саму структуру медицинского образования. Собеседники сошлись во мнении, что традиция заучивания огромных объемов данных изживает себя.

Аргументы Грэма Уокера против академического консерватизма:

*   **Цикл Кребса и плечевое сплетение:** Уокер задается вопросом, зачем современному врачу детально помнить все ходы цикла Кребса или переплетения нервов в плечевом сплетении, если эта информация доступна мгновенно [29:30]. «Важно знать, что цикл Кребса существует, так как передозировка аспирина блокирует окислительное фосфорилирование, но нужно ли помнить всю схему?» [30:34].
*   **Раздувание учебников:** Пособие First Aid для экзамена Step 1 сейчас в два раза толще, чем было в 2004 году [29:57]. Нагрузка на память студентов стала запредельной и, по мнению Уокера, нерациональной.

Мэттью Лундгрен, однако, выразил опасение по поводу «атрофии навыков» [31:27]. Он привел аналогию с GPS: спустя 20 лет использования навигаторов многие люди не могут сориентироваться даже в собственном районе без карты [31:39]. Существует риск, что врачи потеряют способность обрабатывать сложные концепции, если полностью переложат когнитивную нагрузку на модели.

## 💊 Будущее: может ли ИИ выписывать рецепты?
[[JUMP:32:41]]

Одной из самых горячих тем обсуждения стал законопроект, предлагающий разрешить ИИ-моделям самостоятельно выписывать рецепты на лекарства [32:53].

Позиции участников разделились между осторожностью и признанием реальности:

*   **Мэттью Лундгрен** считает, что закон вряд ли будет принят в ближайшее время, но видит в нем сигнал о достижении «зазубренного края» (jagged frontier) — момента, когда возможности ИИ начинают напрямую влиять на реальный мир с огромными юридическими последствиями [34:03].
*   **Грэм Уокер** отмечает лицемерие текущей системы: в телемедицинских компаниях врачи часто просто «прокликивают» чекбоксы, подготовленные алгоритмом, за считанные секунды [35:09]. Человеческого труда в такой выписке рецепта минимум, но страховые компании платят за это большие деньги.
*   **Альтернативное решение:** Уокер предлагает лицензировать не только отдельных врачей, но и больницы как организации. «Пусть больница берет на себя риск и использует ИИ для выдачи лекарств под свою ответственность» [34:43].

В завершение беседы эксперты подчеркнули, что главная ценность ИИ сейчас — не в замене врача, а в роли «эмпатичного коуча» или виртуального фармацевта, который может проверить список лекарств в реальном времени во время обхода в реанимации [21:21].