В новом выпуске серии «AI Water Cooler» от Stanford Online эксперты обсуждают стремительную трансформацию здравоохранения под влиянием больших языковых моделей. Грэм Уокер из Kaiser Permanente вместе с коллегами из Стэнфорда и Microsoft анализирует, почему врачи массово переходят на использование ИИ, несмотря на сохраняющийся риск галлюцинаций, и как технологии заставляют пересматривать десятилетние традиции медицинского образования.
🦄 Эволюция моделей: от «единорогов» до борьбы с галлюцинациями 2:27
Обсуждение началось с анализа возможностей новейших итераций нейросетей, в частности GPT-4.5. Мэттью Лундгрен напомнил о знаменитом тесте «единорога TikZ» из работы Себастьяна Бубека «Sparks of AGI» . Если первая версия GPT-4 выдавала лишь отдаленно напоминающее животное изображение, то современные модели справляются с визуализацией гораздо точнее, хотя технически остаются текстовыми процессорами .
Ключевые технические выводы участников:
- Насыщение бенчмарков: Мэттью Лундгрен отмечает, что мы больше не видим гигантских скачков в производительности, как это было при переходе от GPT-3.5 к GPT-4 . Улучшения становятся инкрементальными, так как модели приближаются к потолку существующих тестов.
- Снижение уровня галлюцинаций: По данным, представленным Лундгреном, уровень ошибок (галлюцинаций) в специализированных наборах данных, таких как SimpleQA, снижается, что позволяет инженерам строить меньше «вспомогательных лесов» (scaffolding) вокруг приложений .
- Скепсис практиков: Грэм Уокер выразил удивление тем, что уровень галлюцинаций в некоторых тестах все еще достигает 37% . По его мнению, люди начинают доверять ИИ не потому, что он стал идеальным, а потому, что его ответы достигли «приемлемого порога» для человеческого восприятия.
- Проблема «AI-ответов» в поиске: Уокер критикует Google за встраивание ИИ-ответов непосредственно в поисковую выдачу . Он отмечает, что пользователи (и даже врачи) часто не отличают проверенный факт с государственного сайта (например, census.gov) от сгенерированного нейросетью текста, принимая последний на веру без верификации .
🛠 Паралич выбора и специализация инструментов 6:39
Современный рынок ИИ-инструментов напоминает эпоху раннего интернета с десятками поисковиков вроде AltaVista и Ask Jeeves . Сегодня врачи сталкиваются с «параличом выбора» из-за обилия моделей (GPT-4.5, Claude 3.7, DeepSeek), обновляющихся каждые несколько недель .
Грэм Уокер поделился своим набором инструментов, за который приходится платить около $300 в месяц в виде подписок :
- ChatGPT: Используется для генерации уникальных идей и первичных черновиков. Уокер иронично называет его ответы «комплиментом с подвохом», так как модель часто переписывает текст автора полностью, считая свой вариант лучше .
- Claude: Предпочтителен для редактирования. В отличие от ChatGPT, Claude бережнее относится к авторскому слогу, очищая его и делая более связным без радикальных изменений .
- DeepSeek: По наблюдениям Уокера, эта открытая модель позволяет пользователю «больше вольностей» и меньше ограничена этическими фильтрами. Например, она легче соглашается обсуждать потенциально опасные сценарии поведения по сравнению с закрытыми моделями OpenAI или Anthropic .
Мэттью Лундгрен добавил, что новые возможности глубокого исследования (Deep Research) в моделях становятся «геймчейнджером», когда ИИ получает доступ к медицинским библиотекам и научным журналам .
🏥 Теневое внедрение: 2/3 врачей уже используют ИИ 17:54
Согласно данным опроса Американской медицинской ассоциации (AMA), использование ИИ в клинической практике продемонстрировало взрывной рост. Если ранее только треть врачей проявляла интерес к технологии, то теперь две трети (2/3) признаются, что используют ИИ в работе .
Особенности этого внедрения:
- Отсутствие официального доступа: Большинство медицинских организаций до сих пор не предоставили сотрудникам корпоративные инструменты ИИ . Врачи используют личные смартфоны для работы с моделями.
- OpenEvidence против UpToDate: Стартап OpenEvidence, недавно привлекший значительное финансирование, уже заявляет о том, что его инструментами пользуются 25% врачей . Это прямой конкурент классического справочника UpToDate, позволяющий задавать открытые вопросы и получать ответы со ссылками на реальные исследования .
- Риски «фрагментарных» данных: Грэм Уокер предупреждает, что ИИ может выдать верный ответ для абстрактного пациента, но критически ошибиться в частном случае — например, при лечении беременной женщины или ребенка . Модель может не учесть нюансы, которые врач-человек считывает мгновенно.
Грэм Уокер полагает, что такая быстрая адаптация в США вызвана «дисфункциональностью системы здравоохранения» . Врачи настолько перегружены административной работой и оформлением страховых разрешений (prior auth), что готовы использовать любой инструмент, способный сэкономить время .
🎓 Реформа образования и «скилл-атрофия» 28:00
ИИ ставит под вопрос саму структуру медицинского образования. Собеседники сошлись во мнении, что традиция заучивания огромных объемов данных изживает себя.
Аргументы Грэма Уокера против академического консерватизма:
- Цикл Кребса и плечевое сплетение: Уокер задается вопросом, зачем современному врачу детально помнить все ходы цикла Кребса или переплетения нервов в плечевом сплетении, если эта информация доступна мгновенно . «Важно знать, что цикл Кребса существует, так как передозировка аспирина блокирует окислительное фосфорилирование, но нужно ли помнить всю схему?» .
- Раздувание учебников: Пособие First Aid для экзамена Step 1 сейчас в два раза толще, чем было в 2004 году . Нагрузка на память студентов стала запредельной и, по мнению Уокера, нерациональной.
Мэттью Лундгрен, однако, выразил опасение по поводу «атрофии навыков» . Он привел аналогию с GPS: спустя 20 лет использования навигаторов многие люди не могут сориентироваться даже в собственном районе без карты . Существует риск, что врачи потеряют способность обрабатывать сложные концепции, если полностью переложат когнитивную нагрузку на модели.
💊 Будущее: может ли ИИ выписывать рецепты? 32:41
Одной из самых горячих тем обсуждения стал законопроект, предлагающий разрешить ИИ-моделям самостоятельно выписывать рецепты на лекарства .
Позиции участников разделились между осторожностью и признанием реальности:
- Мэттью Лундгрен считает, что закон вряд ли будет принят в ближайшее время, но видит в нем сигнал о достижении «зазубренного края» (jagged frontier) — момента, когда возможности ИИ начинают напрямую влиять на реальный мир с огромными юридическими последствиями .
- Грэм Уокер отмечает лицемерие текущей системы: в телемедицинских компаниях врачи часто просто «прокликивают» чекбоксы, подготовленные алгоритмом, за считанные секунды . Человеческого труда в такой выписке рецепта минимум, но страховые компании платят за это большие деньги.
- Альтернативное решение: Уокер предлагает лицензировать не только отдельных врачей, но и больницы как организации. «Пусть больница берет на себя риск и использует ИИ для выдачи лекарств под свою ответственность» .
В завершение беседы эксперты подчеркнули, что главная ценность ИИ сейчас — не в замене врача, а в роли «эмпатичного коуча» или виртуального фармацевта, который может проверить список лекарств в реальном времени во время обхода в реанимации .