Нил Хосла о будущем медицины: как ИИ-агенты заменяют врачебный консилиум

В новом выпуске подкаста The Cognitive Revolution ведущий Натан Лабенц обсудил будущее здравоохранения с Нилом Хослой — основателем и генеральным директором стартапа Curai Health, который привлёк более 50 миллионов долларов венчурных инвестиций. В центре дискуссии — тектонический сдвиг от медицины как «субъективного искусства» к высокоточной системе на базе искусственного интеллекта, способной масштабировать экспертные знания до нулевой маржинальной стоимости. Собеседники разбирают, как большие языковые модели меняют диагностику, почему традиционные медицинские бенчмарки стремительно устаревают и как гибридный подход «человек + ИИ» позволяет обходить жесткие регуляторные барьеры.

🧬 Истоки: Почему медицина застряла в прошлом веке 4:34

Медицинская практика на протяжении веков строилась вокруг одного ограниченного ресурса — времени, проведенного с врачом. По словам Нила Хослы, со времён Средневековья мало что изменилось: если вы богаты, вы получаете больше внимания личного врача, но сама базовая модель осталась прежней. Компьютерная революция последних 60 лет практически не затронула внутреннюю суть врачебной профессии. Хосла отмечает, что медицина, пожалуй, единственная сфера, где специалист из прошлого века смог бы сегодня адаптироваться и работать без особых проблем, ведь ключевые технологические прорывы — такие как МРТ или рентген — были внедрены ещё в 1970-х годах.

Главная проблема современной медицины, по мнению гостя, заключается в том, что она до сих пор является не точной наукой, основанной на данных, а искусством субъективного суждения. Хосла приводит результаты исследования пятилетней давности, которые демонстрируют тревожную статистику:

Лишь 11% клинических рекомендаций, по которым работают врачи, основаны на доказательствах высшего класса (Grade A).
В остальных 89% случаев рекомендации опираются лишь на консолидированное мнение экспертных панелей, а не на твердые данные.
Сами практикующие врачи следуют этим официальным рекомендациям в среднем лишь в 50% случаев.

Хосла считает парадоксальным, что в 2023 году пациенты всё ещё зависят от мнения «нескольких умных людей, которые посидели и поговорили», в то время как опыт миллионов других пациентов с аналогичными диагнозами никак не систематизируется и не используется для оптимизации лечения. Цель Curai Health — переосмыслить практику здравоохранения, поместив вычисления и данные в самый центр процесса, чтобы предоставить каждому человеку доступ к лучшим мировым знаниям в режиме 24/7.

⚡ Переломные моменты: Socratic-агенты и крах традиционных тестов 25:42

Качественным скачком для индустрии стало появление архитектуры GPT-4. Натан Лабенц поделился личным опытом «краш-теста» модели в качестве персонального терапевта и стоматолога на основе реальных историй из своей жизни: ИИ продемонстрировал результаты, практически не отличимые от квалифицированного человеческого приема. Хосла признался, что сам использует GPT-4 для получения первичных медицинских рекомендаций при спортивных травмах, так как это быстрее и проще, чем визит в клинику.

В количественном выражении ИИ уже превосходит среднего человека-эксперта. Если модель GPT-3 едва сдавала стандартный американский экзамен на получение медицинской лицензии (USMLE), то современные системы стабильно превосходят по баллам средних практикующих врачей. Более того, Curai Health недавно опубликовала научную работу, посвященную ИИ-системе под названием Dialogue Enabled Resolving Agents (диалоговые разрешающие агенты), которая показала новые рекорды на открытых медицинских вопросах без вариантов ответа.

Суть этой технологической вехи заключается в мультиагентном подходе. Вместо одного запроса к модели инженеры Curai Health разворачивают две независимые инстанции одной и той же нейросети GPT-4 с разными промптами:

«Решатель» (Decider): анализирует симптомы пациента и выдвигает гипотезы.
«Исследователь» (Researcher): выступает в роли скептика, ищет слабые места в доводах «Решателя» и заставляет его перепроверять выводы.

Этот сократический диалог между агентами позволяет извлекать глубокие скрытые знания из недр модели, значительно снижая риск ошибок и галлюцинаций. Подобный подход увеличивает объем вычислений прямо в момент выполнения запроса (at runtime), напоминая принципы работы шахматного суперкомпьютера Deep Blue, который побеждал человека за счет глубокого просчета вариантов на ходу, а не только за счет предварительного обучения.

⚠️ Ошибки и вызовы: Иллюзия «баз данных» и провал медицинских бенчмарков 31:48

Одним из главных заблуждений технологических компаний Хосла называет веру в то, что владение большими массивами проприетарных данных (например, показаниями фитнес-трекеров или глюкометров) создает непреодолимый защитный барьер («ров») для бизнеса. На практике современные LLM оказались феноменальными учениками, способными обобщать концепты на основе всего нескольких примеров (few-shot learning). Обладание миллионом специфических дата-поиforceнтов теряет ценность, если конкурент может разметить тысячу примеров и получить 95% от вашей точности.

Критике подверглась и сама методология тестирования ИИ. Оценка моделей по тестам с множественным выбором (выбор одного варианта из пяти) не отражает реальность. В настоящей практике перед врачом никогда нет готового списка ответов — к нему приходит «грязный», запутанный пациент, чьи симптомы развиваются во времени. Медицинский случай — это динамический процесс, где первоначальный дифференциальный диагноз постоянно корректируется по мере поступления новых данных.

Среди ключевых технологических и операционных вызовов команда Curai выделяет следующие:

Ограничение контекстного окна: данные долгосрочного анамнеза пациента быстро переполняют память модели, что требует создания умных систем индексации и извлечения данных на лету.
Безопасность и ментальное здоровье: Хосла упомянул трагический прецедент из новостей, когда нестабильный пациент покончил с собой после общения с коммерческим чат-ботом, что накладывает на разработчиков строжайшие обязательства по созданию жестких защитных «лесов» (scaffolding) вокруг моделей.
Регрессионное тестирование: в отличие от традиционного софта, ИИ недетерминирован. Curai Health пришлось разработать сложнейшие внутренние пакеты юнит-тестов, чтобы гарантировать, что после очередного обновления или дообучения модель не начнет ошибаться в тех диагнозах, которые вчера ставила идеально.

🎓 Главные уроки: Сила генерализации против узкопрофильных моделей 48:37

Важнейший концептуальный урок, который извлекла команда разработчиков: обобщенные («широкие») языковые модели в медицине работают эффективнее, чем специализированные медицинские ИИ. Причина кроется в том, что человеческий организм не существует в вакууме, и для качественной диагностики системе необходима глубокая модель реального физического мира.

Нил Хосла привел показательный клинический пример из практики Curai Health: в систему обратился пациент с острой болью в легких, который упомянул, что недавно вернулся с фестиваля Burning Man. Специализированная медицинская модель, обученная исключительно на академических статьях и картах болезней, не сможет сопоставить этот факт с диагнозом. В то же время универсальная модель вроде GPT-4 «понимает», что Burning Man проходит в пустыне Невады, где бушуют песчаные бури, и мгновенно выдвигает верную гипотезу: физическое повреждение легких мелкодисперсной пылью или редкая пустынная грибковая инфекция.

Аналогичная ситуация наблюдается с интерпретацией данных непрерывного мониторинга глюкозы (CGM). Без специальной предварительной подготовки GPT-4 оказалась способна анализировать временные ряды графиков сахара в крови, сопоставляя их со временем приема пищи и заявляя, например, что скачок до 170 мг/дл в 13:00 указывает на избыток углеводов в обеде. Модель смогла генерализовать свои текстовые знания о метаболизме на абсолютно незнакомый тип данных.

🚀 Текущий этап: Гибридная медицина и штурм корпоративного рынка 1:00:08

На текущем этапе Curai Health развивает два направления. Первое — это классическое B2C-приложение с подпиской за 14,99 долларов в месяц, где пользователь получает безлимитный доступ к медицинской помощи. Однако основной фокус компании сместился на Enterprise-рынок: партнерство с крупными страховыми планами и традиционными сетями здравоохранения.

По оценке Хослы, «джинн уже выпущен из бутылки», и в ближайшие три года большинство пациентов в мире будут начинать самодиагностику не с поиска в Google, а с запросов в ChatGPT. Чтобы этот тренд не привел к опасной бесконтрольной самодеятельности, Curai Health предлагает крупным провайдерам (таким как Stanford Healthcare) интеграцию своих систем. Гибридная воронка выглядит так:

Пациент открывает приложение клиники и попадает в чат, где ИИ берет на себя 80% рутинной работы: собирает анамнез, задает уточняющие вопросы и проводит первичный триаж.
Оставшиеся 20% задач (финальное утверждение диагноза, выписка рецептурных препаратов, направление на анализы) выполняет лицензированный врач-человек, для которого ИИ-ассистент уже подготовил выжимку дела и проект плана лечения.

Такой подход решает проблему HIPAA-комплаенса (американский закон о защите медицинских данных), поскольку «чистые» коммерческие LLM из коробки не соответствуют этим стандартам безопасности.

Говоря о долгосрочном будущем и регуляторике, Хосла заявляет, что пока ИИ работает под надзором человека, его нужно классифицировать как систему поддержки принятия решений. Для перехода к полной автономии ИИ должен будет пройти жесткую сертификацию FDA по аналогии с уже одобренной системой IDx-DR, которая самостоятельно диагностирует диабетическую ретинопатию по снимкам глазного дна. Хосла убежден, что ИИ способен в корне перевернуть кривую спроса и предложения в медицине, открыв путь к эпохе постиндустриального изобилия.