Вивек Натараджан о Med-PaLM: «Медицина требует специализации ИИ»

Революция в медицине: как Google Med-PaLM меняет стандарты диагностики

Медицинские возможности искусственного интеллекта прошли путь от случайных результатов на экзаменах до экспертного уровня всего за два с половиной года. В центре этого прорыва находится исследователь Google Вивек Натараджан, один из ведущих авторов проектов Med-PaLM и Med-PaLM2. В интервью каналу The Cognitive Revolution Натараджан подробно рассказал о технической эволюции этих моделей, методах их обучения и о том, как «отправка ИИ в медицинскую школу» может радикально изменить доступ к качественной медицине во всем мире.

🧠 Фундамент: от Transformers до Med-PaLM

Прогресс последних лет в области больших языковых моделей (LLM) базируется на трех ключевых столпах, которые Натараджан выделил как критически важные:

Архитектура Transformer: Представленная в 2017 году, она остается неизменной по своей сути, доказывая свою гениальность и адаптивность к современному «железу» (GPU/TPU).
Масштабирование: Успехи систем вроде GPT-3 и PaLM показали, что увеличение объема данных и вычислительных мощностей ведет к предсказуемому росту качества генерации.
Выравнивание (Alignment): Использование обучения с подкреплением на основе отзывов людей (RLHF) позволило превратить непредсказуемые модели в безопасные и полезные инструменты.

Первая модель серии, PaLM (540 млрд параметров), продемонстрировала способность превосходить среднего человека в бенчмарке Big-Bench, что стало отправной точкой для специализированных разработок. По словам Натараджана, Google использовал внутреннюю инфраструктуру для дообучения этих систем, что дало исследователям преимущество в доступе к «сырым» весам моделей, критически важному для работы в такой чувствительной области, как медицина.

🩺 «Обучение» в медицинской школе: софт-промптинг и fine-tuning

Одной из главных проблем ранних моделей (например, Flan-PaLM) была их неспособность эффективно применять накопленные знания в реальных клинических сценариях. Исследователи выяснили, что даже при высоких баллах на медицинских экзаменах (USMLE), модели страдали от недостатка «врачебной логики» и неумения работать с неопределенностью.

Для решения этой задачи была применена техника софт-промптинга (soft prompting):

Концепция: Вместо изменения всей структуры модели (что дорого и долго), авторы обучали крошечный вспомогательный вектор (префикс), который «направлял» скрытые знания модели в нужное русло.
Эффективность: Этот метод требовал лишь около миллиона дополнительных параметров и обучался на небольшом количестве примеров — всего несколько тысяч экспертных демонстраций.
Стиль: Главная цель — научить ИИ не просто выдавать «правильный» ответ, а транслировать неуверенность, когда данных недостаточно, и объяснять диагноз понятным языком, подражая поведению практикующего врача.

📈 Med-PaLM 2: экспертный уровень и реальная ценность

С выходом модели PaLM 2 и переходом к end-to-end дообучению результаты стали еще более убедительными. На данный момент Med-PaLM 2 достигает 85% точности на вопросах типа USMLE, что соответствует уровню экспертов-врачей.

Важно, что исследователи провели глубокую проверку на «загрязнение» данных (наличие тестовых вопросов в обучающей выборке) и подтвердили: прогресс реален, а не является следствием простого запоминания.

Сравнительный анализ показал, что Med-PaLM 2 превосходит ответы врачей по 8 из 9 ключевых параметров, включая:

Качество доказательной базы и медицинской аргументации.
Понимание контекста и полноту ответа.
Минимизацию вероятности причинения вреда.

Однако Натараджан подчеркивает: текущие модели не готовы к полной автономии. Они остаются инструментом аугментации (дополнения), способным взять на себя рутинную документацию, экономя врачам время, или стать «карманным» консультантом для регионов с низким уровнем доступа к медицинской помощи.

🌍 Будущее: мультимодальность и доступность

Натараджан видит развитие медицины как мультимодальный процесс, объединяющий текстовые записи, снимки (сканы), лабораторные данные и геномику.

Риски: Главный опасение эксперта заключается в необходимости ответственной валидации перед широким развертыванием, чтобы избежать ошибок в безопасном поведении систем.
Надежда: Глобальная цель — демократизация экспертной медицины, чтобы миллиарды людей в любой точке мира могли получить качественную консультацию.

По мнению Натараджана, человечество обладает историческим опытом безопасной адаптации к технологиям двойного назначения, и он сохраняет оптимизм относительно того, что коллективная работа исследователей, политиков и врачей позволит сделать ИИ благом для глобального здравоохранения.