Вивек Натараджан о Med-PaLM: «Медицина требует специализации ИИ»

The Cognitive Revolution 3,9 тыс. 1 ч 25 мин 3 мин 21.05.2023
Главное

Революция в медицине: как Google Med-PaLM меняет стандарты диагностики

Медицинские возможности искусственного интеллекта прошли путь от случайных результатов на экзаменах до экспертного уровня всего за два с половиной года. В центре этого прорыва находится исследователь Google Вивек Натараджан, один из ведущих авторов проектов Med-PaLM и Med-PaLM2. В интервью каналу The Cognitive Revolution Натараджан подробно рассказал о технической эволюции этих моделей, методах их обучения и о том, как «отправка ИИ в медицинскую школу» может радикально изменить доступ к качественной медицине во всем мире.

🧠 Фундамент: от Transformers до Med-PaLM

Прогресс последних лет в области больших языковых моделей (LLM) базируется на трех ключевых столпах, которые Натараджан выделил как критически важные:

Первая модель серии, PaLM (540 млрд параметров), продемонстрировала способность превосходить среднего человека в бенчмарке Big-Bench, что стало отправной точкой для специализированных разработок. По словам Натараджана, Google использовал внутреннюю инфраструктуру для дообучения этих систем, что дало исследователям преимущество в доступе к «сырым» весам моделей, критически важному для работы в такой чувствительной области, как медицина.

🩺 «Обучение» в медицинской школе: софт-промптинг и fine-tuning

Одной из главных проблем ранних моделей (например, Flan-PaLM) была их неспособность эффективно применять накопленные знания в реальных клинических сценариях. Исследователи выяснили, что даже при высоких баллах на медицинских экзаменах (USMLE), модели страдали от недостатка «врачебной логики» и неумения работать с неопределенностью.

Для решения этой задачи была применена техника софт-промптинга (soft prompting):

  1. Концепция: Вместо изменения всей структуры модели (что дорого и долго), авторы обучали крошечный вспомогательный вектор (префикс), который «направлял» скрытые знания модели в нужное русло.
  2. Эффективность: Этот метод требовал лишь около миллиона дополнительных параметров и обучался на небольшом количестве примеров — всего несколько тысяч экспертных демонстраций.
  3. Стиль: Главная цель — научить ИИ не просто выдавать «правильный» ответ, а транслировать неуверенность, когда данных недостаточно, и объяснять диагноз понятным языком, подражая поведению практикующего врача.

📈 Med-PaLM 2: экспертный уровень и реальная ценность

С выходом модели PaLM 2 и переходом к end-to-end дообучению результаты стали еще более убедительными. На данный момент Med-PaLM 2 достигает 85% точности на вопросах типа USMLE, что соответствует уровню экспертов-врачей.

Важно, что исследователи провели глубокую проверку на «загрязнение» данных (наличие тестовых вопросов в обучающей выборке) и подтвердили: прогресс реален, а не является следствием простого запоминания.

Сравнительный анализ показал, что Med-PaLM 2 превосходит ответы врачей по 8 из 9 ключевых параметров, включая:

Однако Натараджан подчеркивает: текущие модели не готовы к полной автономии. Они остаются инструментом аугментации (дополнения), способным взять на себя рутинную документацию, экономя врачам время, или стать «карманным» консультантом для регионов с низким уровнем доступа к медицинской помощи.

🌍 Будущее: мультимодальность и доступность

Натараджан видит развитие медицины как мультимодальный процесс, объединяющий текстовые записи, снимки (сканы), лабораторные данные и геномику.

По мнению Натараджана, человечество обладает историческим опытом безопасной адаптации к технологиям двойного назначения, и он сохраняет оптимизм относительно того, что коллективная работа исследователей, политиков и врачей позволит сделать ИИ благом для глобального здравоохранения.

💬 Цитаты

«Мы можем реалистично начать думать о том, как поместить карманного врача мирового класса в карманы миллионов людей по всему миру.»

Вивек Натараджан 41:34

«Это не значит, что модели могут быть выпущены автономно — вам по-прежнему нужны экспертный надзор и оценка.»

Вивек Натараджан 58:13
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Софт-промптинг
Метод адаптации нейросети через обучение небольшого вспомогательного вектора параметров при полной заморозке весов основной модели.
USMLE
Серия медицинских экзаменов, необходимых для получения лицензии на практику врача в США.
RLHF
Метод обучения с подкреплением на основе предпочтений людей, помогающий модели лучше соответствовать ожиданиям пользователя.
📊 Цифры
🗓 Хронология
  1. 2017 Выход ключевой статьи об архитектуре Transformer.
  2. Апрель 2022 Публикация первой статьи по модели PaLM.
  3. Декабрь 2022 Публикация статьи по модели Med-PaLM.
  4. Май 2023 Анонс Med-PaLM 2 и коммерциализация API.
⚖️ Другая сторона
Биология и медицина Google Med-PaLM 2 Vivek Natarajan USMLE RLHF