# Вивек Натараджан о Med-PaLM: «Медицина требует специализации ИИ»

Источник: https://www.youtube.com/watch?v=nPBd7i5tnEE
Канал: The Cognitive Revolution
Опубликовано: 21.05.2023

---

## Революция в медицине: как Google Med-PaLM меняет стандарты диагностики [[JUMP:0:37]]

Медицинские возможности искусственного интеллекта прошли путь от случайных результатов на экзаменах до экспертного уровня всего за два с половиной года. В центре этого прорыва находится исследователь Google Вивек Натараджан, один из ведущих авторов проектов Med-PaLM и Med-PaLM2. В интервью каналу The Cognitive Revolution Натараджан подробно рассказал о технической эволюции этих моделей, методах их обучения и о том, как «отправка ИИ в медицинскую школу» может радикально изменить доступ к качественной медицине во всем мире.

### 🧠 Фундамент: от Transformers до Med-PaLM [[JUMP:4:10]]

Прогресс последних лет в области больших языковых моделей (LLM) базируется на трех ключевых столпах, которые Натараджан выделил как критически важные:

*   **Архитектура Transformer:** Представленная в 2017 году, она остается неизменной по своей сути, доказывая свою гениальность и адаптивность к современному «железу» (GPU/TPU).
*   **Масштабирование:** Успехи систем вроде GPT-3 и PaLM показали, что увеличение объема данных и вычислительных мощностей ведет к предсказуемому росту качества генерации.
*   **Выравнивание (Alignment):** Использование обучения с подкреплением на основе отзывов людей (RLHF) позволило превратить непредсказуемые модели в безопасные и полезные инструменты.

Первая модель серии, PaLM (540 млрд параметров), продемонстрировала способность превосходить среднего человека в бенчмарке Big-Bench, что стало отправной точкой для специализированных разработок. По словам Натараджана, Google использовал внутреннюю инфраструктуру для дообучения этих систем, что дало исследователям преимущество в доступе к «сырым» весам моделей, критически важному для работы в такой чувствительной области, как медицина.

### 🩺 «Обучение» в медицинской школе: софт-промптинг и fine-tuning [[JUMP:21:49]]

Одной из главных проблем ранних моделей (например, Flan-PaLM) была их неспособность эффективно применять накопленные знания в реальных клинических сценариях. Исследователи выяснили, что даже при высоких баллах на медицинских экзаменах (USMLE), модели страдали от недостатка «врачебной логики» и неумения работать с неопределенностью.

Для решения этой задачи была применена техника **софт-промптинга** (soft prompting):

1.  **Концепция:** Вместо изменения всей структуры модели (что дорого и долго), авторы обучали крошечный вспомогательный вектор (префикс), который «направлял» скрытые знания модели в нужное русло.
2.  **Эффективность:** Этот метод требовал лишь около миллиона дополнительных параметров и обучался на небольшом количестве примеров — всего несколько тысяч экспертных демонстраций.
3.  **Стиль:** Главная цель — научить ИИ не просто выдавать «правильный» ответ, а транслировать неуверенность, когда данных недостаточно, и объяснять диагноз понятным языком, подражая поведению практикующего врача.

### 📈 Med-PaLM 2: экспертный уровень и реальная ценность [[JUMP:47:07]]

С выходом модели PaLM 2 и переходом к end-to-end дообучению результаты стали еще более убедительными. На данный момент Med-PaLM 2 достигает 85% точности на вопросах типа USMLE, что соответствует уровню экспертов-врачей.

Важно, что исследователи провели глубокую проверку на «загрязнение» данных (наличие тестовых вопросов в обучающей выборке) и подтвердили: прогресс реален, а не является следствием простого запоминания.

Сравнительный анализ показал, что Med-PaLM 2 превосходит ответы врачей по 8 из 9 ключевых параметров, включая:

*   Качество доказательной базы и медицинской аргументации.
*   Понимание контекста и полноту ответа.
*   Минимизацию вероятности причинения вреда.

Однако Натараджан подчеркивает: текущие модели не готовы к полной автономии. Они остаются инструментом *аугментации* (дополнения), способным взять на себя рутинную документацию, экономя врачам время, или стать «карманным» консультантом для регионов с низким уровнем доступа к медицинской помощи.

### 🌍 Будущее: мультимодальность и доступность [[JUMP:1:02:24]]

Натараджан видит развитие медицины как мультимодальный процесс, объединяющий текстовые записи, снимки (сканы), лабораторные данные и геномику.

*   **Риски:** Главный опасение эксперта заключается в необходимости ответственной валидации перед широким развертыванием, чтобы избежать ошибок в безопасном поведении систем.
*   **Надежда:** Глобальная цель — демократизация экспертной медицины, чтобы миллиарды людей в любой точке мира могли получить качественную консультацию.

По мнению Натараджана, человечество обладает историческим опытом безопасной адаптации к технологиям двойного назначения, и он сохраняет оптимизм относительно того, что коллективная работа исследователей, политиков и врачей позволит сделать ИИ благом для глобального здравоохранения.