Генеративный ИИ в медицине: как работают большие языковые модели

Stanford Online 39,9 тыс. 58 мин 3 мин 30.04.2025
Главное

Генеративный ИИ в здравоохранении: как работают большие языковые модели 0:11

В последние годы искусственный интеллект совершил стремительный переход от футуристической концепции к инструменту, трансформирующему систему здравоохранения. По мнению докторов и клинических информатиков из Стэнфорда, авторов обучающего курса, понимание фундаментальных принципов работы больших языковых моделей (LLM) является ключом к их эффективному и безопасному внедрению в клиническую практику. Несмотря на обилие технической литературы, врачам часто не хватает доступных образовательных ресурсов, что и побудило специалистов создать данный обзор, ориентированный на профессионалов медицины, а не на дата-сайентистов.

Три эпохи ИИ в здравоохранении 6:57

Согласно концепции «трех эпох ИИ в здравоохранении», предложенной Майклом Хауэллом и Карен Де Сальво (Google), развитие технологий можно разделить на три этапа, каждый из которых обладает уникальными характеристиками:

  1. Эпоха 1 (с 1970-х): Символьный ИИ и вероятностные модели. Это «правилоориентированный» ИИ, работающий на логике «если — то». Примерами служат ассистент Clippy в Microsoft Word, налоговые калькуляторы и большинство систем поддержки принятия клинических решений, используемых в современных электронных медицинских картах (EHR). Эти модели не обучаются на новых данных и являются жестко закодированными.
  2. Эпоха 2 (с 2010-х): Машинное обучение и глубокое обучение. Основано на поиске паттернов в огромных массивах данных. Сюда относятся системы распознавания лиц, беспилотные автомобили (Tesla, Waymo) и медицинские инструменты, такие как автоматическое обнаружение STEMI на ЭКГ или анализ радиологических изображений. Такие модели часто называют «черными ящиками», так как трудно отследить причинно-следственную связь между вводом и результатом.
  3. Эпоха 3 (с 2017 г., публично с 2022 г.): Большие языковые модели (LLM). Модели общего назначения, способные генерировать новый контент и работать с неструктурированными данными. В медицине они применяются для суммаризации записей, составления ответов на сообщения и амбиентного диктования.

Анатомия LLM: как машины «думают» 17:43

В основе современных моделей лежит архитектура Transformer с механизмом self-attention (самовнимание), который позволяет модели динамически учитывать контекст всей фразы, а не просто предсказывать следующее слово.

Важно понимать, что модель не планирует ответ заранее. Она «думает», создавая текст токен за токеном, поэтому для сложных задач эффективно использовать методы, побуждающие модель рассуждать пошагово (Chain of Thought).

Эволюция обучения моделей: от GPT-1 до наших дней 34:54

Развитие моделей OpenAI демонстрирует важность масштабирования:

Новая эра: масштабирование времени вычислений 49:33

По мнению экспертов, традиционное предобучение на интернете достигает своего предела из-за нехватки качественных данных. Новым трендом является test-time scaling (масштабирование вычислительных мощностей во время вывода): модель тратит больше ресурсов на «размышление» перед тем, как выдать ответ.

Это наглядно демонстрируют модели серии OpenAI o1, которые показывают выдающиеся результаты на тестах, требующих реального рассуждения, в отличие от простых бенчмарков, где модели могли полагаться на запоминание паттернов. Как отметил Сэм Альтман, будущее лежит в оптимизации рассуждений в процессе работы модели, а не только в увеличении размера предобученной модели.

💬 Цитаты

«Модель не планирует ответ заранее. Она не думает и потом говорит. Она думает, говоря.»

«Будущее — это масштабирование и оптимизация логических рассуждений в процессе вывода.»

👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Эмбеддинг
Математическое представление слова в виде вектора чисел, отражающее его смысловые связи.
RLHF
Обучение с подкреплением на основе отзывов людей, используемое для настройки поведения ИИ.
Трансформер
Архитектура нейронных сетей, лежащая в основе всех современных LLM.
Токен
Минимальная единица текста, которую обрабатывает модель (слово, часть слова или символ).
📊 Цифры
🗓 Хронология
  1. 1970 Начало эпохи правил-ориентированного ИИ (Epoch 1).
  2. 2010 Начало эпохи глубокого обучения (Epoch 2).
  3. 2017 Публикация статьи «Attention Is All You Need».
  4. 2022 Выпуск ChatGPT, начало широкого общественного внедрения LLM (Epoch 3).
  5. 2025 Переход к масштабированию рассуждений (test-time scaling).
⚖️ Другая сторона
Искусственный интеллект LLM OpenAI Transformer Stanford Medicine RLHF