ИИ-агенты превзошли врачей в диагностике после обучения в виртуальном госпитале Agent Hospital

Wes Roth 42,4 тыс. 27 мин 4 мин 08.05.2024
Главное

В современном мире медицина сталкивается с нехваткой ресурсов и человеческими ошибками, однако технологии искусственного интеллекта (ИИ) предлагают решение, которое еще вчера казалось фантастикой. Автор канала Wes Roth разбирает результаты амбициозного исследования «Agent Hospital», в котором автономные ИИ-агенты, управляемые большими языковыми моделями, не просто имитировали работу больницы, но и превзошли профессиональных врачей в точности диагностики после прохождения интенсивной виртуальной практики.

🏥 Виртуальный госпиталь: как работает «Agent Hospital» 8:46

Проект Agent Hospital представляет собой симуляцию больницы полного цикла, где все роли — от регистраторов и медсестер до врачей и пациентов — исполняют автономные ИИ-агенты на базе больших языковых моделей (LLM) . Это закрытая экосистема, которая имитирует весь путь пациента:

В симуляции задействовано 14 «врачей» и 4 «медсестры» . Медсестры отвечают за триаж и ежедневную поддержку, в то время как врачи фокусируются на диагностике и планах лечения. По словам автора видео, для визуализации движений агентов в симуляции использовались инструменты tiledmapseditor.org и фреймворк phaser.io, что делает среду похожей на видеоигру, где персонажи действуют абсолютно самостоятельно .

🧠 Методология MedAgent-Zero: обучение без учителей-людей 15:58

Ключевой особенностью исследования является метод обучения «MedAgent-Zero». В отличие от классического обучения нейросетей, где люди вручную размечают миллионы данных (например, подписывая «это собака» или «это сыпь»), агенты в госпитале обучаются на собственном опыте в симуляции .

Система обучения включает два основных модуля:

  1. Библиотека медицинских записей (Medical Record Library): сюда попадают все успешные случаи лечения, которые служат эталоном для будущих решений .
  2. База опыта (Experience Base): в случае ошибки врач-агент переходит в режим «рефлексии». Он анализирует причины неудачи и формулирует «руководящий принцип» — предостережение для самого себя на будущее .

По данным транскрипта, агенты также имитируют человеческое поведение вне работы: в «свободное время» они читают медицинские учебники и изучают архивы прошлых записей для расширения кругозора . Информация хранится в векторном пространстве (Vector Space), где слова и понятия группируются по смысловой близости .

📊 Результаты: ИИ против экспертов-людей 19:45

Результаты симуляции показывают стабильный прогресс ИИ по мере накопления опыта. После «лечения» 10 000 виртуальных пациентов точность диагностики значительно возрастает .

Статистические показатели, приведенные в видео:

Вес Рот подчеркивает колоссальную разницу в скорости обучения: для накопления опыта в 10 000 пациентов реальному врачу потребовалось бы более двух лет непрерывной практики . Симуляция позволяет пройти этот путь за считанные дни или часы, причем с каждым годом, по мере развития оборудования (hardware), этот процесс будет только ускоряться .

🤖 Из симуляции в реальный мир 1:20

Автор проводит аналогию с обучением роботов в среде NVIDIA Isaac Gym. Роботы-собаки или манипуляторы миллионы раз пытаются выполнить задачу (например, открыть дверь) в цифровой среде с реальной физикой . Когда «цифровой мозг» обучен, его переносят в физическое тело, и он демонстрирует надежную работу в реальности .

Исследование Agent Hospital доказывает, что этот же принцип применим к интеллектуальному труду. Знания, полученные агентом в виртуальной больнице, оказываются применимы к реальным медицинским бенчмаркам .

🤬 Социальный резонанс и «антиутопия» 2:53

Несмотря на технологический прорыв, публикация подобных исследований вызывает острую негативную реакцию. Вес Рот упоминает случай с Итаном Молликом, профессором Уортонской школы бизнеса, который опубликовал ссылку на работу о «языковых моделях как ученых» от исследователей из MIT и Harvard .

По словам Рота, Моллику пришлось удалить ветку обсуждения в Twitter (X) из-за шквала личных оскорблений в адрес авторов . Критики часто называют использование ИИ в науке и медицине «ультра-дистопией» (сверх-антиутопией) .

Аргументы сторон:

💡 Этический императив Сэма Альтмана 25:30

В завершение ролика Вес Рот цитирует генерального директора OpenAI Сэма Альтмана, который недавно посетил Стэнфорд и MIT . Альтман отметил, что среди студентов элитных вузов идея «процветания через технологии» стала спорной .

Согласно позиции Альтмана, использование технологий для создания изобилия (энергии, интеллекта, долголетия) не решит всех проблем и не сделает всех счастливыми автоматически, но это является «моральным императивом» . Рот солидарен с этим мнением, утверждая, что развитие медицинского ИИ — это путь к расширению возможностей человечества, а не к его упадку .

💬 Цитаты

«Доктор-агенты могут продолжать накапливать опыт как из успешных, так и из неудачных случаев. Звучит совсем как люди, не правда ли?»

«Использование технологий для создания изобилия, интеллекта, долголетия... не сделает всех счастливыми, но это безусловно великое дело и наш моральный императив.»

Сэм Альтман (в цитировании Веса Рота) 26:11

«Ультра-антиутопией было бы, если бы мы запретили эту технологию и не позволили человечеству извлекать из нее пользу.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Триаж
Процесс сортировки пациентов для определения очередности оказания медицинской помощи.
Векторное пространство
Способ хранения данных в ИИ, где слова представлены в виде координат, отражающих их смысл и связь с другими словами.
Med QA
Стандартный набор тестов и вопросов для оценки медицинских знаний искусственного интеллекта.
MedAgent-Zero
Методология обучения ИИ-врачей через автономную практику в симуляции без человеческой разметки данных.
📊 Цифры
🗓 Хронология
  1. 20 апреля 2024 Итан Моллик опубликовал твит об исследовании возможностей ИИ в качестве ученых, вызвавший скандал.
⚖️ Другая сторона
Искусственный интеллект OpenAI GPT-4 Agent Hospital MedAgent-Zero Ethan Mollick