Маянк Гоел: «Медицина не может ждать появления идеальных технологий»

Stanford Online 3,6 тыс. 59 мин 11 мин 07.03.2025
Главное

Свыше миллиарда потребительских гаджетов, таких как смарт-часы и смартфоны, сегодня способны выполнять функции медицинских приборов в каждом доме. Профессор Университета Карнеги — Меллона Маянк Гоел утверждает, что даже несовершенные алгоритмы машинного обучения и бытовые датчики могут существенно улучшить качество заботы о пациентах. Главная идея его концепции заключается в том, что медицина не может ждать появления идеальных технологий, а должна эффективно использовать имеющиеся несовершенные инструменты уже сейчас.

🏠 Личный вызов: как 15 строк кода помогли в пандемию 0:10

Маянк Гоел начал свое выступление с личной истории, случившейся во время разрушительной волны дельта-штамма COVID-19 в Индии, где живет его семья. В тот период вирусом заразились все его близкие, но тяжелее всего болезнь переносила мать, которая в итоге попала в отделение интенсивной терапии. Еще до госпитализации лечащий врач дал семье четкое указание: непрерывно следить за частотой дыхания пациентки. Если показатель превысит порог в 20 вдохов в минуту, ее следовало немедленно везти в больницу, поскольку медицинские учреждения были смертельно перегружены и практиковали стратегический отбор пациентов.

Мониторинг дыхания в ночное время оказался невыполнимой задачей для больных родственников, которые сами восстанавливались после вируса. Гоел, находившийся в это время в Питтсбурге, решил использовать разницу во часовых поясах, чтобы контролировать состояние матери из США. Изначально это был обычный звонок по FaceTime: отец направлял камеру ноутбука на спящую мать, а ученый вручную считал вдохи. Примечательно, что за пять лет до этого Гоел опубликовал научную работу об использовании Wi-Fi роутеров для бесконтактного измерения частоты дыхания, но в критический момент технология оказалась абсолютно неприменимой в реальной жизни.

Решение пришло из учебного процесса. Ведя в тот семестр курс по сенсорам, Гоел вспомнил лабораторную работу, в которой студенты использовали обычные камеры для измерения пульса. Он понял, что этот же алгоритм оптического потока (optical flow), отслеживающий микродвижения пикселей между кадрами, можно адаптировать для фиксации движения грудной клетки при дыхании. Ученый написал простейшее веб-приложение всего из 15 строк кода, которое суммировало векторы движения и выдавало точный график дыхания прямо в браузере ноутбука.

Система отработала без сбоев все три критических дня. Однако Гоел подчеркивает, что этот успех во многом был обусловлен тем, что он сам являлся «экспертным пользователем». Он был максимально мотивирован, имел профильное образование и финансовые возможности. Для обычного человека, который не видел графиков последние 40 лет, эти данные остались бы непонятным набором линий. По мнению исследователя, ключевой этический вызов для умной медицины — создавать такие интерфейсы, которые будут интуитивно объяснимы для неподготовленного человека и потребуют от него минимального вовлечения.

🌡️ Объяснимые измерения: тепловизоры против неточных фитнес-трекеров 9:19

Обычные камеры хорошо фиксируют дыхание спящего человека, но становятся бесполезными в повседневной жизни, когда пользователь движется или разговаривает. В качестве альтернативы команда Гоела предложила использовать портативные тепловизоры. На тепловизионном видео отчетливо видно, как меняется температура вокруг ноздрей и губ: при вдохе за счет испарения влаги область охлаждается, а при выдохе фиксируется поток теплого воздуха из легких. Этот метод позволяет надежно регистрировать дыхание, даже если человек активно тренируется на беговой дорожке или велотренажере.

Первым практическим применением этой технологии стал точный подсчет сжигаемых калорий. По словам Гоела, современные коммерческие умные часы и фитнес-трекеры ошибаются в этом показателе примерно на 40%. Чтобы доказать это, ученым пришлось практически «контрабандой» привезти в лабораторию эталонный клинический метаболограф, так как бюрократия университета Карнеги — Меллона не позволяла оперативно оформить покупку медицинского оборудования. В эксперименте приняли участие 50 добровольцев. Результаты тестирования показали:

Клинический эталон рассчитывает калории на основе трех параметров: пульса, частоты дыхания и концентрации оставшегося кислорода в выдохе. Тепловизор не может определить химический состав воздуха, из-за чего сохраняется минимальная погрешность, но точность все равно возрастает многократно. При этом Гоел отмечает, что встраивать тепловизоры в часы пока не имеет смысла из-за веса и энергопотребления; их целесообразнее интегрировать в бортовые компьютеры тренажеров или велосипедные навигаторы Garmin.

💤 Борьба с апноэ во сне: прямой подход против Wi-Fi 12:00

Диагностика синдрома обструктивного апноэ во сне в специализированных клиниках сопряжена с огромным дискомфортом: пациента на всю ночь обвешивают сотнями датчиков и проводов. Кроме того, доступ к таким исследованиям критически ограничен во всем мире. Гоел привел в пример государственную больницу в Нью-Дели, с которой сотрудничает его лаборатория: очередь на прохождение бесплатного обследования в сомнологическом центре там превышает один год. Существующие портативные домашние системы также дороги и неудобны.

Команда исследователей развернула проект, в рамках которого тепловизоры установили в палатах сомнологической клиники для одновременной записи данных с клиническими приборами. Метод Гоела решает проблему естественного поведения человека во сне. Люди постоянно переворачиваются и прячут лицо от камеры, однако тепловизор способен улавливать изменения температуры не только напрямую из ноздрей, но и по тепловым следам (отражениям) на подушке или даже на тонком одеяле.

Мультимодальный ИИ комбинирует тепловизионный сигнал с датчиками движения. Это позволяет четко диагностировать тип апноэ: на графиках видно, когда грудная клетка пациента совершает судорожные движения (пытаясь протолкнуть воздух), но воздушный поток из носа отсутствует из-за обструкции путей.

Гоел скептически относится к популярным бесконтактным методам мониторинга сна на основе Wi-Fi роутеров. По его мнению, радиочастотные подходы имеют критические недостатки:

Именно поэтому исследователь настаивает на использовании прямых оптических методов (таких как инфракрасный тепловизор), которые фиксируют сам физический процесс дыхания, а не его косвенные признаки.

📊 Студенческая депрессия: почему ломаются идеальные алгоритмы 17:40

Депрессия признана одной из главных угроз в современной академической среде. В ведущих университетах США, таких как Стэнфорд, от нее страдают около 30% студентов, а в Карнеги — Меллон этот показатель еще выше. Ситуация осложняется тем, что молодые люди часто путают обычный учебный стресс с развивающимся клиническим расстройством.

Лаборатория Гоела провела масштабное 16-недельное исследование с участием 138 первокурсников CMU. С помощью фитнес-трекеров Fitbit и смартфонов непрерывно собирались данные из нескольких источников:

В начале и в конце семестра участники проходили валидированные психиатрические опросники для фиксации базового уровня депрессии. Выяснилось, что 45% студентов имели выраженные симптомы расстройства, причем за время учебы ни один человек не показал улучшения состояния — у большинства оно только усугубилось. На основе еженедельно накапливаемых данных алгоритм пытался спрогнозировать, разовьются ли у конкретного студента симптомы депрессии к концу семестра.

Динамика точности предсказаний преподнесла ученым неприятный сюрприз:

  1. Данные первой недели давали точность предсказания на уровне 75%, что близко к статистическому шуму.
  2. К середине семестра кумулятивная модель достигла выдающихся 92% точности.
  3. На седьмой-восьмой неделе точность катастрофически упала и больше не восстановилась.

Причиной этого провала стали весенние каникулы и промежуточные экзамены (мидтермы). Поведение студентов резко изменилось, из-за чего алгоритмы машинного обучения, построенные по принципу «мусор на входе — мусор на выходе», запутались из-за отсутствия контекста. Ситуацию усугубило начало пандемии COVID-19: из-за локдауна студенты перестали выходить из комнат, их телефоны неделями лежали неподвижно на столах, и поведенческие модели ИИ полностью потеряли адекватность.

Попытка решить проблему с помощью ежедневных микроопросов (EMA) трижды в день на группе из 100 пациентов с рассеянным склерозом также не увенчалась успехом. Субъективные ответы пациентов на вопросы вроде «насколько подавленным вы себя чувствуете?» коррелировали с реальной депрессией не лучше, чем обычный подсчет шагов по трекеру. По мнению Гоела, для удержания точности моделей достаточно задавать всего один вопрос в неделю; дальнейшее увеличение частоты опросов лишь раздражает людей, не принося полезного сигнала. Главной проблемой таких систем остается низкая генерализуемость: модель, обученная на студентах CMU, полностью теряет эффективность при тестировании на студентах других вузов или даже на следующем курсе того же университета.

🧒 Диагностика СДВГ: когда контекст важнее сухих цифр 30:26

Диагностика и терапия синдрома дефицита внимания и гиперактивности (СДВГ) у детей сегодня носят крайне субъективный характер. Гоел процитировал исследование из Канады, показавшее шокирующую закономерность: мальчики, родившиеся в декабре, на 30% чаще получают официальный диагноз СДВГ, чем их одноклассники, родившиеся в январе (среди девочек наблюдается аналогичная пропорция). Этот феномен объясняется исключительно правилами приема в школу: декабрьские дети оказываются почти на год младше январских, их естественная возрастная незрелость и подвижность ошибочно интерпретируются учителями и врачами как психическое расстройство.

Цель инженеров заключается не в замене врача алгоритмом, а в предоставлении клиницисту объективного «окна» в повседневную жизнь ребенка. Исследователи проанализировали паттерны физической активности детей с помощью акселерометров Apple Watch. На графиках двух разных детей во время подвижных игр амплитуда движений идентична. Но в периоды, когда по расписанию шло чтение книг, ребенок с подтвержденным СДВГ продолжал совершать хаотичные движения, тогда как здоровый ребенок оставался неподвижен.

Гоел делает вывод, что без знания контекста (чем именно должен быть занят ребенок в конкретную минуту) сухие данные с датчиков движения абсолютно бесполезны. Команда внедрила модель распознавания активности, подкрепленную вечерними отчетами родителей, которые размечали день ребенка с 30-минутными интервалами. Несмотря на то, что заполняемые по памяти в конце дня данные были неточными и зашумленными, их добавление в модель существенно повысило качество распознавания гиперактивности.

В процессе работы над интерфейсом ученые столкнулись с неожиданным возражением со стороны медицинского сообщества. Первоначальный план инженеров предполагал отправку push-уведомления родителю в тот момент, когда часы фиксировали всплеск гиперактивности, чтобы оперативно подтвердить статус. Однако сотрудничающий с ними детский психиатр категорически отверг эту идею. По его словам, подобные уведомления постоянно напоминают родителям о проблемном поведении их детей, что вгоняет в депрессию саму семью. По совету врача логика системы была изменена: ИИ стал ловить периоды спокойствия ребенка и присылать родителю уведомление с предложением похвалить его, реализуя терапевтический метод позитивного подкрепления.

🩹 Забота о ранах после операций и опасные ошибки LLM 36:48

После операции Мооса (микрохирургическое удаление рака кожи на лице) пациенты выписываются домой, где обязаны в течение двух недель самостоятельно ухаживать за хирургической раной, очищать ее и наносить медикаменты. Этот процесс вызывает у людей сильную тревогу, из-за чего клиники буквально захлебываются от потока телефонных звонков с уточняющими вопросами. Лаборатория Гоела начала разработку контекстно-зависимого голосового ассистента на базе умных колонок и часов, призванного вести таких пациентов на дому.

В рамках исследования 150 пациентов перед операцией проходили ролевую игру в клинике: они самостоятельно выполняли процедуру ухода под контролем медсестры, что одновременно дало массив данных для обучения нейросети. Первые попытки распознавать действия (мытье рук, открытие тюбика с мазью) через базовые модели активности Samosa полностью провалились. Движения пациентов при уходе за лицом оказались микроскопическими и не такими выраженными, как условное закручивание шурупов дрелью или открытие микроволновки, на которых обычно обучают ИИ в лабораториях.

Точность удалось повысить с помощью двух решений:

Критически важным аспектом системы стало прогнозирование времени. Робот должен напомнить о необходимости нанесения мази на 600-й секунде процедуры — строго до того, как пациент успеет наложить и зафиксировать финальную повязку. Напоминание, пришедшее после заклеивания раны, теряет всякий смысл.

Параллельно группа Гоела провела независимое тестирование ведущих коммерческих больших языковых моделей (LLM) на предмет того, как они отвечают на реальные вопросы послеоперационных больных. Результаты оказались пугающими:

В качестве примера исследователь привел случай, когда пациент уронил стерильную марлевую салфетку на пол и спросил у LLM, можно ли ее поднять и продолжить обработку открытой раны на лице. Популярная нейросеть ответила: «Да, конечно, без проблем». Чтобы создать жесткие медицинские барьеры (guardrails), команда Гоела сейчас создает систему prompt-инжиниринга для врачей. Она позволяет зафиксировать «модель убеждений» конкретной клиники. Если вопрос пациента выходит за рамки строго верифицированной базы данных, ИИ жестко блокируется, отвечает «Я не знаю» и немедленно переключает канал связи на дежурную медсестру.

🧩 Будущее медицинских гаджетов: единые модели или «электронные компоненты» 46:35

В финальной дискуссии участники семинара подняли фундаментальный вопрос: означает ли концепция «миллиарда медицинских устройств» необходимость создания миллиарда отдельных мелких моделей машинного обучения? Ведущий семинара отметил, что современный тренд движется в сторону гигантских мультимодальных LLM, которые способны совместно кодировать сенсорные данные и выдавать ad-hoc предсказания, что снижает порог создания домашних систем. Маянк Гоел категорически не согласился с этой позицией, выступив против тотальной централизации.

По мнению исследователя, универсальные супермодели обладают критическим недостатком — огромным «длинным хвостом» непредсказуемых и редких ошибок. В сфере здравоохранения, где действует строгий принцип «не навреди», такой подход недопустим. Гоел предложил альтернативную концепцию:

«Мы должны относиться к моделям машинного обучения как к дискретным электрическим компонентам в физической цепи — например, как к обычным резисторам. Каждый элемент должен выполнять одну узкую задачу. Нам не нужно знать внутренний химический состав этого резистора, но мы обязаны четко знать, что подается на его вход и какой фиксированный, гарантированный результат мы получим на выходе».

Такая децентрализованная архитектура позволит гибко собирать медицинские системы под конкретного пациента. Если RGB-камера нарушает приватность в спальне или не справляется с темнотой, инженер может безболезненно вытащить этот «компонент» и заменить его на специализированный тепловизор, не перестраивая всю логику системы ИИ с нуля.

Комментируя проблему изменения поведения людей и риск развития «киберхондрии» (когда непрерывный мониторинг здоровья провоцирует у пользователей панические атаки), Гоел предложил революционный подход — задействовать «социальную ткань» человека. По его мнению, отправлять тревожное уведомление самому пациенту (например, требование немедленно лечь спать, зафиксированное часами) неэффективно, так как люди склонны игнорировать прямые приказы гаджетов. Гораздо мягче и действеннее работают оповещения, направленные близким. Сообщение на смарт-часы супруга с подсказкой «Твой партнер сильно истощен, уведи его из кухни и помоги лечь спать» или рекомендация устроить совместный ужин из-за фиксации признаков депрессии способны изменить поведение человека гораздо эффективнее, опираясь на естественную заботу внутри семьи.

💬 Цитаты

«Мы должны относиться к моделям машинного обучения как к дискретным электрическим компонентам в цепи — например, как к резисторам.»

Маянк Гоел 48:07

«Мы не можем ждать, пока они станут идеальными, потому что этого может никогда не произойти.»

Маянк Гоел 1:01
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Оптический поток (Optical flow)
Алгоритм компьютерного зрения, который отслеживает смещение пикселей и движение объектов между последовательными кадрами видео.
Экологическое мгновенное оценивание (EMA)
Метод сбора данных в реальном времени, при котором пользователи многократно в течение дня отвечают на короткие вопросы о своем психологическом или физическом состоянии.
Синдром обструктивного апноэ во сне
Расстройство, характеризующееся частыми остановками дыхания во время сна из-за полного или частичного спадения верхних дыхательных путей.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Маянк Гоел Carnegie Mellon University Apple Watch Fitbit Samosa