# DeepLearning.AI: Почему простая нейросеть эффективнее SOTA в реальных проектах спасения жизней

Источник: https://www.youtube.com/watch?v=IESLSRTrMtk
Канал: DeepLearning.AI
Опубликовано: 27.07.2023

---

В новом уроке курса «AI for Good» от DeepLearning.AI рассматривается критически важный этап разработки социально значимых проектов — переход от постановки задачи к проектированию конкретного решения. На примере реального кейса по охране материнства и младенчества эксперты объясняют, почему в гуманитарных миссиях надежность и скорость дообучения модели зачастую важнее, чем использование самых современных, но «тяжелых» нейросетей.

## 🎨 Прототипирование и проектирование AI-решения
[[JUMP:00:03]]

Процесс проектирования начинается после того, как команда определила стейкхолдеров и четко сформулировала проблему. На этапе дизайна (Design Phase) основная работа фокусируется на трех направлениях: создании прототипа, обеспечении безопасности данных и проектировании пользовательского опыта (UX) [00:16]. 

Создание прототипа подразумевает глубокое изучение имеющихся данных и тестирование различных моделей [00:28]. В рассматриваемом кейсе проекта по охране здоровья матерей данные представляли собой массив входящих текстовых сообщений, которым сотрудники клиник вручную присваивали категории [01:46]. 

Ключевые этапы работы с данными в социально значимом проекте:

*   Определение минимально необходимого количества меток (labels) для обучения модели [01:54].
*   Оценка сложности автоматизации различных задач (например, определение языка сообщения — простая задача, а категоризация содержания по теме здоровья — сложная) [02:12].
*   Анализ точности предсказаний в зависимости от объема данных на конкретных языках [02:26].

## 🛡️ Конфиденциальность данных и «принцип достоинства»
[[JUMP:00:41]]

Работа с данными в сфере здравоохранения требует «чрезвычайной осмотрительности» (deliberate approach) на всех этапах [00:41]. Основное правило, которого придерживаются в DeepLearning.AI: личные данные не могут быть использованы без явного разрешения для конкретного сценария использования [00:50].

Независимо от того, разрабатывается ли приложение для малообеспеченных слоев населения или для богатых пользователей, система должна по умолчанию предлагать максимально защищенный режим (private data practices) [01:03]. По словам ведущего, защита конфиденциальности и безопасности — это не только технический стандарт, но и вопрос сохранения достоинства (dignity) людей, чьи данные хранятся в системе [01:07]. В данном проекте доступ к сообщениям был ограничен только теми сотрудниками, которые и так видели их в рамках своей основной работы в клинике; сторонние разработчики, включая команду из компании Idibon, доступа к данным не имели [06:27].

## ⚙️ Выбор архитектуры: современность против надежности
[[JUMP:03:00]]

Одной из центральных тем обсуждения стал выбор между моделями класса state-of-the-art (SOTA), обеспечивающими максимальную точность, и более простыми, но интерпретируемыми алгоритмами [03:06]. 

Для клиник в развивающихся регионах выбор был сделан в пользу простых моделей по нескольким причинам:

1.  **Скорость дообучения:** Простая модель может обновиться на основе новых данных за несколько минут, тогда как SOTA-модели могут требовать часы или дни [03:45].
2.  **Обратная связь:** Персонал клиники видит результат своей работы по разметке (аннотированию) данных почти мгновенно, что повышает вовлеченность [03:59].
3.  **Интерпретируемость:** Понимание логики работы модели в критических ситуациях важнее, чем лишний процент точности [03:31].

Согласно опыту разработчика в индустрии (в частности, в Idibon), подавляющее большинство клиентов предпочитают модели, которые быстро обновляются, а не те, что показывают рекордные результаты в лабораторных условиях [04:13]. В реальном мире несколько дополнительных меток, поставленных человеком, приносят больше пользы, чем многочасовое обучение сложной нейросети [04:25].

## 🏥 Внедрение в рабочий процесс клиники
[[JUMP:04:47]]

Внедрение AI не имело целью заменить врачей или сделать их работу безошибочной за один шаг. Главной задачей было подтвердить, что AI вообще может принести пользу в сравнении с полностью ручным процессом, который существовал ранее [04:53].

В качестве ключевых показателей эффективности (KPI) были выбраны:

*   **Объем ответов:** сколько сообщений может обработать один работник за смену [05:06].
*   **Время реакции:** период между поступлением вопроса и ответом на него [05:06].
*   **Стабильное качество:** AI не должен снижать общую точность ответов, даже если ускоряет процесс [05:20].

Пользовательский опыт был спроектирован так, чтобы врачи получали автоматические предложения по категориям и приоритетности сообщений [09:33]. Они могли либо подтвердить выбор системы, либо вручную переназначить категорию, тем самым обучая модель прямо в процессе работы [09:46].

## 🚧 Риски и возврат на этап исследования
[[JUMP:07:40]]

На этапе дизайна команда может столкнуться с непредвиденными сложностями, такими как дисбаланс данных или техническая невозможность решить задачу текущими методами [08:12]. В таких случаях авторы курса рекомендуют не бояться возвращаться на этап исследования (Explore phase), чтобы пересмотреть проблему или найти новые источники данных [08:24].

Ведущий подчеркивает, что фаза проектирования может длиться месяцы, а в некоторых случаях — годы, если система требует особо медленного и осторожного построения для соблюдения принципа «Не навреди» (Do no harm) [10:11]. Только после того, как все вопросы безопасности и UX-дизайна решены, можно переходить к полномасштабной реализации (Implementation phase).