Эндрю Ын: «Первый деплой модели — это лишь середина пути»

DeepLearning.AI 44,1 тыс. 14 мин 4 мин 21.04.2022
Главное

Развертывание обученной модели машинного обучения в реальной среде — один из самых волнительных моментов любого проекта. Однако, по мнению основателя DeepLearning.AI Эндрю Ына, на этом работа инженера не заканчивается, а только переходит в самую сложную фазу. В этом материале разбираются ключевые препятствия на пути к успешному деплою: от статистических аномалий до архитектурных решений программной инженерии.

📉 Почему модели «протухают»: концептуальный и информационный дрейф 0:26

Одной из главных проблем после запуска системы является изменение данных с течением времени. Эндрю Ын выделяет две основные категории статистических проблем: «дрейф данных» (data drift) и «концептуальный дрейф» (concept drift) .

В качестве примера из промышленного сектора Ын приводит систему детекции царапин на смартфонах . Если алгоритм обучался на фотографиях при одном освещении, а затем в заводском цехе сменили лампы, распределение данных меняется, и точность модели падает.

Аналогичная ситуация наблюдается в системах распознавания речи. При их создании разработчики обычно используют два типа данных:

Чтобы минимизировать риски, Эндрю Ын рекомендует при тестировании использовать валидационные и тестовые наборы данных, собранные за последние несколько месяцев . Это позволяет убедиться, что система адекватно реагирует на современные реалии, однако даже это не гарантирует стабильности в будущем. По словам Ына, данные могут измениться из-за появления новых моделей смартфонов с другими микрофонами или из-за естественной эволюции языка .

Скорость изменений: от эволюции к шоку 2:52

Изменения в данных могут происходить с разной скоростью:

  1. Постепенные изменения: например, английский язык меняется медленно, словарный запас пополняется годами .
  2. Внезапные шоки: пандемия COVID-19 стала критическим испытанием для систем антифрода .

Как отмечает Ын, в начале пандемии многие системы защиты кредитных карт перестали работать корректно. Паттерны покупок резко изменились: люди, которые редко покупали онлайн, начали делать это постоянно . Это привело к тому, что антифрод-системы начали ложно блокировать транзакции, и командам инженеров пришлось в экстренном порядке собирать новые данные для переобучения моделей .

Разница между Data Drift и Concept Drift 4:12

Эндрю Ын вносит ясность в терминологию, которая часто используется непоследовательно:

💻 Архитектура сервиса: от облака до периферийных вычислений 6:14

Помимо статистических нюансов, успешный деплой требует решения ряда инженерных задач. При проектировании сервиса предсказаний необходимо ответить на несколько критических вопросов.

1. Режим работы: реальное время или пакетная обработка?

6:39

2. Место вычислений: облако, Edge или браузер?

7:56

Выбор зависит от требований к задержке и надежности связи:

Ресурсы и производительность 9:12

Эндрю Ын делится личным опытом: часто случается ситуация, когда нейросеть обучается на мощнейшем GPU, но для деплоя компания не может позволить себе аналогичное дорогостоящее оборудование . В таких случаях инженерам приходится сжимать модель или снижать её сложность.

Ключевые метрики производительности:

🔒 Безопасность, конфиденциальность и мониторинг 10:50

Логирование данных является обязательным условием для последующего анализа и переобучения модели . Однако это напрямую сталкивается с вопросами безопасности. По словам Ына, требования к защите данных крайне разнятся: работа с электронными медицинскими картами требует высочайшего уровня конфиденциальности и соблюдения регуляторных норм, в то время как в других сферах требования могут быть мягче .

🏁 Первая публикация — это лишь половина пути 11:53

Подводя итог, Эндрю Ын развенчивает миф о том, что запуск модели — это финишная прямая .

По мнению автора курса, первый деплой означает, что вы прошли только 50% пути. Вторая половина работы — это мониторинг, поддержка, сбор обратной связи и обновление модели в условиях постоянного дрейфа данных . Подходы к «нулевому» деплою (когда системы раньше не существовало) и к обновлению уже работающего алгоритма существенно различаются, и эти стратегии станут темой следующих уроков .

💬 Цитаты

«Многие инженеры считают, что развертывание модели машинного обучения — это финишная черта. К сожалению, первый деплой означает, что вы прошли лишь половину пути.»

«Концептуальный дрейф — это когда меняется само определение того, что мы хотим получить на выходе при заданных входных данных.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Data Drift
Изменение статистического распределения входных признаков (X) при сохранении зависимости между ними и ответом.
Concept Drift
Ситуация, когда статистические свойства целевой переменной, которую модель пытается предсказать, меняются с течением времени.
Edge Computing
Обработка данных непосредственно на устройстве (датчике, смартфоне), а не в удаленном облачном центре.
Latency
Время задержки между запросом к системе и получением ответа.
QPS
Queries Per Second — количество запросов, которые система способна обработать за одну секунду.
📊 Цифры
🗓 Хронология
  1. 2020 Пандемия COVID-19 вызвала внезапный шок в данных, нарушив работу антифрод-систем по всему миру.
⚖️ Другая сторона
Искусственный интеллект MLOps Andrew Ng Data Drift Concept Drift DeepLearning.AI