Эндрю Ын о технической осуществимости ML-проектов: как понять, что идею можно реализовать

DeepLearning.AI 13,7 тыс. 14 мин 3 мин 21.04.2022
Главное

В рамках специализации по проектированию систем машинного обучения (MLOps) от DeepLearning.AI, Эндрю Ын подробно разбирает критически важный этап запуска любого ИИ-продукта — оценку технической осуществимости (feasibility). Прежде чем инвестировать ресурсы в разработку, необходимо провести тщательный аудит и понять, реально ли вообще построить систему, которая будет работать с требуемой точностью.

🧭 Внешние бенчмарки и матрица оценки 0:02

Один из самых быстрых способов оценить шансы на успех — использование внешних ориентиров. Эндрю Ын рекомендует обращаться к научной литературе, техническим публикациям или опыту других компаний . Если конкуренты или исследовательские группы уже успешно создали аналогичную систему поиска, рекомендаций или управления запасами, это служит весомым доказательством того, что проект технически реализуем .

Для более детального внутреннего анализа Эндрю Ын предлагает использовать матрицу 2x2, которая разделяет задачи по двум осям :

В этой системе координат выбор метода оценки зависит от того, в какой квадрант попадает проект. Например, для новых задач с неструктурированными данными основным инструментом становится анализ человеческих возможностей .

👁️ Неструктурированные данные и человеческий фактор (HLP) 2:11

Для работы с изображениями или аудио Эндрю Ын считает «человеческий уровень производительности» (Human Level Performance, HLP) «золотым стандартом» оценки осуществимости . Логика проста: если человек способен справиться с задачей на основе предоставленных данных, то велика вероятность, что и алгоритм машинного обучения сможет этому научиться .

Однако при оценке HLP критически важно соблюдать чистоту эксперимента. Эксперт приводит в пример систему классификации сигналов светофора для беспилотных автомобилей :

Эндрю Ын отмечает, что часто команды месяцами бьются над улучшением алгоритма, не осознавая, что проблема в качестве входных данных. По его словам, гораздо эффективнее на раннем этапе инвестировать в лучшие камеры или освещение, чем пытаться выжать результат из невозможных данных .

📊 Структурированные данные: поиск предиктивных признаков 8:00

Когда речь идет о табличных данных (транзакциях, медицинских записях), концепция HLP работает хуже, так как люди не очень хороши в поиске закономерностей в огромных массивах цифр. Здесь ключевым вопросом становится наличие предиктивных (прогностических) признаков .

Эндрю Ын приводит несколько примеров того, где признаки работают, а где проект может оказаться «пустышкой»:

Отдельное внимание Ын уделяет прогнозированию цен на акции. Он утверждает, что предсказать будущую стоимость ценной бумаги, основываясь исключительно на истории её цены, практически невозможно . Без «умного» набора дополнительных признаков такие проекты, по мнению эксперта, технически не осуществимы .

📈 История проекта как индикатор будущего 11:38

Для уже существующих проектов лучшим предсказателем будущего успеха является скорость прогресса в прошлом . Эндрю Ын предлагает простую математическую модель для оценки того, сколько времени займет достижение цели.

В качестве примера рассматривается система распознавания речи:

  1. Устанавливается уровень HLP (или «ошибка Байеса») как предел, к которому мы стремимся .
  2. Допустим, в первом квартале уровень ошибки составлял 10%.
  3. Если каждый квартал разрыв между текущей точностью и HLP сокращается на фиксированный процент (например, на 30%), мы получаем экспоненциальную кривую затухания ошибки .
  4. Экстраполируя эту кривую, можно реалистично оценить, сколько кварталов потребуется для достижения целевых показателей .

Если же прогресс в последних кварталах застопорился, это серьезный повод пересмотреть осуществимость дальнейшего улучшения системы в рамках текущего подхода .

💬 Цитаты

«Полезный тест — не то, может ли человеческий глаз распознать свет светофора, а может ли человек, сидя в офисе, сделать это, глядя только на изображение с камеры.»

«Скорость предыдущих улучшений может быть на удивление хорошим предиктором скорости будущих улучшений.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
HLP (Human Level Performance)
Уровень точности, которого достигает человек при выполнении конкретной задачи.
Неструктурированные данные
Информация, которая не имеет заранее определенной структуры, такая как текст, изображения или аудио.
Структурированные данные
Данные, организованные в четко определенные форматы, например, таблицы базы данных или CSV-файлы.
Предиктивные признаки
Входные параметры (X), которые содержат достаточно информации для точного предсказания целевого результата (Y).
Ошибка Байеса (Bayes Error)
Минимально возможный уровень ошибки для любой классифицирующей функции, ниже которого точность упасть не может.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Andrew Ng DeepLearning.AI MLOps Human Level Performance Machine Learning