Constraint Active Search: как ИИ помогает находить стабильные решения в реальном мире

The TWIML AI Podcast 606 51 мин 5 мин 29.07.2021
Главное

В новом выпуске подкаста TWIML AI ведущий Сэм Чаррингтон беседует с Густаво Малкомесом, инженером-исследователем в Intel (ранее работавшим в стартапе SigOpt). Основной темой разговора стала научная работа Малкомеса «Beyond the Pareto Efficient Frontier: Constraint Active Search for Multi-Objective Experimental Design», представленная на конференции ICML. Исследование предлагает новый взгляд на оптимизацию сложных систем, где традиционные методы поиска «наилучшего» решения оказываются недостаточно эффективными при столкновении с реальностью.

🇧🇷 От YouTube до PhD: Путь Густаво Малкомеса 0:42

Густаво Малкомес начал свой путь в области машинного обучения в Федеральном университете Сеара в Бразилии . В то время ML не был популярной дисциплиной в его вузе, поэтому он и группа его друзей занимались самообразованием. Малкомес называет своим первым учителем профессора Эндрю Ына (Andrew Ng), лекции которого на YouTube стали для него фундаментом знаний 12 лет назад .

Позже он переехал в США для получения степени PhD в Университете Вашингтона в Сент-Луисе (WashU), где работал под руководством профессора Романа Гарнетта . Его диссертация была посвящена активному обучению (Active Learning) и тому, как использовать эти методы для создания более совершенных инструментов автоматизированного машинного обучения (AutoML) .

Мастерство Малкомеса заключается в разработке инструментов для принятия решений в условиях неопределенности. В его портфолио — проекты от улучшения скрининговых тестов в аудиометрии до оптимизации функций «черного ящика» в SigOpt .

🧠 Расширенное видение активного обучения 6:14

Традиционно активное обучение воспринимается как способ эффективного выбора данных для обучения модели с целью экономии вычислительных ресурсов . Однако Малкомес предлагает смотреть на эту концепцию шире, приравнивая её к последовательному принятию решений. Согласно его видению, активное обучение стоит в одном ряду с обучением с учителем и обучением с подкреплением как общий фреймворк для эффективного сбора данных для любой цели :

По словам гостя, активное обучение — это, по сути, сама наука в миниатюре: процесс построения моделей и сбора данных для их валидации .

🧪 Проблема «стеклянных» солнечных панелей 9:04

Разработка алгоритма Constraint Active Search (CAS) была вдохновлена сотрудничеством с лабораторией передовых материалов Университета Питтсбурга под руководством профессора Пола Лю . Исследователи работали над созданием новых видов стекла для солнечных панелей, которые должны обладать комплексом свойств :

Ученые используют наноструктуры на поверхности стекла, чтобы изменить свойства света. Однако между численной симуляцией и реальным производством существует огромный разрыв (discrepancy) . Традиционные симуляторы не могут учесть все физические нюансы производства, поэтому теоретически «лучший» дизайн из компьютера может оказаться невыполнимым или нестабильным в реальности .

🏔️ Почему фронт Парето не всегда является решением 13:00

В многокритериальной оптимизации стандартным подходом является поиск фронта Парето — набора решений, где нельзя улучшить один показатель, не ухудшив другой . Однако в реальной инженерии этот подход имеет фундаментальный изъян.

Малкомес использует аналогию с поиском пика горы, где высота — это значение метрики, а координаты — параметры . В многокритериальной задаче (например, две горы-метрики) фронт Парето — это линия между вершинами в пространстве параметров .

По мнению Густаво, проблема заключается в следующем:

  1. Нестабильность: «Лучшая» точка может находиться на остром пике. Если при производстве параметры чуть-чуть сдвинутся (из-за погрешности оборудования), эффективность резко упадет .
  2. Отсутствие разнообразия: Оптимизация ищет экстремумы, но ученым часто важнее понять общую форму «плато», чтобы найти стабильный регион для производства .

🛠️ Constraint Active Search (CAS): Поиск «плато», а не пика 23:01

Малкомес и его коллеги предложили новый тип задачи — Constraint Active Search. Вместо поиска глобального максимума, алгоритм ищет область удовлетворения (satisfactory region) — все наборы параметров, которые позволяют метрикам быть «выше заданного порога» .

Ключевые особенности решения:

Математически CAS является обобщением: если задать порог на уровне максимально возможного значения, он превращается в байесовскую оптимизацию; если на уровне минимального — в классический дизайн экспериментов .

📈 Оценка эффективности и результаты 41:15

Для оценки нового метода Малкомес использовал четыре метрики, включая количество «положительных» точек (выше порога) и «дистанцию заполнения» (fill distance), которая коррелирует с разнообразием .

Результаты тестов показали:

  1. Байесовская оптимизация дает лучшие значения метрик, но страдает от отсутствия разнообразия (точки кучкуются у одного пика) .
  2. Active Search находит много хороших точек, но они также не диверсифицированы .
  3. Constraint Active Search (CAS) обеспечивает лучший баланс между качеством решений и их разнообразием в пространстве параметров .

👥 Применение: Человек в контуре управления 46:16

Основная ценность CAS проявляется в сценариях Human-in-the-Loop. Когда эксперт-человек получает от алгоритма 5–10 вариантов дизайна, которые сильно отличаются друг от друга, но все одинаково эффективны, это дает ему пространство для маневра .

Это применимо не только в материаловедении, но и в обычном ML. Компании часто выбирают модели не только по точности, но и по бизнес-метрикам (например, время инференса). Малкомес утверждает, что предоставление набора разнообразных моделей, работающих выше порога точности, позволяет бизнесу тестировать их в «теневом» режиме или через A/B-тесты в реальных условиях, где данные отличаются от обучающих .

В будущем Малкомес планирует изучить возможность динамического изменения параметра радиуса (R) в процессе поиска — от широкого охвата территории к более детальному изучению перспективных зон .

💬 Цитаты

«Активное обучение — это своего рода наука в более общем смысле. Мы постоянно строим модели и собираем новые данные для их проверки.»

Густаво Малкомес 08:23

«Для ученого-материаловеда будет очень странно, если мы дадим ему материал с отличными свойствами, но малейшее изменение параметров приведет к ужасному результату.»

Густаво Малкомес 17:06
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Фронт Парето
Множество вариантов решения задачи, которые нельзя улучшить по одному критерию, не ухудшая при этом другие.
Суррогатная модель
Аппроксимация сложной функции (например, симуляции), используемая для ускорения вычислений в оптимизации.
Черный ящик (Black Box)
Система, внутреннее устройство которой неизвестно, и доступны только входные и выходные данные.
Инференс (Inference)
Процесс работы обученной нейросети при получении новых данных.
📊 Цифры
🗓 Хронология
  1. 12 лет назад Густаво Малкомес начинает изучать машинное обучение в Бразилии.
  2. 7 лет назад Поступление в PhD-магистратуру в США (WashU).
  3. 2021 Представление работы по Constraint Active Search на конференции ICML.
⚖️ Другая сторона
Искусственный интеллект Gustavo Malkomes SigOpt Bayesian Optimization Active Learning Constraint Active Search