Стивен Бойд о практике выпуклой оптимизации: штрафные функции и «дикие» задачи

Stanford Online 11,2 тыс. 1 ч 20 мин 3 мин 19.03.2024
Главное

Практические аспекты выпуклой оптимизации: от теории к «дикому» применению 9:19

Лекция Стивена Бойда посвящена завершению теоретического блока курса и переходу к прикладным задачам оптимизации. Ключевой посыл лекции: теория важна, но по-настоящему эффективными инженерами становятся те, кто умеет использовать идеи «в диких условиях» (in the wild), не ожидая готовых подсказок или формальных постановок задач.

💡 Важные организационные моменты 0:05

Перед началом теоретической части Бойд дал несколько практических рекомендаций:

🔗 Парадоксы двойственности и эквивалентные преобразования 10:12

Одной из центральных тем стало изучение того, как преобразования прямой задачи (primal problem) влияют на её двойственную форму (Lagrange dual).

  1. Лицензия на преобразования: При поиске двойственной задачи у вас есть право вносить небольшие эквивалентные изменения. Однако разные преобразования могут привести к радикально разным двойственным задачам.
  2. Бесполезные двойственные задачи: Бойд привел пример, когда для задачи без ограничений прямая двойственная задача является математически верной, но абсолютно бесполезной, так как она лишь возвращает нижнюю границу, равную оптимальному значению.
  3. Поиск закономерностей: В двойственных задачах стоит ожидать появления специфических структур:
    • Если в исходной задаче есть функция, в двойственной почти всегда появится её сопряжённая функция (conjugate function).
    • Наличие матрицы $A$ в исходной задаче часто влечёт появление $A^T$ в двойственной.
    • L-бесконечность нормы (l-infinity norm) часто «превращается» в L1-норму в двойственном пространстве.

⚖️ Обобщённые неравенства и теоремы альтернатив 21:53

Лектор объяснил, что аппарат теории двойственности отлично работает и для задач с векторными неравенствами (generalized inequalities), включая линейные матричные неравенства (LMI) в задачах семидефинитного программирования (SDP).

Отдельно стоит выделить теоремы альтернатив, которые лежат в основе классической экономики и финансов. Бойд в шутливой манере отметил, что некоторые его знакомые из хедж-фондов с подозрением относятся к кандидатам с экономическим образованием, так как в их индустрии глубоко укоренена вера в «отсутствие арбитража» — концепцию, которую трейдеры каждый день пытаются опровергнуть на практике.

📉 Аппроксимация, штрафные функции и «антропоморфизм» 33:00

Бойд предложил «антропоморфизировать» штрафные функции — воспринимать их как меру того, насколько вас «раздражает» размер остатка (residual) в модели.

🎯 Выбор весов и регуляризация

Обсуждая выбор параметров (например, $\gamma$ или $\delta$), Бойд выделил самый правильный способ: кросс-валидация (cross-validation). В инженерных же областях, таких как управление (control) или обработка изображений, часто приходится «крутить ручки», пока результат не станет визуально удовлетворять инженера.

В завершение лекции он продемонстрировал задачу проектирования оптимального ввода (optimal input design) для динамической системы, показав, как изменение весов между точностью слежения (tracking error) и плавностью ввода меняет итоговое поведение системы.

💬 Цитаты

«Мы не ожидаем, что у вас будет полное мастерство всей теории, которую мы покрыли, — её на самом деле много.»

Стивен Бойд 09:45

«Это как «мартышка за пишущей машинкой»: вводишь что-то в CVXPY и ждёшь, пока заработает. Это ровно противоположность того, что мы хотим.»

Стивен Бойд 01:29

«Если у штрафной функции есть острая точка, вы будете ожидать, что решение будет иметь много нулей.»

Стивен Бойд 49:57
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Двойственность (Duality)
Математический метод преобразования сложной задачи оптимизации в другую, которая может быть проще для решения или давать полезные нижние оценки.
Сопряжённая функция (Conjugate function)
Функция, играющая ключевую роль в построении двойственных задач; тесно связана с выпуклостью исходной функции.
Huber penalty
Штрафная функция, ведущая себя как квадратичная при малых ошибках и как линейная при больших, что делает её устойчивой к выбросам.
Теоремы альтернатив (Theorems of the alternative)
Результаты, доказывающие, что если одна система неравенств не имеет решения, то другая (двойственная) — имеет.
📊 Цифры
⚖️ Другая сторона
Математика и физика Stephen Boyd Convex Optimization Lagrange dual Huber penalty CVXPY