Математика диффузионных моделей: от стохастических процессов до Stable Diffusion

Stanford Online 15,5 тыс. 1 ч 13 мин 2 мин 06.05.2024
Главное

Развитие диффузионных моделей: от стохастических процессов к эффективному генеративному дизайну 0:06

Лекция 17 курса Stanford CS236, проведенная Stanford Online, посвящена глубоким генеративным моделям, а именно — интерпретации диффузионных процессов через призму вариационных автокодировщиков (VAE) и стохастических дифференциальных уравнений (SDE). Основная идея заключается в том, что обучение диффузионной модели эквивалентно обучению последовательности денойзеров, которые восстанавливают структуру данных из шума.

📉 От дискретных шагов к непрерывному времени 5:51

Традиционное представление DDPM (Denoising Diffusion Probabilistic Models) подразумевает дискретный процесс с фиксированным количеством шагов (обычно 1000). Однако переход к непрерывному времени позволяет рассматривать диффузию как процесс, индексируемый переменной $t \in [0, T]$.

⚙️ Эквивалентность SDE и ODE 26:24

Важным теоретическим результатом является возможность преобразования диффузионного процесса в систему с полностью детерминированной динамикой — обыкновенное дифференциальное уравнение (ODE).

  1. Нормализующие потоки: Преобразование SDE в ODE превращает модель в бесконечно глубокий «нормализующий поток» (normalizing flow), где траектории частиц не пересекаются, что обеспечивает инвертируемость преобразования.
  2. Вычислительные преимущества: Поскольку для решения ODE существует 50-летняя история развития численных методов, использование этих инструментов позволяет значительно ускорить генерацию, используя адаптивный размер шага и минимизируя численные ошибки.
  3. Вычисление правдоподобия: В отличие от стандартных диффузионных моделей, ODE-формулировка позволяет точно вычислять правдоподобие данных, отслеживая изменение объема вдоль траектории.

🚀 Методы ускорения и генерация 48:02

Для практического применения исследователи используют несколько подходов к ускорению работы моделей:

🌍 Latent Diffusion и контекстное управление 56:22

Современные модели, такие как Stable Diffusion от Stability AI, используют архитектуру Latent Diffusion Models (LDM).

💬 Цитаты

«По сути, оптимизация ELBO соответствует обучению последовательности денойзеров.»

«Как только вы сводите сэмплирование к решению ODE, вы получаете доступ ко множеству умных техник.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Score-matching
Метод обучения, при котором модель учится предсказывать градиент логарифма плотности вероятности данных.
SDE (Стохастическое дифференциальное уравнение)
Математическое уравнение, описывающее эволюцию случайного процесса во времени.
ODE (Обыкновенное дифференциальное уравнение)
Уравнение, описывающее детерминированную динамику системы, широко используемое в моделях для ускорения генерации.
Classifier-Free Guidance
Техника управления генерацией, основанная на комбинации условных и безусловных предсказаний модели.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Diffusion Models Stochastic Differential Equations Stable Diffusion Score Matching Latent Diffusion