Ферран Алет: «Сохраняющиеся величины — это ключ к эффективности моделей»

Yannic Kilcher 11,9 тыс. 23 мин 2 мин 19.01.2022
Главное

Исследовательская работа Noether Networks, представленная Ферраном Алетом (Ferran Alet), Диланом Добларом (Dylan Doblar) и соавторами, предлагает инновационный подход к предсказанию динамических систем с помощью нейронных сетей. Янник Килчер в своем обзоре и интервью с одним из ведущих авторов, Ферраном Алетом, разбирает, как концепция из теоретической физики помогает нейросетям лучше обучаться в условиях нехватки данных, автоматически выявляя сохраняющиеся величины.

🌌 Вдохновение физикой: Теорема Нётер 1:50

В основе метода лежит фундаментальная теорема Нётер, которая гласит: для каждой непрерывной симметрии динамической системы существует соответствующая величина, значение которой сохраняется во времени.

Однако в реальности такие величины не всегда очевидны, известны заранее или сохраняются с абсолютной точностью. По мнению Феррана Алета, в машинном обучении симметрии — это способ повысить эффективность модели, но работать с ними напрямую сложно, так как они часто требуют анализа «контрфактических» данных (например, как бы выглядела система, если бы законы физики изменились). В то же время сохраняющиеся величины можно измерить непосредственно на имеющихся данных.

🧠 Архитектура Noether Networks 4:19

Вместо того чтобы жестко прописывать симметрии в архитектуру нейросети, Noether Networks учатся «динамически» определять сохраняющиеся величины и использовать их в качестве индуктивного смещения (inductive bias).

Процесс предсказания включает внутреннюю оптимизацию в ходе прямого прохода (forward propagation):

  1. Базовое предсказание: Сеть $f_\theta$ предсказывает последовательность кадров.
  2. Поиск инвариантов: Сеть $g$ анализирует эти предсказания, проецируя их в пространство, где должны проявляться сохраняющиеся величины.
  3. Корректировка: Вычисляется «нётеровская потеря» (Noether loss) — разница между выходами сети $g$ для разных кадров. На основе этого градиента веса сети $f_\theta$ временно обновляются.
  4. Финальный результат: Обновленная сеть $f_\theta$ выполняет итоговый прогноз.

Такой подход позволяет модели «подстраивать» свои предсказания под конкретный пример, что делает систему крайне гибкой.

📊 Эксперименты и результаты 14:10

Метод показывает выдающиеся результаты в задачах, где данных недостаточно. В видео-примерах, где система предсказывает физическое взаимодействие на наклонной плоскости, модель успешно справляется с неточными ограничениями, такими как трение.

💡 Особенности метода 12:26

💬 Цитаты

«Для каждой непрерывной симметрии динамической системы существует соответствующая величина, значение которой сохраняется во времени.»

Янник Килчер 01:50

«Мы можем даже обрабатывать приближенные симметрии, если система диссипативна, как в реальном мире.»

Ферран Алет 22:50
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Теорема Нётер
Фундаментальный принцип физики, связывающий симметрии системы с законами сохранения (энергии, импульса и т.д.).
Индуктивное смещение
Набор предположений, которые модель использует для прогнозирования результатов на данных, которые она раньше не видела.
Символьная регрессия
Метод поиска математической формулы, которая наилучшим образом описывает набор данных.
Диссипативная система
Система, в которой энергия постепенно теряется (например, из-за трения), поэтому законы сохранения выполняются лишь частично.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Noether Networks Ferran Alet Yannic Kilcher мета-обучение динамические системы