# Роуз Ю о «физическом ИИ»: „Нам нужно понимать законы природы“

Источник: https://www.youtube.com/watch?v=QEf2H4vW9xU
Канал: The TWIML AI Podcast
Опубликовано: 09.08.2021

---

## Физика в алгоритмах: Как Роуз Ю делает искусственный интеллект предсказуемым и надежным 🧬
[[JUMP:01:24]]

Современные нейросети часто критикуют за их «черный ящик» — неспособность объяснить логику принятия решений. Роуз Ю (Rose Yu), доцент Калифорнийского университета в Сан-Диего, в интервью подкасту The TWIML AI Podcast рассказала, как ее лаборатория решает эту проблему через интеграцию фундаментальных физических законов в машинное обучение. Ее работа фокусируется на анализе масштабных пространственно-временных данных (spatiotemporal data) — от турбулентности в океане до движения беспилотных автомобилей.

### Физически обоснованный ИИ: За пределами «черного ящика»
[[JUMP:02:22]]

Основная проблема стандартных моделей глубокого обучения при работе с физическими процессами заключается в том, что они игнорируют «правила игры» природы. Если просто подать видео турбулентности в нейросеть, она может выдать правдоподобную картинку, но проигнорирует физические законы сохранения энергии.

Роуз Ю выделяет три ключевых способа объединения физики и ИИ:

1.  **Замена операторов на нейросети:** Традиционные методы вычислительной гидродинамики (CFD) используют сложные математические операторы для усреднения данных в пространстве и времени. Команда Ю заменяет их обучаемыми сверточными нейросетями, что позволяет лучше моделировать многомасштабное поведение турбулентности.
2.  **Интеграция симметрии:** В основе физики лежат симметрии (например, трансляция во времени соответствует закону сохранения энергии). Внедрение этих принципов в архитектуру нейросети заставляет модель естественным образом соблюдать законы сохранения.
3.  **Обучение на остатках (Residual Learning):** В случаях, когда данных мало (например, прогнозы COVID-19 или качества воздуха), модель берет физический симулятор за основу, а ИИ обучается корректировать только «остатки» — разницу между предсказанием модели и реальностью.

### Роль симметрии в глубоком обучении
[[JUMP:09:28]]

Симметрия является мощным инструментом для улучшения предсказаний. Роуз Ю объясняет, что успех сверточных нейросетей (CNN) в компьютерном зрении объясняется трансляционной симметрией — объект остается тем же, где бы он ни находился на картинке.

Ее лаборатория пошла дальше, разработав методы для:

* **Вращательной и масштабной симметрии:** Использование полярных координат при обработке данных облаков точек (point clouds), полученных с лидаров беспилотников.
* **Групповых сверток:** Создание новых типов математических операторов, которые позволяют учитывать непрерывные симметрии, описываемые группами Ли (Lie groups).

По словам Ю, даже когда мы не знаем точных уравнений (как в случае с океанскими течениями), использование интуитивно понятных симметрий значительно повышает точность модели.

### Тензорные методы против матричных
[[JUMP:22:48]]

Помимо глубокого обучения, Роуз Ю активно использует тензорные методы. В отличие от матричных моделей, которые фиксируют лишь попарные связи (как в рекомендациях фильмов Netflix), тензоры позволяют анализировать многомерные корреляции — например, связи между разными локациями, временными метками и физическими переменными одновременно.

Преимущества тензорного подхода:

* **Интерпретируемость:** Это «неглубокие» (shallow) модели, где гораздо проще отследить, какой именно фактор повлиял на итоговый прогноз.
* **Теоретическая база:** Тензорные методы используют невыпуклую оптимизацию, что позволяет глубже изучить процессы, лежащие в основе обучения нейросетей.

### Оценка неопределенности: Как доверять прогнозам
[[JUMP:25:22]]

Для критических областей, таких как эпидемиология, недостаточно знать, что число заболевших будет равно X. Необходимо понимать доверительный интервал (например, с вероятностью 90%).

Исследование Роуз Ю сравнивает методы оценки неопределенности (Uncertainty Quantification, UQ):

* **Частотные методы (бутстрап):** Хорошее покрытие, но часто слишком широкие интервалы.
* **Байесовские методы (MCMC):** Дают точные интервалы, но требуют огромных вычислительных ресурсов.
* **Метод Монте-Карло с отсевом (MC Dropout):** Быстрый, но менее точный в плане оценки самой неопределенности.

Ю подчеркивает: «универсального решения нет», поэтому ее команда разработала своеобразный «рецепт» для практикующих специалистов, помогающий выбрать метод в зависимости от баланса между точностью и затратами времени.