Макс Веллинг: „Квантовая механика — это просто иная теория статистики для нейросетей“

В новом выпуске Machine Learning Street Talk исследователь в области ИИ и профессор Амстердамского университета Макс Веллинг (Max Welling) рассказывает о том, почему современным нейросетям не хватает «здравого смысла» физики, как квантовая механика изменит алгоритмы обучения и почему научное сообщество должно отказаться от диктатуры конференций.

🧬 Геометрическое глубокое обучение и успех AlphaFold 2 1:03

Макс Веллинг считается одним из пионеров геометрического глубокого обучения. Суть этого направления заключается в работе с данными, которые не вписываются в привычную евклидову сетку (как пиксели изображения), а имеют более сложную структуру: графы социальных связей, погодные паттерны на сфере или молекулярные соединения .

Ключевым прорывом в этой области стало использование индуктивных смещений (inductive biases). Если обычные сверточные нейросети (CNN) используют симметрию переноса (собака в левом углу — та же собака, что и в правом), то Макс Веллинг внедрил в модели более сложные симметрии, такие как вращение и зеркальное отражение .

Важность этих методов подтвердилась триумфом системы AlphaFold 2 от DeepMind. По словам Веллинга и ведущих, успех модели в предсказании структуры белков (задачи, не решавшейся 50 лет) напрямую связан с использованием эквивариантных трансформеров .

Белок рассматривается как пространственный граф.
Архитектура модели учитывает физические ограничения вращения и перемещения атомов в 3D (группа симметрии SE(3)).
Вместо того чтобы заставлять нейросеть «выучивать» законы физики с нуля, исследователи «вшили» их в саму структуру сети через индуктивные смещения .

⚛️ Квантовые нейросети: статистика против интуиции 20:12

Макс Веллинг утверждает, что квантовые вычисления радикально изменят ландшафт машинного обучения, но не только за счет скорости «железа». По его мнению, квантовая механика — это, прежде всего, иная теория статистики .

Главное отличие квантовой логики от классической:

Классика: Мы работаем с вероятностями (от 0 до 1). Если есть два пути для события, вероятности складываются.
Квант: Мы работаем с амплитудами (похожими на квадратные корни из вероятностей). Амплитуды могут быть отрицательными .
Эффект: События могут «аннигилировать» или отменять друг друга. Если два пути имеют амплитуды +2 и -2, вероятность события может внезапно стать нулевой .

Веллинг представил свою новую работу «Квантовые деформированные нейронные сети» (Quantum Deformed Neural Networks). Это архитектуры, которые:

Учитывают явление спутанности (entanglement) состояний параметров и данных .
Могут имитироваться на классических компьютерах .
Полностью раскроют свой потенциал только с появлением реальных квантовых процессоров, позволяя решать задачи, которые сейчас требуют экспоненциальных вычислений .

📏 Переход от пикселей к непрерывному сигналу 23:00

Традиционное компьютерное зрение воспринимает мир как сетку дискретных пикселей. Макс Веллинг считает это ограничением и предлагает рассматривать изображения как выборки из непрерывного сигнала. В статье «Probabilistic Numeric Convolutional Neural Networks» он описывает подход, использующий гауссовские процессы .

Преимущества такого метода:

Возможность работать с неструктурированными данными (когда точки замера распределены случайно, а не по сетке) .
Моделирование неопределенности: там, где данных мало, сеть честно «сообщает», что не уверена в сигнале .
Использование аппарата дифференциальных уравнений в частных производных (PDE) для описания сверток. Это позволяет нейросети вести себя как физическая система, плавно эволюционирующая во времени и пространстве .

🏛️ Проблема «научного гетто» и диктатура рецензирования 18:39

Веллинг и ведущие Machine Learning Street Talk выразили обеспокоенность состоянием современной науки об ИИ. По их мнению, система рецензирования на конференциях (NeurIPS, ICML) страдает от «завистливости» и подавляет оригинальные идеи .

Критикуемые аспекты научной среды:

Конвергентное поведение: Исследователи боятся рисковать и выбирают темы, которые гарантированно пройдут через фильтры рецензентов (эксплуатация вместо исследования) .
Hardware Lottery: Термин Сары Хукер, описывающий ситуацию, когда идеи выживают не потому, что они лучше, а потому, что они лучше работают на текущих видеокартах GPU .
Статичность: Публикация в PDF считается финальной точкой, хотя наука должна быть непрерывным процессом .

Макс Веллинг предлагает решение:

Переход на платформы типа Open Review, где рецензии публичны, подписаны именами авторов и сами имеют ценность как научные работы .
Система «урожаев» (harvesting): авторы выкладывают работы на ArXiv в режиме реального времени, а конференции лишь раз в полгода «собирают» лучшие из них для презентаций, не являясь единственным источником истины .

🔮 Будущее: причинность против Big Data 13:21

В споре о том, можно ли достичь сильного ИИ (AGI) простым масштабированием данных и вычислительных мощностей, Макс Веллинг занимает сторону «умеренных скептиков». Он признает мощь GPT-3, но считает, что без понимания причинно-следственных связей (causality) модели всегда будут хрупкими .

Иллюстрация Веллинга о корреляции и причинности:

В Нидерландах определенный цвет автомобиля может коррелировать с аварийностью из-за местных культурных привычек. Эта модель сломается в другой стране .
Уровень тестостерона — физический фактор, влияющий на риск агрессивного вождения. Эта закономерность будет верна везде .

По словам Веллинга, путь к настоящему интеллекту лежит через генеративные модели, которые не просто предсказывают следующий токен, а симулируют физику мира внутри «цифрового мозга», подобно тому как люди проигрывают сценарии будущего в воображении .