Петар Величкович: «Теория категорий — ключ к новому ИИ»

Machine Learning Street Talk 14,9 тыс. 36 мин 2 мин 08.12.2022
Главное

Будущее графовых нейронных сетей: от симметрий к теории категорий и алгоритмическому мышлению 0:00

Петар Величкович, штатный научный сотрудник DeepMind и один из ведущих исследователей в области глубокого обучения, представил комплексный взгляд на эволюцию графовых нейронных сетей (GNN). В беседе с каналом Machine Learning Street Talk он объяснил, как теория категорий помогает преодолеть ограничения существующих методов геометрического глубокого обучения и почему «алгоритмическое мышление» является ключом к созданию по-настоящему надежного ИИ.

📐 За пределами симметрий: почему нужна теория категорий 1:16

Традиционное геометрическое глубокое обучение опирается на понятие симметрии, работая с преобразованиями, которые сохраняют структуру объекта, будучи при этом обратимыми и композиционными. Однако, по мнению Величковича, природа и алгоритмы часто ведут себя иначе:

По словам исследователя, разделение потоков данных в GNN на основе этого анализа дает значительный прирост производительности при экстраполяции на новые данные.

🧠 Алгоритмическое мышление: «Программное обеспечение 2.0» 14:48

Алгоритмическое мышление (algorithmic reasoning) — это попытка научить нейронные сети выполнять классические алгоритмы (например, поиск кратчайшего пути или сортировку) внутри их скрытого пространства (latent space).

Величкович подчеркивает, что современные большие модели (System 1) и GNN, способные выполнять четкие алгоритмические шаги (System 2), должны быть объединены в единую архитектуру будущего.

🌐 Решение проблемы «овер-сквошинга» (Over-squashing) 29:42

На конференции NeurIPS Величкович представил работу, вошедшую в топ-10 по оценкам рецензентов, посвященную решению фундаментальной проблемы графовых сетей — «овер-сквошинга».

  1. Суть проблемы: В графах с узкими местами (bottlenecks) информация от удаленных узлов с трудом доходит друг до друга, требуя экспоненциального роста размерности пространства признаков.
  2. Решение — экспандеры: Исследователи предложили пропагировать информацию через «графы-экспандеры» — структуры из теории графов, обладающие очень низкой плотностью «узких мест».
  3. Результаты: Заменяя часть слоев GNN на слои, работающие по топологии экспандера, команде удалось значительно улучшить качество обучения без увеличения количества параметров.

Комментируя работы других групп по анализу кривизны графов, Величкович отметил: их математическое доказательство подтверждает, что при попытке создать разреженные графы без «узких мест» неизбежно появление зон с отрицательной кривизной. Дальнейшее исследование этой «серой зоны» он считает одной из важнейших задач для сообщества.

💬 Цитаты

«Категориальная теория — это взгляд с высоты птичьего полета на изучаемые явления.»

Петар Величкович 11:22

«Любой уважающий себя алгоритм должен хорошо экстраполировать.»

Петар Величкович 07:55
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Овер-сквошинг (Over-squashing)
Проблема в GNN, при которой информация из-за топологии графа «сжимается» и теряется при передаче между удаленными узлами.
Экспандеры (Expander graphs)
Графы, обладающие высокой связностью и малым диаметром при небольшой плотности ребер.
Алгоритмическое мышление
Способность нейросетей имитировать работу классических алгоритмов внутри скрытых состояний.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Petar Veličković DeepMind Graph Neural Networks Algorithmic Reasoning Category Theory