Как AlphaTensor побил 50-летний рекорд умножения матриц

Quanta Magazine 1,8 млн 13 мин 2 мин 22.05.2023
Главное

Умножение матриц — фундаментальная математическая операция, лежащая в основе всего: от компьютерной графики и нейронных сетей до квантовой физики. Долгое время совершенствование алгоритмов этой операции считалось колоссальной задачей, однако исследователям из DeepMind удалось установить новый рекорд, превзошедший результаты полувековой давности. Используя систему AlphaTensor, разработчики доказали, что искусственный интеллект способен не только находить более эффективные методы вычислений, но и становиться полноценным соавтором в фундаментальных математических открытиях.

📈 Проблема полувековой давности 1:09

Традиционный метод умножения матриц, который изучают в рамках линейной алгебры, базируется на алгоритме, известном уже несколько столетий.

Увеличение размера матриц приводит к экспоненциальному росту времени вычислений: если удвоить размер матрицы, время вычислений увеличится в 8 раз. В 1969 году немецкий математик Фолькер Штрассен (Volker Strassen) предложил алгоритм, сокращающий количество шагов умножения для матриц $2 \times 2$ с восьми до семи. Хотя дополнительные операции сложения в этом методе выглядят сложнее, для больших матриц выигрыш в скорости становится значительным, так как алгоритм можно рекурсивно применять к вложенным фрагментам.

Год спустя исследователь IBM Шмуэль Виноград доказал, что умножение матриц $2 \times 2$ невозможно выполнить менее чем за семь шагов, подтвердив оптимальность алгоритма Штрассена. Этот результат оставался непревзойденным более 50 лет.

🤖 Прорыв AlphaTensor 3:45

Компания DeepMind, известная своими успехами в обучении ИИ играм (например, победой AlphaGo над Ли Седолем в 2016 году), решила применить машинное обучение к задаче поиска оптимального умножения матриц. Исследователи предположили, что эта задача отлично подходит для техник машинного обучения.

Для решения была создана система AlphaTensor, построенная на базе алгоритма обучения с подкреплением AlphaZero.

В результате обучения AlphaTensor всего за несколько минут переоткрыл алгоритм Штрассена, а затем пошел дальше. В октябре 2022 года система нашла алгоритм для матриц $4 \times 4$ (в поле с элементами 0 или 1), требующий всего 47 умножений вместо 64 в стандартном методе или 49 в методе Штрассена.

🤝 Человек и ИИ: новая эра математики 11:13

Возникает закономерный вопрос: сделают ли подобные программы математиков ненужными? Ученые, работавшие над проектом, убеждены, что нет.

По словам разработчиков, AlphaTensor служит мощным инструментом, помогающим направлять интуицию исследователей. Эффективность такого сотрудничества подтвердилась практически сразу после публикации результатов в журнале Nature. Австрийские математики Мануэль Кауэрс и Якоб Мосбауэр использовали предложенный ИИ алгоритм для умножения матриц $5 \times 5$ (96 шагов) в качестве отправной точки.

Используя метод AlphaTensor как базу, исследователи смогли найти способ сократить количество шагов с 96 до 95, что было оформлено в отдельной научной публикации. Эксперты подчеркивают, что истинный потенциал заключается в коллаборации технологий и человеческого интеллекта, где ИИ расширяет возможности людей, позволяя достигать новых высот в науке.

💬 Цитаты

«Истинный потенциал для сотрудничества человека и искусственного интеллекта — это рубеж, который только сейчас начинает полностью исследоваться.»

Автор видео 12:31

«Я думаю, это просто дает людям возможность делать больше.»

Автор видео 12:43
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Матрица
Двумерный массив чисел, над которыми можно проводить математические операции.
Тензор
Обобщение понятия вектора и матрицы, массив чисел с любым количеством измерений.
Обучение с подкреплением
Метод обучения ИИ, при котором система получает награды или штрафы за свои действия, стремясь максимизировать успех.
Разложение тензора
Процесс разделения сложного трехмерного тензора на простые составные части (тензоры ранга 1).
Алгоритм Штрассена
Метод умножения матриц, позволяющий уменьшить количество операций умножения за счет более сложных операций сложения.
📊 Цифры
🗓 Хронология
  1. 1969 Фолькер Штрассен открывает новый алгоритм умножения матриц 2x2.
  2. 1970 Шмуэль Виноград доказывает оптимальность алгоритма Штрассена.
  3. 2016 AlphaGo побеждает Ли Седоля в игре в го.
  4. Октябрь 2022 DeepMind объявляет о создании алгоритма, бьющего рекорд Штрассена.
⚖️ Другая сторона
Математика и физика AlphaTensor DeepMind алгоритм Штрассена умножение матриц обучение с подкреплением