Quanta Magazine о главных достижениях в Computer Science за 2023 год

Quanta Magazine 784 тыс. 11 мин 3 мин 20.12.2023
Главное

Революция в вычислениях: главные прорывы 2023 года 0:04

В 2023 году прогресс в области искусственного интеллекта и квантовых вычислений достиг новых высот, однако эксперты отмечают, что текущие архитектуры сталкиваются с фундаментальными ограничениями. Основные усилия исследователей сосредоточены на объединении различных подходов к логике, ускорении алгоритмов шифрования и понимании механизмов «эмерджентности» — внезапного появления новых способностей у нейросетей по мере их роста.

🧠 Гибридный интеллект: союз символов и статистики 1:10

Современные глубокие нейронные сети, основанные на статистическом подходе, демонстрируют успехи, но испытывают трудности с логическим выводом и обобщением знаний. В отличие от человека, способного к мышлению по аналогии, нейросети часто требуют существенного увеличения числа параметров для усвоения новых концепций.

Альтернативой выступает «символьный ИИ», использующий логическое программирование и работу с символами. Однако эти два подхода долгое время считались несовместимыми. Решением может стать «гипермерное вычисление» (Hyperdimensional Computing), которое пытается объединить сильные стороны обоих методов:

В марте 2023 года исследователи IBM Research в Цюрихе совершили прорыв, применив эту технологию для решения матриц Равена — теста на абстрактное мышление. Как поясняют ученые, задача состояла из двух этапов: перцептивного анализа объектов (цвет, форма) и абстрактного логического вывода на основе их свойств. Интеграция гипермерных вычислений с нейросетями позволила ускорить выполнение подобных задач в 250 раз, делая их пригодными для практического применения.

По мнению исследователей, помимо скорости, такой подход обещает сделать ИИ более прозрачным и энергоэффективным. Ожидается, что энергопотребление моделей может снизиться в 10–100 раз.

🔐 Квантовая криптография и алгоритм Регева 4:01

Более 30 лет алгоритм Питера Шора оставался эталонным методом факторизации (разложения на множители) больших чисел на квантовых компьютерах, что ставит под угрозу современные протоколы шифрования интернета. Суть метода Шора заключается в поиске периода повторяющейся функции путем многократного умножения числа на само себя.

В августе 2023 года математик Одед Регев опубликовал работу, описывающую усовершенствованный алгоритм.

Сам Питер Шор в комментариях отмечает, что прорыв Одеда Регева был неожиданным, так как никто ранее не предлагал такой идеи. Хотя алгоритм пока остается теоретическим, он может приблизить создание практичных квантовых систем. Шор выразил надежду, что в будущем исследователи найдут способы использования квантовых компьютеров для задач, которые сегодня кажутся невыполнимыми для классических систем.

🌟 Эмерджентные способности больших моделей 7:20

Одной из самых интригующих тем в развитии больших языковых моделей (LLM) стали «эмерджентные поведения» — способности, которые внезапно появляются у систем только после достижения определенного масштаба. Исследователи проводят аналогию с природными процессами, такими как формирование живых клеток из неживой материи или поведение стай птиц.

Ключевым фактором прогресса стала архитектура Transformer, представленная в 2017 году, которая позволила анализировать текст параллельно, а не последовательно. Это открыло путь к методам обучения, которые модель никогда не видела ранее, — так называемое «zero-shot» или «few-shot» обучение.

Однако природа этих явлений остается загадкой:

Эксперты Quanta Magazine подчеркивают: наука о понимании того, что происходит «под капотом» нейросетей, сейчас отстает от темпов их масштабирования. В связи с этим, критически важной задачей становится измерение возможных рисков, так как влияние моделей на общество и их будущие способы применения пока остаются труднопрогнозируемыми.

💬 Цитаты

«Как только мы объединяем гипермерные вычисления с методами глубокого обучения, мы получаем преимущества в решении задач абстрактного мышления.»

автор видео Quanta Magazine 01:50

«Масштаб — это не просто успех, это возникновение поведения, которого не было в малых моделях.»

автор видео Quanta Magazine 07:46
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Гипермерные вычисления (Hyperdimensional Computing)
Подход к ИИ, использующий векторы для кодирования информации, что имитирует символьную логику.
Алгоритм Шора
Квантовый алгоритм для нахождения простых множителей числа, теоретически способный взломать современное шифрование.
Эмерджентность
Появление у сложной системы свойств, не присущих ее отдельным элементам по отдельности.
Zero-shot learning
Способность модели выполнять задачу без предварительного обучения на конкретных примерах этой задачи.
📊 Цифры
🗓 Хронология
  1. 1990-е Питер Шор разработал алгоритм факторизации для квантовых компьютеров.
  2. 2017 Представлена архитектура Transformer, ставшая фундаментом для современных LLM.
  3. Март 2023 Исследователи IBM применили гипермерные вычисления для решения матриц Равена.
  4. Август 2023 Одед Регев опубликовал усовершенствованный алгоритм факторизации чисел.
⚖️ Другая сторона
Технологии и IT IBM Research Peter Shor Oded Regev Hyperdimensional Computing LLM