Юрген Шмидхубер: «Современные LLM — это не AGI»

Machine Learning Street Talk 97,8 тыс. 1 ч 39 мин 3 мин 28.08.2024
Главное

Путь к сверхразуму: Юрген Шмидхубер об архитектуре будущего и ограничениях LLM 0:00

Юрген Шмидхубер (Jürgen Schmidhuber), которого называют «отцом» современного искусственного интеллекта, утверждает, что современная индустрия переоценивает возможности больших языковых моделей (LLM), таких как ChatGPT. В интервью каналу Machine Learning Street Talk ученый подчеркивает, что нынешний бум вокруг AGI (искусственного общего интеллекта) вызван непониманием фундаментальных ограничений нейронных сетей и чрезмерным маркетинговым хайпом со стороны венчурных инвесторов и стартапов.

🧠 Почему LLM — это еще не AGI 26:44

По мнению Шмидхубера, успех ChatGPT создал иллюзию близости сверхразума, так как люди склонны к антропоморфизму — приписыванию машине человеческих качеств. Однако, с технической точки зрения, он характеризует текущие LLM следующим образом:

🤖 Путь к настоящему AGI: Реинфорсмент-обучение и мир роботов 30:33

Шмидхубер полагает, что путь к AGI лежит через reinforcement learning (обучение с подкреплением). Будущие системы должны действовать как воплощенный ИИ (embodied AI), работающий в реальном физическом мире.

📉 Наука как прогресс сжатия данных 51:39

Ключевой теоретический тезис Шмидхубера заключается в том, что прогресс науки — это история прогрессивного сжатия данных.

  1. Суть метода: Когда ученый находит закономерность (например, закон всемирного тяготения), он может описывать сложные явления (движение планет, падение яблок) через простые формулы. Это позволяет сжать колоссальные объемы наблюдений до минимума информации.
  2. Искусственный ученый: Система ИИ должна ставить себе собственные цели: искать в окружающей среде такие закономерности, которые еще не описаны, и «сжимать» их. Это придает ИИ своего рода «любопытство».
  3. Аналоговое мышление: Шмидхубер рассматривает рассуждение по аналогии как частный случай сжатия. Если алгоритм движения электронов вокруг ядра похож на алгоритм движения планет вокруг Солнца, то мы можем описать оба процесса с помощью общего кода, что экономит вычислительные ресурсы.

🏗️ История инноваций: От линейных трансформеров до LSTM 1:05:27

Юрген Шмидхубер напоминает, что многие современные успехи базируются на наработках его лаборатории, сделанных десятилетия назад:

⚖️ Резюме: Будущее вычислений 1:23:28

Шмидхубер предсказывает, что развитие вычислительных мощностей неизбежно приведет к созданию компьютеров, превосходящих человеческий мозг. Однако этот рост ограничен физическими пределами: согласно пределу Бекенштейна (1982), существуют фундаментальные ограничения на количество операций в секунду для заданного объема массы (1 кг материи не может вычислять более $10^{51}$ операций в секунду). В долгосрочной перспективе, после достижения этого предела, прогресс будет определяться не экспоненциальным ростом скорости, а полиномиальным расширением экспансии в космос для использования новых физических ресурсов.

💬 Цитаты

«Вся наука — это история прогресса в сжатии данных.»

Юрген Шмидхубер 58:01

«Люди, которые сейчас волнуются об AGI только из-за ChatGPT, в основном не знают многого об ИИ.»

Юрген Шмидхубер 27:37
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Искусственный общий интеллект, способный выполнять любую интеллектуальную задачу, доступную человеку.
Reinforcement Learning
Метод машинного обучения, где агент учится принимать решения, получая награду или штраф за свои действия.
LSTM
Архитектура рекуррентных нейронных сетей, эффективная для обработки длинных последовательностей данных.
Parity problem
Задача определения четности количества единиц в битовой строке, которую трудно решать классическим трансформерам.
Bekenstein limit
Физическое ограничение максимальной информации, которая может быть вычислена в заданной области пространства-времени.
📊 Цифры
🗓 Хронология
  1. 1941 Конрад Цузе построил первый программируемый компьютер.
  2. 1990-1991 Разработка основ GAN, трансформеров (линейных) и LSTM.
  3. 2015 Публикация работ по Highway Networks и концепции 'Learning to think'.
  4. 2026 Текущий момент, когда базовые технологии ИИ работают на каждом смартфоне.
⚖️ Другая сторона
Искусственный интеллект Jürgen Schmidhuber AGI Large Language Models LSTM Reinforcement Learning