Путь к сверхразуму: Юрген Шмидхубер об архитектуре будущего и ограничениях LLM 0:00
Юрген Шмидхубер (Jürgen Schmidhuber), которого называют «отцом» современного искусственного интеллекта, утверждает, что современная индустрия переоценивает возможности больших языковых моделей (LLM), таких как ChatGPT. В интервью каналу Machine Learning Street Talk ученый подчеркивает, что нынешний бум вокруг AGI (искусственного общего интеллекта) вызван непониманием фундаментальных ограничений нейронных сетей и чрезмерным маркетинговым хайпом со стороны венчурных инвесторов и стартапов.
🧠 Почему LLM — это еще не AGI 26:44
По мнению Шмидхубера, успех ChatGPT создал иллюзию близости сверхразума, так как люди склонны к антропоморфизму — приписыванию машине человеческих качеств. Однако, с технической точки зрения, он характеризует текущие LLM следующим образом:
- Отсутствие базы знаний: Модели не занимаются накоплением знаний в истинном смысле, они не обладают способностью к рассуждению, творчеству или агентности.
- Сложные аппроксиматоры: Это статистические модели, «подгоняющие» параметры под распределение данных. Они прекрасно работают там, где данных много, но пасуют, когда плотность распределения низка.
- Ограниченность обучения: Многие исследователи переоценивают возможности LLM, так как сами не до конца осознают, что эти сети не способны выполнять даже элементарные логические задачи, такие как определение четности (parity) в строках битов.
🤖 Путь к настоящему AGI: Реинфорсмент-обучение и мир роботов 30:33
Шмидхубер полагает, что путь к AGI лежит через reinforcement learning (обучение с подкреплением). Будущие системы должны действовать как воплощенный ИИ (embodied AI), работающий в реальном физическом мире.
- Ограниченность видеоигр: В виртуальных симуляциях можно «воскресить» агента после неудачи, но в реальности цена ошибки критична. Робот должен обучаться крайне эффективно, минимизируя количество необходимых проб для построения точной модели мира.
- Модели мира: ИИ должен иметь внутреннюю предиктивную модель, которая позволяет планировать действия в будущем, опираясь не на перебор всех вариантов (как в шахматах), а на высокоуровневые концепции.
- Иерархическое обучение: Человек не планирует движение мышц пальцев, чтобы набрать номер — он оперирует концепцией «вызвать такси». Аналогично, AGI должен декомпозировать задачи на подцели, используя ранее изученные подпрограммы.
📉 Наука как прогресс сжатия данных 51:39
Ключевой теоретический тезис Шмидхубера заключается в том, что прогресс науки — это история прогрессивного сжатия данных.
- Суть метода: Когда ученый находит закономерность (например, закон всемирного тяготения), он может описывать сложные явления (движение планет, падение яблок) через простые формулы. Это позволяет сжать колоссальные объемы наблюдений до минимума информации.
- Искусственный ученый: Система ИИ должна ставить себе собственные цели: искать в окружающей среде такие закономерности, которые еще не описаны, и «сжимать» их. Это придает ИИ своего рода «любопытство».
- Аналоговое мышление: Шмидхубер рассматривает рассуждение по аналогии как частный случай сжатия. Если алгоритм движения электронов вокруг ядра похож на алгоритм движения планет вокруг Солнца, то мы можем описать оба процесса с помощью общего кода, что экономит вычислительные ресурсы.
🏗️ История инноваций: От линейных трансформеров до LSTM 1:05:27
Юрген Шмидхубер напоминает, что многие современные успехи базируются на наработках его лаборатории, сделанных десятилетия назад:
- Трансформеры (1991): В 1991 году Шмидхубер предложил архитектуру «быстрого управления весами» (fast weight controller), которая является прародителем линейных трансформеров.
- GANs (1990): Идея состязательного обучения (генератор и предсказатель) возникла в его лаборатории как способ реализации «искусственного любопытства».
- LSTM: Разработанная его командой технология долгой краткосрочной памяти (Long Short-Term Memory) стала основой для многих переводчиков и чат-ботов прошлого десятилетия.
- X-LSTM: Ученый отмечает новую перспективную разработку его ученика Зеппа Хохрайтера — архитектуру X-LSTM, которая масштабируется линейно, а не квадратично, и показывает превосходство в понимании семантики текста.
⚖️ Резюме: Будущее вычислений 1:23:28
Шмидхубер предсказывает, что развитие вычислительных мощностей неизбежно приведет к созданию компьютеров, превосходящих человеческий мозг. Однако этот рост ограничен физическими пределами: согласно пределу Бекенштейна (1982), существуют фундаментальные ограничения на количество операций в секунду для заданного объема массы (1 кг материи не может вычислять более $10^{51}$ операций в секунду). В долгосрочной перспективе, после достижения этого предела, прогресс будет определяться не экспоненциальным ростом скорости, а полиномиальным расширением экспансии в космос для использования новых физических ресурсов.