Юрген Шмидхубер о краже идей, природе сознания и колонизации космоса

Machine Learning Street Talk 24,5 тыс. 1 ч 12 мин 5 мин 16.01.2025
Главное

Современная эпоха искусственного интеллекта часто воспринимается как результат недавних прорывов, совершенных в Кремниевой долине. Однако Юрген Шмидхубер (Jürgen Schmidhuber), один из отцов-основателей глубокого обучения, уверен: фундамент нынешней революции был заложен десятилетия назад, а официальная история ИИ требует серьезной корректировки. В масштабном интервью для канала Machine Learning Street Talk ученый рассуждает о «магии» 1991 года, алгоритмическом плагиате и будущем, где человечество окажется лишь кратким эпизодом в истории усложнения Вселенной.

💥 От удобрений к ИИ: главные взрывы цивилизации 2:08

Юрген Шмидхубер начинает с исторической аналогии, чтобы подчеркнуть масштаб происходящего. По его мнению, самым влиятельным изобретением XX века стал процесс Габера — Боша (разработанный около 1908 года), позволивший синтезировать аммиак для удобрений. Именно эта технология вызвала демографический взрыв: население планеты выросло с 1,6 миллиарда в 1900 году до почти 10 миллиардов в ближайшем будущем. Без этого изобретения, как утверждает гость, половина человечества просто не существовала бы.

Однако «темой номер один» XXI века станет настоящий искусственный интеллект (AGI), который приведет к «взрыву ИИ». Шмидхубер считает, что грядущая трансформация цивилизации заставит популяционный взрыв прошлого века выглядеть блекло. По его мнению, развитие ИИ — это естественное продолжение эволюции Вселенной от простых начальных условий к непостижимой сложности.

🏗️ Наследие 1991 года: Линейные трансформеры и «P» в GPT 5:23

Обсуждая успех современных архитектур вроде ChatGPT, ученый напоминает, что их ключевые элементы были описаны им еще треть века назад. В 1991 году, когда вычислительные мощности были примерно в 5 миллионов раз дороже, чем сегодня, Шмидхубер опубликовал работу о модели, которую он назвал «контроллером быстрых весов» (Fast Weight Controller).

Основные технические особенности этой работы, по словам автора:

Кроме того, Шмидхубер приписывает своему коллективу в Мюнхене авторство концепции предобучения (Pre-training) и первых состязательных сетей (GAN). Последние он тогда называл «искусственным любопытством». В этой системе одна сеть (контроллер) пытается «обмануть» вторую (предсказатель), заставляя её сталкиваться с удивительными, непредсказуемыми данными, что стимулирует самообучение роботов.

🎮 Лотерея оборудования и триумф GPU 15:27

Юрген Шмидхубер соглашается с тезисом Сары Хукер о «лотерее оборудования» (hardware lottery): ИИ совершил рывок не из-за внезапного озарения исследователей, а потому что индустрия видеоигр создала дешевые и мощные GPU.

Вехи этого пути:

  1. 2009 год: Стоимость вычислений упала настолько, что архитектура LSTM (разработанная учеником Шмидхубера Алексом Грейвсом) начала выигрывать конкурсы по распознаванию рукописного текста.
  2. 2010 год: Команда Дана Чирешана побила рекорд на бенчмарке MNIST, используя стандартные нейросети на GPU NVIDIA. Вычисления тогда были в 1000 раз дороже, чем сейчас.
  3. 2011 год: Создание DanNet — первой системы на базе сверточных нейросетей (CNN), показавшей сверхчеловеческие результаты в компьютерном зрении.

По словам Шмидхубера, глава NVIDIA Дженсен Хуанг вовремя осознал, что глубокое обучение может вывести его компанию на «стратосферный уровень», и сделал на это ставку.

📜 «Украденная» история и научная этика 40:37

Значительную часть беседы ученый посвящает критике того, что он называет «американоцентричным взглядом на историю ИИ». По мнению Юргена Шмидхубера, лауреаты премии Тьюринга (Ян Лекун, Джеффри Хинтон и Йошуа Бенджио) перевыпустили ключевые идеи, не указав оригинальных авторов, что он прямо называет нарушением кодекса этики.

Юрген Шмидхубер утверждает, что реальная хронология глубокого обучения выглядит иначе:

Гость настаивает, что научное сообщество должно исправить эти ошибки, а нарушителей этики следует лишить наград. Он цитирует Элвиса Пресли: «Истина подобна солнцу. Ее можно закрыть на время, но она никуда не уйдет».

🧠 Природа сознания как побочный продукт сжатия 25:45

Шмидхубер предлагает элегантную техническую интерпретацию сознания. По его мнению, это не мистическое свойство, а результат процесса сжатия данных (data compression).

Его модель 1991 года включает:

  1. Автоматизатор (Automatizer): «Подсознательная» сеть, которая выполняет привычные действия.
  2. Чанкер (Chunker): «Сознательная» сеть, которая фокусируется только на неожиданных событиях, которые удивляют автоматизатор.

Как только чанкер находит закономерность в неожиданном событии, он «дистиллирует» это знание в автоматизатор, и действие перестает быть осознанным. В этом процессе неизбежно возникает «символ себя» (self-symbol) — нейронная репрезентация самого агента, так как он является единственным объектом, присутствующим во всех действиях и наблюдениях. Таким образом, самосознание — это просто эффективный способ сжимать историю взаимодействий с миром.

🚀 Будущее: Космическая экспансия и Fermi Paradox 54:27

Вопреки опасениям Илона Маска и других сторонников теории экзистенциального риска, Шмидхубер оптимистичен. Он полагает, что у суперинтеллекта не будет причин истреблять человечество. По его словам, ИИ будут вести себя как «любопытные ученые», для которых жизнь и цивилизация — богатый источник интересных, еще не до конца понятых паттернов.

Ключевые тезисы о будущем:

В завершение ученый делится своей теорией «цифровой физики»: наша Вселенная может быть продуктом кратчайшей и быстрейшей программы, вычисляющей все логически возможные миры. «Не волнуйтесь, — подытоживает Шмидхубер, — в конце концов все будет хорошо».

💬 Цитаты

«Истина подобна солнцу. Ее можно закрыть на время, но она никуда не уйдет.»

Юрген Шмидхубер 44:52

«Самосознание — это просто естественный побочный продукт процесса сжатия данных в модели мира.»

Юрген Шмидхубер 30:59

«Человечество — это важный шаг, но не последний на пути Вселенной к все более непостижимой сложности.»

Юрген Шмидхубер 57:15
👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
LSTM
Архитектура долгой краткосрочной памяти, позволяющая нейросетям запоминать информацию на долгие периоды.
Линейный трансформер
Вариант архитектуры трансформера, вычислительная сложность которого растет линейно, а не квадратично относительно длины входа.
Дистилляция нейросети
Процесс передачи знаний от большой и сложной модели (учителя) к более компактной и быстрой (ученику).
Hardware Lottery
Тезис о том, что успех научной идеи часто зависит не от ее качества, а от доступности подходящего оборудования в момент появления.
📊 Цифры
🗓 Хронология
  1. 1676 Готфрид Лейбниц описывает цепное правило (основа backpropagation).
  2. 1965 Ивахненко и Лапа публикуют работу о первых глубоких нейросетях в СССР/Украине.
  3. 1970 Сеппо Линнайнмаа представляет метод автоматического дифференцирования (backpropagation).
  4. 1991 Публикация работ Шмидхубера о линейных трансформерах, GAN и сжатии данных.
  5. 2010 Команда Дана Чирешана впервые выигрывает конкурс по распознаванию образов с помощью глубоких сетей на GPU.
⚖️ Другая сторона
Искусственный интеллект Jürgen Schmidhuber LSTM Transformer Deep Learning Nvidia