Дилип Джордж о пути к AGI: почему здравый смысл невозможен без моделирования мира

The TWIML AI Podcast 718 55 мин 5 мин 23.12.2020
Главное

Дилемма современного искусственного интеллекта заключается в разрыве между способностью нейросетей обрабатывать колоссальные объемы данных и их фатальной неспособностью применять здравый смысл в новых ситуациях. Дилип Джордж, сооснователь и технический директор компании Vicarius, в беседе с Сэмом Чаррингтоном на подкасте TWIML AI, доказывает, что путь к по-настоящему общему интеллекту (AGI) лежит через алгоритмическое воспроизведение архитектуры человеческого неокортекса и использование вероятностных графических моделей.

🧠 Биологическое вдохновение: путь от Numenta к Vicarius 0:52

Диалог начинается с обсуждения профессионального пути Дилипа Джорджа, который получил степени бакалавра, магистра и доктора наук в области электротехники в Стэнфорде . Его интерес к ИИ зародился в попытках понять алгоритмические принципы работы мозга. Во время обучения он встретил Джеффа Хокинса, основателя Института нейронауки, и вместе с ним основал компанию Numenta .

В 2010 году Дилип Джордж и Скотт Феникс создали компанию Vicarius с амбициозной целью — построить AGI на основе принципов работы мозга . Причиной отделения от Numenta стали идеологические и технические разногласия:

Джордж иронично отмечает, что «биологическое вдохновение» стало модным трендом в маркетинге ИИ-стартапов, что помогает привлекать инвестиции, но зачастую за этим скрываются лишь поверхностные аналогии .

🌍 Почему человеческий интеллект — единственный ориентир 7:40

В споре о том, помогает ли заимствование идей у природы развитию ИИ или тормозит его, Дилип Джордж занимает жесткую позицию: мозг — это единственное существующее доказательство возможности существования общего интеллекта .

Он приводит два ключевых аргумента в пользу изучения мозга:

  1. Reference Point (Опорная точка): Мы не знаем других примеров интеллекта, способного так же робастно понимать язык, визуальные образы и физику мира, как человек .
  2. Эффективность обучения: Современные системы глубокого обучения (Deep Learning) требуют миллионов примеров. Человек же обучается на единицах кейсов. Дилип считает, что это происходит благодаря «априорным предположениям» (assumptions), которые эволюция заложила в архитектуру неокортекса .

По мнению гостя, человеческий мозг не является абсолютно универсальной машиной для любых данных — он узко настроен на статистику и физику нашей реальности . Если предложить человеку задачу по классификации QR-кодов или шума, он справится с ней гораздо хуже, чем стандартная нейросеть, потому что мозг «заточен» под естественные сигналы .

🖼️ Здравый смысл как генеративный процесс 12:41

Одним из самых ярких примеров в беседе становится разбор фразы «Джон забил гвоздь в стену» . Дилип Джордж утверждает, что человек понимает это сообщение, запуская внутреннюю симуляцию. Мы автоматически «видим» положение гвоздя (горизонтальное) и представляем свойства материалов .

Основные тезисы Дилипа о понимании мира:

В качестве примера композиционности Дилип приводит концепт «стула из льда» . Человек легко представляет его, комбинируя форму стула и свойства льда, даже если никогда не видел такого объекта в реальности.

🤖 От теории к практике: робототехника в Vicarius 24:49

Несмотря на глобальную цель создания AGI, Vicarius фокусируется на прикладных задачах промышленной автоматизации. Компания коммерциализирует свои разработки через роботизацию складов и сборочных линий .

Особенности подхода Vicarius к роботам:

Дилип подчеркивает, что хотя их теоретические модели (например, Schema Networks для динамики) очень мощные, на практике в роботов внедряются только те части, которые обеспечивают необходимую в производстве скорость .

🧩 Recursive Cortical Networks (RCN) и взлом капчи 31:12

Модель RCN стала известна благодаря тому, что эффективно «взломала» текстовые капчи, сделав их фактически бесполезными для защиты от ботов . По словам Дилипа, капчи были выбраны как тест на сильную генерализацию: человек решает их вне зависимости от шрифта или шума, не просматривая миллионы обучающих примеров .

Механика работы RCN:

  1. Причинно-следственная модель: Система знает, как генерируются пиксели из концептов (например, буква «A» накладывается на фон) .
  2. Анализ через синтез: При получении изображения модель выдвигает гипотезу («кажется, это А»), генерирует свой вариант и сравнивает его с реальностью .
  3. Согласованность: С помощью алгоритма передачи сообщений (message passing) узлы графа быстро приходят к общему решению, которое объясняет всю сцену .

🎮 Schema Networks против Deep Reinforcement Learning 39:48

Дилип Джордж критикует современное обучение с подкреплением (RL). Он упоминает успехи глубокого RL в играх Atari, подчеркивая, что эти системы демонстрируют лишь «сверхчеловеческие рефлексы», а не понимание игры .

В эксперименте с игрой Breakout, если вставить в поле лишнюю стену, обученный агент на базе глубокого RL терпит крах, в то время как человек адаптируется мгновенно . Причина в том, что агент не строит модель мира, а просто заучивает соответствие стимула и реакции.

Schema Networks, напротив:

Дилеп признает, что глубокое обучение сейчас доминирует из-за простоты масштабирования и огромного количества инструментов , в то время как его подход требует глубокой экспертизы в графах и теоретической подготовке .

📉 Ограниченность GPT-3 и будущее ИИ 48:56

Обсуждая хайп вокруг больших языковых моделей, Дилип Джордж отмечает, что GPT-3 — это «тривиально генеративная» модель . Она способна генерировать данные только в одном направлении (предсказание следующего слова или дорисовывание нижней части картинки), но не может проводить произвольные инференсы (выводы) .

По мнению Дилипа, настоящий интеллект должен уметь отвечать на любые запросы к своей модели мира, а не только следовать заученной векторизации . Он уверен, что в будущем ключевыми элементами ИИ станут:

В завершение Джордж предполагает, что даже когда будет создан AGI, классические нейросети не исчезнут. Они станут инструментами для этого разума — подобно тому, как люди используют калькуляторы для вычислений, в которых биологический мозг слаб .

💬 Цитаты

«Когда я говорю «Джон забил гвоздь в стену», вы не просто обрабатываете слова, вы запускаете симуляцию этой сцены в голове.»

Дилип Джордж 13:35

«Существующие алгоритмы глубокого обучения — это скорее коленные рефлексы, чем реальное понимание ситуации.»

Дилип Джордж 41:31
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Искусственный общий интеллект, способный выполнять любую интеллектуальную задачу на уровне человека.
Вероятностные графические модели
Математическая структура для представления зависимостей между переменными с помощью графов, способная учитывать неопределенность.
Recursive Cortical Networks (RCN)
Генеративная модель видения, созданная Vicarius, которая имитирует принципы распознавания объектов в неокортексе.
Schema Networks
Модели, предназначенные для изучения динамики и причинно-следственных связей в окружающей среде (например, в играх).
📊 Цифры
🗓 Хронология
  1. 2005 Дилип Джордж становится сооснователем Numenta вместе с Джеффом Хокинсом во время защиты докторской диссертации.
  2. 2010 Основание компании Vicarius для разработки AGI.
  3. 2013 Vicarius объявляет о создании системы, способной проходить текстовые капчи с эффективностью выше 90%.
  4. 2017 Публикация знаковой работы о Recursive Cortical Networks в журнале Science.
⚖️ Другая сторона
Искусственный интеллект Dileep George Vicarius AGI Numenta Recursive Cortical Networks