Друв Батра: «Карты пространства возникают в ИИ сами собой, даже если агент слеп»

The TWIML AI Podcast 797 51 мин 4 мин 15.05.2023
Главное

В новом выпуске подкаста TWIML AI Сэм Черрингтон беседует с Друвом Батрой, доцентом Технологического института Джорджии и директором по исследованиям в команде фундаментального ИИ (FAIR) в Meta. Разговор сосредоточен вокруг их недавнего исследования, получившего награду на конференции ICLR, которое изучает поразительный феномен: как нейросети, лишенные зрения и явных алгоритмов картографирования, учатся создавать внутренние карты пространства для навигации.

🤖 Эксперимент с «слепыми» агентами и возникновение карт 14:41

В 2019 году команда Друва Батры разработала 3D-симулятор Habitat, предназначенный для обучения агентов навигации в виртуальных копиях реальных помещений (домов, офисов). В ходе работы исследователи задались фундаментальным вопросом: строят ли ИИ-агенты внутренние пространственные карты в процессе обучения навигации, если им не давать таких инструкций напрямую? .

Чтобы проверить это, был поставлен эксперимент с «слепыми» агентами. Условия опыта были жесткими:

Результаты оказались неожиданными для команды: слепые агенты не только научились достигать цели в 95% случаев, но и выработали стратегию, известную как «алгоритм жука» (bug algorithm) — они натыкались на стену и следовали вдоль неё до тех пор, пока не находили проход . По мнению Батры, это пример эмерджентного поведения, когда решение задачи рождает сложный алгоритм «само собой».

🧠 Биологические аналогии: от крыс Тоулмена до Нобелевской премии 15:49

Батра подчеркивает, что их работа опирается на десятилетия исследований навигации животных. Он приводит историческую ретроспективу, объясняющую, почему возникновение карт в ИИ так важно:

  1. 1948 год: Эдвард Тоулмен в Беркли доказал, что крысы в лабиринтах строят «когнитивные карты». Когда привычный путь блокировали, крысы находили кратчайшие пути (shortcuts), что доказывало: они не просто заучивают последовательность поворотов, а понимают структуру пространства .

  2. 1971 год: Джон О'Киф обнаружил в гиппокампе нейроны места (place cells), которые активируются при посещении определенных точек .

  3. 2005 год: Мей-Бритт и Эдвард Мозер открыли координатные нейроны (grid cells), работающие как внутренняя система GPS .

  4. 2014 год: Эти открытия были отмечены Нобелевской премией.

Батра утверждает, что его исследование подтверждает теорию конвергентной эволюции: искусственные системы приходят к тем же решениям (созданию карт), что и биологические организмы, когда сталкиваются с одинаковыми экологическими задачами .

🔍 Интроспекция нейросети: где прячется карта? 26:28

Исследователи провели «хирургический» анализ памяти LSTM, чтобы понять, что именно знает агент о мире. Были обнаружены следующие механизмы:

Батра признает, что, хотя они доказали наличие пространственной информации в памяти, они еще не нашли «механистического» объяснения уровня 2005 года — то есть не выделили конкретные эквиваленты координатных нейронов в коде нейросети .

🏗️ Гипотеза воплощенного интеллекта и Moravec’s Paradox 9:34

Батра активно развивает так называемую гипотезу воплощения (embodiment hypothesis). По его словам, единственный вид по-настоящему общего интеллекта (AGI), существующий в природе — это воплощенный интеллект .

Он упоминает парадокс Моравека: задачи, которые кажутся людям сложными (игра в шахматы или го), вычислительно легки для машин, в то время как «простые» действия (координация сенсорики и движений, манипуляция предметами) требуют колоссальных ресурсов ИИ .

Обсуждая текущий бум больших языковых моделей (LLM), Батра признается, что находится в состоянии внутреннего конфликта. С одной стороны, он верит, что интеллект должен иметь тело и взаимодействовать с 3D-миром. С другой стороны, прогресс «бестелесных» чат-ботов настолько велик, что возникает вопрос: есть ли у них потолок и можно ли достичь истинного разума только через текст?

🛠️ От симуляции к реальности: робот Spot и будущее 48:06

Несмотря на теоретическую направленность отмеченной наградой статьи, разработки Батры имеют прикладное значение. Он рассказал о недавнем проекте Adaptive Skill Coordination, где робот-пес Spot от Boston Dynamics выполнял задачи в реальном мире, основываясь исключительно на обучении в симуляции (Sim-to-Real) .

Батра считает ИИ не просто инженерной дисциплиной, а «наукой об интеллектуальных системах, которых еще не существует» . Он подчеркивает, что фундаментальные принципы интеллекта — такие как необходимость картографирования — должны выводиться через эксперименты, а не просто закладываться в код разработчиками .

💬 Цитаты

«Все хорошие открытия начинаются с фразы: «Хм, это странно».»

Друв Батра 41:29

«ИИ — это наука об интеллектуальных системах, которых еще не существует.»

Друв Батра 44:37

«Мы эволюционировали миллионы лет, чтобы быть очень хорошими в сенсомоторном контроле, но нам кажется, что играть в шахматы — это сложно.»

Друв Батра 10:02
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Ego-motion
Оценка движения агента (камеры или робота) относительно окружающей среды на основе собственных сенсоров.
Sim-to-Real
Метод переноса алгоритмов, обученных в виртуальной среде (симуляции), на физических роботов в реальном мире.
LSTM
Тип рекуррентной нейронной сети, способный запоминать информацию на долгие периоды времени.
Embodiment Hypothesis
Теория, согласно которой интеллект не может развиваться без физического взаимодействия с миром через тело.
📊 Цифры
🗓 Хронология
  1. 1948 Эдвард Тоулмен вводит понятие когнитивных карт у животных.
  2. 1971 Джон О'Киф открывает нейроны места в гиппокампе.
  3. 2014 Присуждение Нобелевской премии за открытие координатных нейронов.
  4. 2019 Выпуск симулятора Habitat и начало экспериментов со слепыми агентами.
  5. 2023 Работа Друва Батры получает награду Outstanding Paper на ICLR.
⚖️ Другая сторона
Искусственный интеллект Dhruv Batra Meta AI Sim-to-Real Habitat embodied intelligence