Владлен Колтун: «Высший разум — это лишь надстройка над физическим телом»

Eye on AI 819 1 ч 3 мин 4 мин 02.03.2022
Главное

В современном мире искусственного интеллекта доминируют языковые модели, однако один из ведущих исследователей в области компьютерного зрения и робототехники, Владлен Колтун (Vladlen Koltun), уверен: путь к истинному разуму лежит через физическое тело. В интервью для подкаста Eye on AI ученый, успевший поработать в Intel и Apple, объясняет, почему для создания интеллекта уровня млекопитающего нам нужны не только алгоритмы, но и роботы, способные «чувствовать» поверхность под ногами и летать сквозь густой лес.

🤖 От теории к воплощению: путь Владлена Колтуна 2:38

Владлен Колтун начал свою карьеру как чистый теоретик . Получив докторскую степень в Тель-Авивском университете и поработав в Беркли и Стэнфорде, он прошел путь трансформации от математики к компьютерной графике, а затем к машинному обучению и робототехнике .

В его исследованиях можно выделить два главных вектора:

  1. Фотореализм и эффект присутствия. Колтун признается, что его любовь к программированию началась с компьютерной графики, которую он воспринимал как магию . На это его вдохновила не индустрия игр, а «демосцена» (demo scene) — сообщество цифровых художников, объединявших программирование, музыку и визуальное искусство в реальном времени .
  2. Природа интеллекта. Вторая страсть ученого — понимание того, как возникает разум в физических системах .

🧠 Гипотеза воплощенного интеллекта 11:50

Основной тезис Колтуна заключается в том, что высшие формы когнитивных способностей (игра в шахматы, написание симфоний) — это лишь тонкая надстройка над мощным фундаментом физического интеллекта . По мнению ученого, эволюции потребовались сотни миллионов лет, чтобы отточить связку «восприятие — действие», тогда как переход к абстрактному мышлению произошел практически мгновенно .

Ключевые идеи этой концепции:

В своих взглядах Колтун опирается на работы пионеров робототехники Ганса Моравека и Рода Брукса, которые еще в 80-х годах выступали против «логической школы» ИИ, утверждая приоритет физического взаимодействия над чистыми вычислениями .

🐕 Роботы, которые не падают: прорыв в локомоции 16:26

В сотрудничестве с лабораторией ETH Zurich Колтун разработал контроллер для четырехногих роботов, который радикально повышает их устойчивость.

Главное техническое новшество — использование рекуррентного энкодера для создания «интегрированного состояния убеждения» (integrated belief state) . Этот алгоритм объединяет два типа данных:

  1. Проприоцепция: внутреннее чувство тела (углы суставов, ускорение, состояние мышц), получаемое от IMU-сенсоров .
  2. Экстроцепция (зрение): данные о внешней среде от LiDAR или глубоких камер .

Адаптивность против хрупкости

Главная проблема классических роботов (включая ранние модели Boston Dynamics) — их зависимость от точных данных датчиков . Например, если датчик глубины видит густую траву, он может принять её за твердую кочку. Робот пытается опереться на неё и падает.

Подход Колтуна позволяет роботу «доверять, но проверять» . Если визуальные данные обещают твердую опору, а проприоцепция сигнализирует о провале ноги, энкодер мгновенно начинает игнорировать зрение и полагается на ощущения тела . Это делает систему невероятно надежной: робот может танцевать на лестницах любого типа без предварительной настройки «режима лестницы», который требуется тому же роботу Spot от Boston Dynamics .

🚁 Дроны в лесу и проект Megaverse 47:31

Помимо наземных систем, Колтун работает над автономными дронами, способными летать сквозь густой лес на высокой скорости, избегая препятствий в реальном времени . Это требует предельно плотной связки зрения и управления.

Для обучения таких систем Колтун и его команда создали Megaverse — 3D-платформу для обучения ИИ в симуляции со скоростью 1 000 000 кадров в секунду .

🚀 Будущее: от перемещения к манипуляции 1:00:47

Владлен Колтун полагает, что нынешний этап развития робототехники — это эра «ловкого перемещения». Роботы научились ходить, бегать и не падать. Следующим великим вызовом станет манипуляция средой .

Его цель — создание систем с уровнем автономности собаки-спасателя в Альпах, которая может часами самостоятельно исследовать горы, находить людей и приносить им помощь . Ученый верит, что именно через решение таких сложных физических задач мы придем к созданию по-настоящему универсального искусственного интеллекта.

💬 Цитаты

«Фундамент физического интеллекта создавался сотни миллионов лет. Вся игра в шахматы и написание симфоний кажутся гораздо более простыми задачами, судя по тому, как быстро эволюция их вывела.»

Владлен Колтун 14:26

«Мы не добьемся понимания интеллекта, если не будем участвовать в создании реально функционирующих, высокоспособных физических систем.»

Владлен Колтун 33:20
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Проприоцепция
Ощущение положения частей собственного тела относительно друг друга и в пространстве.
Экстроцепция
Восприятие внешних стимулов (зрением, слухом), приходящих из окружающей среды.
Рекуррентный энкодер
Нейронная сеть с памятью, которая обновляет свое внутреннее состояние на основе прошлых и текущих данных.
Демосцена
Субкультура компьютерного искусства, направленная на создание программ (демо), сочетающих графику и музыку.
📊 Цифры
🗓 Хронология
  1. 1980-е Марк Райберт и Ганс Моравек закладывают основы современной робототехники и теории воплощенного интеллекта.
  2. 2021 Выход работ Колтуна по устойчивой локомоции четвероногих роботов и запуск Megaverse.
⚖️ Другая сторона
Искусственный интеллект Владлен Колтун Megaverse Boston Dynamics воплощенный интеллект робототехника