Сергей Левайн: «Интеллект роботов рождается из взаимодействия с миром, а не из шахмат»

Сергей Левайн, профессор Калифорнийского университета в Беркли, считается одним из ведущих мировых экспертов в области глубокого обучения с подкреплением и робототехники. В беседе с Крейгом Смитом он объясняет, почему традиционные методы управления роботами уступают место нейросетям, как «цифровые сны» помогают машинам учиться и почему физическая реальность — лучший учитель для искусственного интеллекта.

🤖 От компьютерной графики к физическим телам 1:04

Свой путь в науку Сергей Левайн начал с интереса к видеоиграм и визуальным эффектам . Изначально его увлекала возможность создавать искусственные миры, исправляя несовершенства реальности. Однако самой сложной задачей в графике оказалось моделирование поведения людей. Левайн обнаружил, что для реалистичной анимации виртуальных персонажей требуются не просто формулы движения, а полноценный искусственный интеллект .

В ходе работы над диссертацией в Стэнфорде он пришел к выводу, что алгоритмы, обучающие виртуальные модели ходить и прыгать, универсальны. Они могут быть применены к реальным физическим системам. Гость подчеркивает свою ключевую гипотезу: путь к сложному интеллекту лежит не через абстрактные задачи вроде шахмат, а через освоение базовых моторных навыков — ходьбы и манипуляций предметами, которые даются легко трехлетнему ребенку, но крайне трудны для машин .

🧪 Реальный мир как незаменимый стимул 6:13

На вопрос о том, зачем работать с капризным «железом» вместо удобных симуляций, Левайн отвечает, что интеллект не возникает сам по себе — он формируется через взаимодействие с окружающей средой . По его мнению, именно среда диктует необходимость развития разума.

Аргументы Левайна в пользу физических роботов:

Сложность среды: Создать симулятор, который требовал бы такой же гибкости мышления, как реальный мир, невероятно сложно .
Избавление от догадок: Работая в реальности, ученые используют среду, о которой уже точно известно, что она достаточна для возникновения интеллекта (поскольку в ней развился человек) .
Естественная вариативность: В реальности робот неизбежно сталкивается с разнообразием условий, что заставляет его учиться обобщению, а не простому зазубриванию сценария .

🧠 Смена парадигмы: от уравнений к обучению 10:07

Исторически робототехника строилась на классических методах управления (Control Theory). Инженеры описывали физику системы идеальными уравнениями: вычисляли необходимые силы для каждого мотора, чтобы рука робота двигалась по строгой траектории . Однако такие модели ломаются, если физика объекта чуть-чуть меняется или если уравнения не учитывают все нюансы трения и плотности.

Левайн утверждает, что сейчас наступает переломный момент (2019 год как важная веха), когда классическое планирование уступает место обучению .

Проблема «мертвого» кода: В заводских роботах и большинстве беспилотных авто до сих пор используются старые аналитические модели .
Магия появления признаков: Как и в компьютерном зрении, где нейросети сами научились распознавать углы и формы, в робототехнике низкоуровневые моторные примитивы начинают формироваться из данных автоматически .
Гибкость: Обучающаяся машина может «обходить» баги в коде или несовершенства конструкции, адаптируясь к ним в процессе практики .

👐 Революция осязания: «Видящие» пальцы 13:23

В качестве примера преимущества обучения Левайн приводит разработку сенсоров касания GelSight (созданных в MIT). Традиционные датчики давления крайне сложно калибровать в Ньютонах или фунтах на квадратный дюйм для использования в формулах .

Команда Левайна пошла другим путем: они использовали камеру внутри гелевого наконечника пальца робота, которая видит деформацию материала при касании . Вместо того чтобы переводить картинку в цифры давления, они скормили «сырое» видео нейросети . В итоге робот научился манипулировать 20-гранным кубиком, просто представляя через нейросеть, как изменится картинка касания при выполнении того или иного движения . По словам Левайна, если сенсор дает хоть какую-то коррелирующую информацию, мощный алгоритм сам найдет способ её использовать .

💤 Роботизированные сны и самообучение 24:15

Одной из самых захватывающих тем беседы стали механизмы того, как роботы проводят время вне выполнения задач.

Фаза игры: Робот может практиковаться без конкретного вознаграждения, просто пытаясь максимально разнообразить свой опыт .
Сны как переработка данных: Левайн проводит аналогию с человеческим сном. В системе хранятся огромные массивы видео прошлых действий («буфер воспроизведения»). Ночью или в свободное время алгоритм «прокручивает» эти данные, обновляя веса нейросети, чтобы не забыть старый опыт при получении нового .
Воображение целей: Алгоритм Skew-Fit позволяет роботу ставить перед собой воображаемые цели. Он анализирует, что видел раньше, и пытается достичь состояний, которые встречались реже всего (например, если он 10 раз открыл дверь и 1 раз случайно сдвинул чашку, он сфокусируется на манипуляциях с чашкой как на «редком» и интересном событии) .

🌏 Геополитика и будущее AI 35:18

В завершение разговора коснулись темы «гонки вооружений» в области AI между США, Китаем и Россией. Левайн, родившийся в Москве, сохраняет умеренный оптимизм по поводу международной открытости науки.

Он утверждает, что ведущие ученые из России и Китая публикуют свои лучшие работы на английском языке в открытом доступе . По его мнению, создание «закрытого Манхэттенского проекта» в области AI было бы неэффективным, так как эта сфера критически зависит от привлечения и удержания лучших талантов, которые предпочитают работать в открытом научном сообществе . Левайн убежден, что прорывы не случаются в вакууме секретных лабораторий — все идеи витают в воздухе и строятся на наработках коллег .