# Сергей Левайн: «Интеллект роботов рождается из взаимодействия с миром, а не из шахмат»

Источник: https://www.youtube.com/watch?v=LOZE81Xb8uY
Канал: Eye on AI
Опубликовано: 01.05.2019

---

Сергей Левайн, профессор Калифорнийского университета в Беркли, считается одним из ведущих мировых экспертов в области глубокого обучения с подкреплением и робототехники. В беседе с Крейгом Смитом он объясняет, почему традиционные методы управления роботами уступают место нейросетям, как «цифровые сны» помогают машинам учиться и почему физическая реальность — лучший учитель для искусственного интеллекта.

## 🤖 От компьютерной графики к физическим телам
[[JUMP:01:04]]

Свой путь в науку Сергей Левайн начал с интереса к видеоиграм и визуальным эффектам [01:04]. Изначально его увлекала возможность создавать искусственные миры, исправляя несовершенства реальности. Однако самой сложной задачей в графике оказалось моделирование поведения людей. Левайн обнаружил, что для реалистичной анимации виртуальных персонажей требуются не просто формулы движения, а полноценный искусственный интеллект [01:56].

В ходе работы над диссертацией в Стэнфорде он пришел к выводу, что алгоритмы, обучающие виртуальные модели ходить и прыгать, универсальны. Они могут быть применены к реальным физическим системам. Гость подчеркивает свою ключевую гипотезу: путь к сложному интеллекту лежит не через абстрактные задачи вроде шахмат, а через освоение базовых моторных навыков — ходьбы и манипуляций предметами, которые даются легко трехлетнему ребенку, но крайне трудны для машин [03:27].

## 🧪 Реальный мир как незаменимый стимул
[[JUMP:06:13]]

На вопрос о том, зачем работать с капризным «железом» вместо удобных симуляций, Левайн отвечает, что интеллект не возникает сам по себе — он формируется через взаимодействие с окружающей средой [06:25]. По его мнению, именно среда диктует необходимость развития разума.

Аргументы Левайна в пользу физических роботов:

*   **Сложность среды:** Создать симулятор, который требовал бы такой же гибкости мышления, как реальный мир, невероятно сложно [07:15].
*   **Избавление от догадок:** Работая в реальности, ученые используют среду, о которой уже точно известно, что она достаточна для возникновения интеллекта (поскольку в ней развился человек) [08:06].
*   **Естественная вариативность:** В реальности робот неизбежно сталкивается с разнообразием условий, что заставляет его учиться обобщению, а не простому зазубриванию сценария [28:05].

## 🧠 Смена парадигмы: от уравнений к обучению
[[JUMP:10:07]]

Исторически робототехника строилась на классических методах управления (Control Theory). Инженеры описывали физику системы идеальными уравнениями: вычисляли необходимые силы для каждого мотора, чтобы рука робота двигалась по строгой траектории [11:12]. Однако такие модели ломаются, если физика объекта чуть-чуть меняется или если уравнения не учитывают все нюансы трения и плотности.

Левайн утверждает, что сейчас наступает переломный момент (2019 год как важная веха), когда классическое планирование уступает место обучению [12:44].

1.  **Проблема «мертвого» кода:** В заводских роботах и большинстве беспилотных авто до сих пор используются старые аналитические модели [12:57].
2.  **Магия появления признаков:** Как и в компьютерном зрении, где нейросети сами научились распознавать углы и формы, в робототехнике низкоуровневые моторные примитивы начинают формироваться из данных автоматически [04:30].
3.  **Гибкость:** Обучающаяся машина может «обходить» баги в коде или несовершенства конструкции, адаптируясь к ним в процессе практики [34:26].

## 👐 Революция осязания: «Видящие» пальцы
[[JUMP:13:23]]

В качестве примера преимущества обучения Левайн приводит разработку сенсоров касания GelSight (созданных в MIT). Традиционные датчики давления крайне сложно калибровать в Ньютонах или фунтах на квадратный дюйм для использования в формулах [14:02].

Команда Левайна пошла другим путем: они использовали камеру внутри гелевого наконечника пальца робота, которая видит деформацию материала при касании [17:13]. Вместо того чтобы переводить картинку в цифры давления, они скормили «сырое» видео нейросети [15:20]. В итоге робот научился манипулировать 20-гранным кубиком, просто представляя через нейросеть, как изменится картинка касания при выполнении того или иного движения [15:58]. По словам Левайна, если сенсор дает хоть какую-то коррелирующую информацию, мощный алгоритм сам найдет способ её использовать [19:07].

## 💤 Роботизированные сны и самообучение
[[JUMP:24:15]]

Одной из самых захватывающих тем беседы стали механизмы того, как роботы проводят время вне выполнения задач.

*   **Фаза игры:** Робот может практиковаться без конкретного вознаграждения, просто пытаясь максимально разнообразить свой опыт [24:40].
*   **Сны как переработка данных:** Левайн проводит аналогию с человеческим сном. В системе хранятся огромные массивы видео прошлых действий («буфер воспроизведения»). Ночью или в свободное время алгоритм «прокручивает» эти данные, обновляя веса нейросети, чтобы не забыть старый опыт при получении нового [29:13].
*   **Воображение целей:** Алгоритм **Skew-Fit** позволяет роботу ставить перед собой воображаемые цели. Он анализирует, что видел раньше, и пытается достичь состояний, которые встречались реже всего (например, если он 10 раз открыл дверь и 1 раз случайно сдвинул чашку, он сфокусируется на манипуляциях с чашкой как на «редком» и интересном событии) [31:25].

## 🌏 Геополитика и будущее AI
[[JUMP:35:18]]

В завершение разговора коснулись темы «гонки вооружений» в области AI между США, Китаем и Россией. Левайн, родившийся в Москве, сохраняет умеренный оптимизм по поводу международной открытости науки.

Он утверждает, что ведущие ученые из России и Китая публикуют свои лучшие работы на английском языке в открытом доступе [36:39]. По его мнению, создание «закрытого Манхэттенского проекта» в области AI было бы неэффективным, так как эта сфера критически зависит от привлечения и удержания лучших талантов, которые предпочитают работать в открытом научном сообществе [37:04]. Левайн убежден, что прорывы не случаются в вакууме секретных лабораторий — все идеи витают в воздухе и строятся на наработках коллег [36:11].