Как ИИ-модели мира обучают роботов не рассыпать конфеты и понимать контекст

Stanford Online 1,9 тыс. 1 ч 4 мин 5 мин 30.04.2025
Главное

На семинаре в Стэнфордском университете (Stanford University) обсуждалась одна из самых сложных проблем современной робототехники — обеспечение безопасности машин в непредсказуемом «открытом мире». Основной докладчик представил инновационный подход, объединяющий классическую теорию управления с современными генеративными моделями ИИ, чтобы научить роботов справляться с задачами, которые невозможно описать простыми формулами, например, не рассыпать конфеты из открытого пакета или подавать чашку воды, не касаясь её краев пальцами.

🛑 Почему «просто остановиться» — это не всегда безопасно 0:08

За последние десять лет робототехника совершила колоссальный скачок: от мучительных попыток заставить манипулятор просто поднять чашку до полностью беспилотных такси в центре Сан-Франциско . Однако широкое внедрение роботов в повседневную жизнь требует нового понимания безопасности, которое выходит далеко за рамки классического предотвращения столкновений.

Докладчик подчеркивает, что безопасность в открытом мире — это нюансированная концепция. В качестве примера приводится инцидент с автомобилем Tesla на мосту через залив Сан-Франциско :

Таким образом, принятие решений роботом критически зависит от контекста. Безопасный робот должен уметь запрашивать помощь при неопределенности и понимать последствия своих действий, например, не предлагать положить металлическую миску в микроволновую печь .

⚙️ Классический контроль и его ограничения 3:16

Традиционно безопасность роботов базировалась на теории робастного управления и методе достижимости Гамильтона-Якоби (Hamilton-Jacobi reachability). В этой математической структуре безопасность означает удовлетворение заданных ограничений .

Классический «фильтр безопасности» состоит из четырех обязательных ингредиентов:

  1. Пространство состояний: координаты, скорость, ориентация.
  2. Модель динамической системы: описание того, как действия робота меняют его состояние.
  3. Внешние возмущения: учет помех или действий других агентов.
  4. Описание отказа: четко заданное подмножество пространства состояний, в которое роботу заходить нельзя .

Несмотря на математическую стройность, у этого подхода есть «ахиллесова пята»: он требует ручного проектирования моделей динамики и датчиков столкновений. По словам спикера, любой студент знает, как мучительно выписывать эти правила для сложных систем . Более того, классические методы почти всегда сводятся к предотвращению столкновений, но они бессильны, если нужно описать разлив жидкости, разрыв ткани или поломку хрупкого предмета .

🍬 Тест на Skittles: проблема неструктурированных объектов 12:48

Для иллюстрации проблемы сложности докладчик провел интерактивный опрос аудитории, используя пример с роботом-манипулятором и открытым пакетом конфет Skittles . Если робот резко дернет пакет за дно, конфеты рассыплются.

Спикер указал на трудности моделирования такой ситуации:

Вывод исследователей: необходимо уходить от ручного проектирования состояний к использованию латентных (скрытых) представлений, которые ИИ может выучить самостоятельно из видеоданных.

🧠 Безопасность в латентном пространстве «моделей мира» 16:39

Решение, предложенное группой докладчика, заключается в объединении теории управления с генеративными «моделями мира» (world models). Вместо того чтобы работать с пикселями или сложными физическими формулами, робот обучается в сжатом латентном пространстве .

Процесс обучения выглядит следующим образом:

Ключевая инновация — это «латентное уравнение Беллмана для безопасности». Робот в своем «воображении» проигрывает возможные сценарии будущего. Если он понимает, что любое его действие в ближайшие секунды приведет к рассыпанию конфет, он помечает текущее состояние как «обреченное» и активирует стратегию предотвращения .

📊 Эксперименты: от симуляций до реального железа 24:52

Эффективность метода была проверена как на стандартных тестах (модель автомобиля Дубинса), так и в реальных задачах манипуляции.

Результаты тестов:

Интересно, что модель показала способность к обобщению: обучившись на красных Skittles, робот успешно справлялся с пакетами других цветов и в новых декорациях .

«Грязное белье» (ограничения): Спикер честно рассказал о провалах. Система не справилась с упаковкой арахисовых M&M's, так как бумажный пакет и тяжелый вес конфет сильно отличались от динамики пластикового пакета Skittles, на котором шло обучение . Также возникли проблемы с «невидимостью»: если повернуть пакет так, что дырка не видна камерам, робот считает его закрытым и совершает ошибку .

🤖 VLMs: Робот, который понимает контекст 46:10

Вторая часть доклада была посвящена использованию больших мультимодальных моделей (VLM, таких как Llama 3.2 Vision) для адаптации правил безопасности под конкретный контекст .

Проблема в том, что «безопасность» субъективна. Например, сильно сжать пакет чипсов — это нормально, если вы делаете панировку, но плохо, если собираетесь их есть .

Исследователи предложили двухэтапный процесс «руления политикой» (policy steering):

  1. Прогнозирование: Модель мира генерирует несколько вариантов будущего развития событий в виде латентных траекторий.
  2. Оценка: Траектории переводятся в текстовое описание, которое анализирует VLM. Например: «Робот берет чашку за край, касаясь пальцами внутренней части» .

В эксперименте с подачей воды робот выбирал разные способы захвата чашки в зависимости от текстовой инструкции: «возьми за ручку» или «ручка в масле — возьми по-другому» . Использование латентного пространства оказалось эффективнее, чем попытка заставить VLM анализировать сырое видео напрямую: специализированная модель мира лучше понимает физику движения, а VLM — высокоуровневые социальные нормы .

💬 Цитаты

«Когда мой руководитель сказал мне заставить робота поднять чашку 10 лет назад, это было мучительно. Теперь роботы действительно делают вещи.»

Докладчик семинара 00:35

«Часто люди говорят: 'просто скажи роботу остановиться'. Но здесь именно остановка вызвала нарушение безопасности.»

Докладчик семинара 01:57

«Модель не может предсказать то, чего она никогда не видела.»

Докладчик семинара 32:14
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Достижимость Гамильтона-Якоби
Математический метод для определения множества состояний, из которых система может гарантированно избежать опасности.
Латентное пространство
Сжатое представление данных, в котором ИИ выделяет только самые важные характеристики объекта, отсекая визуальный шум.
VLM (Vision Language Model)
Нейросеть, способная одновременно понимать изображения и текст, связывая визуальные образы с концепциями.
Модель мира (World Model)
Внутренняя симуляция нейросети, позволяющая ей предсказывать последствия действий без реального взаимодействия с физической средой.
📊 Цифры
🗓 Хронология
  1. 10 лет назад Начало PhD докладчика, когда простые задачи манипуляции были крайне сложными.
  2. 2023-2024 Разработка и публикация методов Latent Safety и VLM-steering.
⚖️ Другая сторона
Инженерия Stanford University AI Safety Llama 3.2 Vision Hamilton-Jacobi reachability World models