# Надия Фигероа представила метод управления роботами через динамические системы

Источник: https://www.youtube.com/watch?v=zdCJyn1OY-4
Канал: Stanford Online
Опубликовано: 17.12.2025

---

На семинаре по робототехнике в Стэнфордском университете профессор Надия Фигероа представила передовую концепцию «плавного физического взаимодействия» (fluid physical interaction) между роботами и людьми. В основе её подхода лежит фундаментальный отказ от традиционного планирования траекторий во времени в пользу автономных динамических систем, управляемых методами теории Ляпунова и алгоритмами машинного обучения. Это технологическое решение позволяет создавать мягких, податливых и безопасных роботов-помощников, способных мгновенно адаптироваться к действиям человека в хаотичной среде, будь то переполненная кухня или совместная силовая тренировка.

## 🍳 Концепция «плавного взаимодействия» и её требования
[[JUMP:00:10]]

Современная робототехника стремится к тому, чтобы автоматизированные агенты покинули изолированные промышленные зоны и стали полноценной частью повседневной человеческой жизни. По словам профессора Надии Фигероа, одной из главных целей её исследовательской группы является интеграция роботов в сложные, динамичные и даже хаотичные сценарии. Примерами таких сред могут служить ресторанные кухни, где люди и машины должны работать бок о бок, совместное перемещение тяжелых грузов по лестничным пролетам, а также создание специализированных роботов-партнеров для фитнеса, способных оптимизировать процесс тренировок и предотвращать травмы.

Для реализации этого видения робот должен обладать особым типом телесного интеллекта (embodied intelligence), ключевым элементом которого выступает совместное регулирование движений, сил и предсказаний. Роботу необходимо непрерывно предугадывать намерения человека и направление его движений. Только при соблюдении этого условия возможен бесшовный, адаптивный и безопасный обмен энергией и информацией между человеком и машиной.

Надия Фигероа выделяет четыре базовых требования к роботам, развернутым в реальном мире:

* **Стабильность и безопасность:** любые движения и манипуляции робота вокруг людей должны быть гарантированно устойчивыми и безопасными.
* **Гибкость:** робот не должен становиться неуклюжим или ограниченным из-за жестких алгоритмических рамок безопасности.
* **Адаптивность и предсказуемость:** машине необходимо подстраиваться под партнера, но ее собственное поведение должно оставаться понятным для человека, формируя своеобразный «плавный танец».
* **Целенаправленная податливость:** робот обязан реагировать как мягкое тело при внешнем контакте с человеком, но мгновенно мобилизовать жесткость, когда требуется поднять тяжелый объект.

Главный тезис исследовательской группы Фигероа заключается в том, что плавное взаимодействие недостижимо, если алгоритмы управления, оценивания состояний и машинного обучения функционируют изолированно. Напротив, они должны быть жестко связаны: контроллер робота обязан получать информацию о степени уверенности оценивающих алгоритмов и гибко менять свое поведение в зависимости от уровня неопределенности в реальном времени.

## 🔄 Переосмысление классической архитектуры управления
[[JUMP:05:38]]

Чтобы понять суть предлагаемых инноваций, Надия Фигероа подробно разбирает традиционный контур управления роботами. В классической схеме высокоуровневый планировщик задач выдает цель и ограничения для планировщика движений. Тот, в свою очередь, генерирует траекторию — последовательность точек, привязанных к жесткой временной шкале. Затем эта траектория передается на низкоуровневый контроллер, который вычисляет крутящие моменты, скорости или позиции для моторов.

Главная проблема традиционного подхода, по мнению Фигероа, заключается в том, что полноценная обратная связь в реальном времени присутствует исключительно на самом нижнем уровне. Например, манипуляторы Franka контролируются на частоте 1 кГц, а роботы KUKA — на частоте 500 Гц. Именно туда разработчики обычно закладывают элементы податливости, например, через контроллеры виртуального импеданса.

Однако, как утверждает исследовательница, плавное физическое взаимодействие невозможно построить на базе этой традиционной логики, поскольку при контакте с человеком меняется абсолютно всё и каждую секунду. Если робота грубо отклонить от заданной траектории, низкоуровневый контроллер попытается агрессивно вернуть его в исходную временную точку, что может привести к травме человека. Переинициализация же верхних уровней планирования требует времени и лишает систему естественной плавности.

В качестве решения профессор Фигероа предлагает внедрить явную обратную связь на все уровни архитектуры, обеспечивая реактивность на разных скоростях:

* **Низкоуровневый контроллер:** работает на частоте от 500 Гц до 1 кГц, отвечая за жесткие исполнительные команды моторам.
* **Планировщик движений:** функционирует на частоте порядка 100 Гц, непрерывно адаптируя геометрию движения на основе сенсорного восприятия.
* **Высокоуровневый планировщик:** перестраивает логику задачи на частоте от 10 до 50 Гц, мгновенно реагируя на макросдвиги в поведении человека.

## 📈 Динамические системы как основа планирования движений
[[JUMP:11:19]]

Вместо отслеживания отдельных точек на временной шкале, команда Фигероа представляет план движений робота в виде автономной динамической системы $\dot{x} = f(x)$. Здесь координата $x$ может описывать положение концевого эффектора, суставов или полноразмерное пространство $SE(3)$, а $\dot{x}$ — целевую скорость движения.

Наложение математических ограничений на функцию $f(x)$ позволяет сформировать векторное поле, где все интегральные кривые сходятся к единому аттрактору — конечной цели движения. Форма этого поля задается на основе демонстраций: человек показывает роботу траектории выполнения задачи, а алгоритмы подгоняют под эти данные параметры векторного поля. Таким образом, обучение имитации (Imitation Learning) превращается в классическую задачу идентификации систем.

Такой подход дает робототехникам фундаментальные математические преимущества:

* **Теория Ляпунова:** гарантирует глобальную асимптотическую стабильность и гарантированную сходимость к цели из любой точки пространства.
* **Барьерные функции:** обеспечивают строгую инвариантность безопасных зон и гарантируют ненарушение границ.
* **Теория сжатия (Contraction Theory):** позволяет математически корректно деформировать и усложнять векторные поля для реализации высокоскоростных движений.

В качестве иллюстрации возможностей динамических систем Надия Фигероа продемонстрировала видеозапись десятилетней давности, сделанную во время её работы над докторской диссертацией. На видео два роботизированных манипулятора синхронно ловят летящие предметы буквально на лету. Примечательно, что в этой системе вообще не использовалось машинное обучение — алгоритм состоял из нескольких уравнений Ляпунова, выполнявшихся в реальном времени, что позволяло роботам мгновенно адаптироваться к меняющейся баллистической траектории объекта. Современные модификации метода позволяют эффективно обучать такие системы в евклидовом пространстве, на предельных циклах, в пространствах ориентации и даже в скрытых (латентных) пространствах нейросетей.

## 🧠 Преодоление нестабильности: нейросети и временная логика
[[JUMP:16:40]]

В современной индустрии ИИ для моделирования динамических систем часто применяются нейросетевые обыкновенные дифференциальные уравнения (Neural ODE). Однако, как отмечает Фигероа, их главным недостатком является отсутствие врожденной стабильности: при малейшем внешнем возмущении нейросеть может увести траекторию робота в бесконечность.

Чтобы решить эту проблему, исследователи предложили гибридную схему. Студент Фигероа продемонстрировал эксперимент, в котором робот обучился трехмерному предельному циклу (периодическому движению) всего на основе 1–3 демонстраций человека. Сначала под эти данные подгоняется нестабильная модель Neural ODE, описывающая общую геометрию потока. Затем поверх нее накладывается виртуальная функция управления Ляпунова (CLF) через алгоритм квадратичного программирования. Если робот отклоняется от траектории из-за внешнего толчка, система вычисляет ближайшую точку на цикле, активирует функцию ошибки Ляпунова и плавно, но жестко возвращает манипулятор на орбиту.

Поскольку одна изолированная динамическая система способна кодировать только одну конкретную атомарную задачу, для долгосрочного планирования (long-horizon tasks) команда использует реактивную темпоральную логику (LTL). Это позволяет гибко выстраивать последовательности из множества автономных динамических систем.

В докладе были представлены два успешных примера такой композиции:

* **Робот-уборщик маркерной доски:** манипулятор выполняет циклическое движение протирания, но как только внешняя камера фиксирует новое появление пятен в стороне, логический автомат мгновенно переключает робота на динамическую систему очистки этого конкретного участка.
* **Интерактивный сценарий с полотенцем:** робот понимает, что полотенце сухое, переключается на макрос задачи «намочить полотенце», после чего переходит в режим ожидания и удерживает ткань, пока человек физически не выжмет воду. Вся эта последовательность автоматически кодируется формулами LTL и преобразуется в автомат Бюхи.

## 🧩 Физически согласованные GMM и эластичные политики
[[JUMP:21:16]]

Помимо нейросетевых подходов, группа Надии Фигероа активно развивает параметрические методы, созданные еще во время ее PhD. Один из них — метод физически согласованных моделей гауссовых смесей (Physically Consistent GMM). Алгоритм сегментирует сложные демонстрационные траектории и представляет их как смесь множества простых линейных динамических систем:

$$\dot{x} = \sum_{k=1}^{K} \gamma_k (A_k x + B_k)$$

где матрицы $A_k$ и векторы $B_k$ описывают локальное поведение системы, а $\gamma_k$ — функция смешивания. Стабильность всей конструкции гарантируется на этапе обучения: параметры матриц рассчитываются через полуопределенное программирование (SDP) с жестким наложением ограничений теории Ляпунова. Если функция смешивания предопределена, задача является выпуклой, если же матрица энергии $P$ оптимизируется одновременно — задача становится невыпуклой, но эффективно решается современными солверами.

Отвечая на вопрос из зала о том, как выбирается количество линейных компонентов $K$, профессор Фигероа пояснила, что они используют байесовские непараметрические методы и сэмплирование по схеме Марковских цепей Монте-Карло (MCMC). Это позволяет алгоритму плотности распределения автоматически определять оптимальное число гауссиан под конкретный набор данных, избавляя инженеров от ручной настройки.

Сформированное векторное поле отрабатывается специальным законом управления пассивными динамическими системами (Passive DS Control Law). Вместо классического импедансного отслеживания временных точек, контроллер Фигероа отслеживает непосредственно вектор скорости поля. Путем сингулярного разложения матрицы демпфирования, первый собственный вектор направляется строго вдоль вектора поля (накачивая энергию для движения), в то время как ортогональные направления исключительно рассеивают (диссипируют) энергию. В результате робот естественным образом поддается давлению человека вбок, но продолжает уверенно скользить к цели.

Однако у чистых динамических систем есть серьезный недостаток — эгоцентричность обучения. Система запоминает лишь геометрию поля и абсолютно безразлична к смыслу задачи. Если физически сместить целевой объект или препятствие, робот продолжит выполнять старое движение в пустоту.

Для преодоления этого ограничения была создана «эластичная политика движения» (Elastic Motion Policy — EMP). С помощью камер Intel RealSense и алгоритмов Foundation Pose система в реальном времени извлекает трехмерные пространственные рамки объектов в формате $SE(3)$. Используя инструмент из компьютерной графики — редактирование Лапласиана (Laplacian editing), алгоритм EMP «морфирует» (эластично деформирует) гауссианы и пересчитывает матрицы $A_k$ на лету. Скорость обновления параметров векторного поля превышает 30 Гц (достигая 100 Гц на вычислителе), а единственным узким горлышком выступает частота работы самой системы технического зрения. Метод позволяет роботу мгновенно корректировать траектории наливания жидкости или перекладывания предметов при их перемещении человеком прямо во время движения.

## 🤝 Оценка намерений человека и динамическая податливость
[[JUMP:38:01]]

Когда робот и человек физически манипулируют одним предметом (например, несут тяжелый стол), возникает острая необходимость динамически менять податливость самой машины. По мнению Фигероа, если робот не уверен в том, куда именно человек хочет направить груз, он должен полностью расслабиться, включить режим компенсации гравитации и подчиниться силе человека. Если же уверенность высока, робот обязан активно включиться в работу и приложить ассистирующее усилие.

Для реализации этой концепции исследователи создали онлайн-контур, решающий одновременно три задачи: оценку намерений, адаптацию робота и соблюдение физических ограничений. Робот использует фильтр частиц (Particle Filter), работающий на частоте 20 Гц, который непрерывно оценивает параметры целевой динамической системы ($A$ и $x^*$) на основе траектории движения. Примечательно, что алгоритм успешно функционирует без использования дорогостоящих датчиков силы-момента, опираясь исключительно на кинематику встроенной податливости.

Уровень уверенности робота вычисляется напрямую через ошибку отслеживания скорости: если расхождение между предсказанным вектором динамической системы и реальным движением конечного эффектора слишком велико, уверенность падает до нуля, и робот переходит в пассивный режим.

Чтобы сделать взаимодействие максимально эргономичным, ученые интегрировали в систему учет биомеханических ограничений человека:

* Оптическая система непрерывно отслеживает скелетную модель человеческого тела.
* На основе углов в суставах вычисляются эллипсоиды манипулятивности (manipulability ellipsoids) человека.
* Эти эллипсоиды используются для динамического изменения шума в фильтре частиц робота.

Благодаря этому робот никогда не предложит траекторию движения или усилие, которые физически неудобны или травмоопасны для текущей позы человека. Лабораторные эксперименты и сравнение с классическим адмиттанс-управлением (Admittance Control) показали, что метод Фигероа требует от человека значительно меньших физических усилий для выполнения совместных задач.

## 🛡️ Безопасность на уровне сил: обход препятствий и жизнеспособность
[[JUMP:47:27]]

Безопасность при плавном взаимодействии включает в себя не только податливость к касаниям, но и бесконтактное уклонение от препятствий. Идея геометрической модуляции векторных полей, применяемая в лаборатории Пенсильванского университета, вдохновлена классическими искусственными потенциальными полями, но лишена их главного недостатка — застревания в локальных минимумах.

Инженеры используют непрерывно дифференцируемую функцию аналитического описания границ препятствия $\Gamma(x)$. На ее основе строится матрица модуляции $M(x)$, которая локально деформирует исходное векторное поле: она обнуляет компоненты скорости, направленные в стенку препятствия, и пропорционально ускоряет тангенциальные компоненты, заставляя робота плавно огибать объект по касательной.

Для борьбы со сложными вогнутыми объектами команда разработала метод модулированных control barrier functions (MCBF), объединяющий реактивное уклонение с предиктивным семплирующим контроллером MPPI в пространстве суставов. Это позволяет роботу оперативно находить траектории выхода из геометрических тупиков. На демонстрационном видео робот успешно переносил объект, уклоняясь от движущегося человека, тело которого в реальном времени моделировалось тридцатью защитными сферами.

Важнейшей вехой исследований стала разработка контроллера пассивного крутящего момента с сохранением жизнеспособности (Viability Preserving Passive Torque Control). Этот алгоритм решает критическую проблему: как позволить роботу быть мягким и податливым для человека, но гарантировать, что под воздействием человеческой силы манипулятор не врежется в самого себя и не выйдет за пределы углов суставов?

Концепция жизнеспособности (Viability) оперирует динамическим состоянием робота во всем пространстве координат и скоростей $(q, \dot{q})$. Математическая логика выглядит следующим образом:

1.  В офлайн-симуляции генерируются миллионы аварийных траекторий, где робот умышленно движется к самостолкновению или лимитам суставов.
2.  На основе этих данных обучается суррогатная функция границ жизнеспособного множества.
3.  В реальном времени алгоритм решает простую задачу квадратичного программирования, ограничения которой наложены напрямую на крутящие моменты моторов.

Такая схема полностью устраняет необходимость использования многоуровневых высокопорядковых барьерных функций (High-Order CBFs), требующих вычисления сложных градиентов и матриц Гессе, которые вызывают опасные рывки и задержки в вычислениях. Контроллер жизнеспособности Фигероа работает плавно и на полной скорости: как только рука человека толкает робота в сторону опасного излома сустава, манипулятор плавно наращивает жесткость и аккуратно выталкивает руку человека обратно в безопасную зону.

## 🏋️ Будущее робототехники: генеративные модели и биомедицина
[[JUMP:57:35]]

В финальной части доклада профессор Фигероа приоткрыла завесу над перспективными проектами лаборатории, которые призваны объединить строгие методы теории управления с современными генеративными нейросетями. Одним из таких направлений является интеграция динамических систем с моделями сопоставления потоков (Flow Matching).

Разработанная политика Flow Matching принимает на вход трехмерное облако точек (Point Cloud) от сенсора, текущие позы эффектора и векторы сил через кодировщик DP3+. На выходе нейросеть генерирует не просто траекторию, а параметры демпфирования и жесткости для низкоуровневого контроллера динамических систем. Благодаря чисто геометрическому представлению данных, такая система демонстрирует успешный «нулевой перенос» (zero-shot transfer) из симулятора в реальный мир, сохраняя стабильность динамического поля и способность работать в полной темноте.

Параллельно в лаборатории ведутся активные медико-биологические исследования по созданию роботизированного спортивного тренажера. Робот управляется переключением между двумя аттракторами и динамически меняет сопротивление моторов на основе данных мышечной активности человека. Для этого на бицепс пользователя крепится ультразвуковой датчик, который в реальном времени отслеживает деформацию мышечных волокон, позволяя системе с высокой точностью оценивать крутящий момент и угол изгиба локтя. Данная технология призвана лечь в основу интеллектуальных систем реабилитации и персонализированного фитнеса.

Резюмируя свое выступление, Надия Фигероа подчеркнула, что обеспечение безопасности, интерактивности и адаптивности является обязательным и неотъемлемым требованием для любых роботов, создаваемых для работы рядом с человеком. Все теоретические основы и прикладные методы, озвученные в рамках лекции, подробно изложены в фундаментальном учебнике «An Introduction to Dynamical Systems for Robotics», написанном Надией Фигероа в соавторстве с ее научным руководителем Од Бийар и коллегой Синой Мирразави. Книга уже активно используется в учебных программах Пенсильванского университета (Penn) и Лозаннской политехнической школы (EPFL), а несколько месяцев назад получила официальное издание на китайском языке.