Как научить роботов осязать мир: математика и алгоритмы контактов

В рамках научного семинара, организованного проектом Stanford Online в Стэнфордском университете, ведущий специалист по робототехнике из Университета Карнеги — Меллон представил передовые подходы к решению одной из сложнейших проблем индустрии — физическому взаимодействию машин с непредсказуемой окружающей средой. В центре внимания оказались математические методы описания моментов механического контакта и алгоритмы, позволяющие роботам стабильно передвигаться по пересеченной местности, преодолевать густые заросли и маневрировать на сыпучем песке. Докладчик продемонстрировал, как преодолеть ограничения классических моделей управления с помощью аппарата гибридных динамических систем и оригинальных инженерных решений.

🌍 Реальный мир против идеальных моделей 0:09

Большинство современных коммерческих роботов успешно функционируют в строго контролируемых пространствах — на автоматизированных складах или фабричных конвейерах. Однако перед исследовательскими командами стоит более амбициозная задача: вывести машины в дикую природу, будь то пустыни, леса или хаотичная городская застройка. Прикладное значение таких разработок огромно — от исследования других планет до экологического мониторинга. В рамках одного из крупных проектов мобильные роботы осуществляют поиск опасных загрязнений в почве, буквально раскапывая землю в поисках асбеста, ртути или свинца.

Главным препятствием на пути к автономности в реальном мире становится неожиданный физический контакт с окружением. На кадрах с неудачными испытаниями шагающих роботов видно, что машины теряют равновесие и падают, когда их ноги натыкаются на скрытые в траве лианы или проваливаются туда, где ожидалась опора. С аналогичными трудностями сталкиваются и люди: известным примером из урбанистики стало видео с лестницей на одной из станций метро Нью-Йорка. Из-за проседания грунта одна из ступеней оказалась всего на несколько миллиметров выше остальных, что заставляло спотыкаться практически каждого прохожего, чей мозг уже выстроил автоматическую модель движения.

В задачах манипуляции и захвата объектов ситуация не легче. Множество ошибок происходит из-за того, что реальные коэффициенты трения отличаются от расчетных, робот задевает предмет раньше времени или вовсе промахивается на доли миллиметра.

🧩 Две главные трудности: разрывность и неопределённость 2:38

По словам исследователя, все фундаментальные проблемы взаимодействия робота с миром сводятся к двум ключевым вызовам. Первый из них — это разрывный характер сил контакта. Когда нога робота стоит на земле, она испытывает колоссальное сопротивление, но стоит приподнять её всего на один миллиметр, как сила мгновенно падает до нуля. Эта математическая разрывность ломает традиционные алгоритмы оценки состояния, обучения и управления, которые на базовом уровне предполагают непрерывность и гладкость динамики.

Второй вызов заключается в колоссальной неопределенности среды. Инженеры могут составить идеальную цифровую модель самого робота, но они никогда не смогут точно смоделировать степень мягкости кучи опавших листьев или рассчитать точный коэффициент трения о влажный камень. По мнению докладчика, пытаться бесконечно улучшать системы компьютерного зрения ради создания безупречной модели мира — тупиковый путь. Вместо этого робототехника нуждается в алгоритмах, способных эффективно работать в условиях жесткой неопределенности.

В качестве базового математического каркаса ученые используют гибридные динамические системы, сочетающие непрерывные состояния (движение в воздухе) и дискретные (моменты контакта или проскальзывания). Докладчик предлагает простое эмпирическое правило: если при замедленном просмотре видеозаписи движения робота можно четко указать кадр, где начался или прекратился контакт, то гибридная модель будет хорошим приближением. Однако эта схема полностью разваливается, когда машина взаимодействует с гибкими тканями или сыпучими средами, такими как песок, где поток мелких частиц течет непрерывно.

📉 Матрица скачка: как пережить момент удара 5:51

Для понимания положения робота в пространстве используется классическая фильтрация Калмана, состоящая из шага предсказания динамики и шага коррекции по показаниям датчиков. Проблема возникает в момент, когда конечность робота сталкивается с объектом. Если обновленное среднее значение системы еще можно рассчитать через законы упругого или пластического удара (так называемое отображение сброса), то стандартный перенос матрицы ковариации (неопределенности) через Якобиан этого отображения не работает.

Чтобы наглядно объяснить эту математическую аномалию, профессор привел пример простейшей двухфазной системы с постоянной скоростью движения частиц. Несмотря на то, что на границе перехода фаз само состояние системы не претерпевает мгновенного скачка, облако неопределенности при пересечении этой границы резко деформируется и растягивается. Обычный Якобиан выдал бы округлую форму погрешности, полностью проигнорировав это искажение.

Решением этой проблемы является матрица скачка (сальтации). Этот математический оператор учитывает тот факт, что разные траектории из облака неопределенности достигают поверхности удара в разное время. Из-за этой разницы во времени робот проводит чуть больше или чуть меньше времени в одном из динамических режимов, что и приводит к перекосу распределения вероятностей. Сама формула матрицы скачка была известна в узких кругах математиков еще с 1950-х годов, однако команда из Карнеги — Меллон адаптировала её для нужд современной робототехники, опубликовав подробное руководство в журнале Proceedings of the IEEE.

Интеграция матрицы скачка в расширенный фильтр Калмана позволила радикально снизить ошибку оценки состояния гибридных систем. Метод успешно протестировали как на абстрактной модели «терки для сыра», так и на сложной нелинейной модели шестимерного прыгающего робота-кузнечика (SLIP hopper). Поскольку матрица скачка выполняет обновление ранга 1 строго в направлении нормали к поверхности контакта, точность отслеживания координат по вертикальной оси выросла в разы.

Прорыв в алгоритмах траекторной оптимизации

Математический аппарат матрицы скачка оказался применим и к дуальной задаче — управлению роботом. Встроив этот оператор в алгоритм итеративного линейно-квадратичного регулятора (iLQR), инженеры получили продвинутый контроллер предсказывающего моделирования (MPC).

Главная ценность нового подхода заключается в том, что робот научился на ходу менять последовательность и тайминг своих шагов, подстраиваясь под внешние возмущения. Во время жесткого реального теста ученые физически отключали моторы шагающего робота на 150 миллисекунд прямо во время движения, заставляя его падать. Стандартный MPC-контроллер мгновенно терял ориентацию, поскольку реальное положение ног не совпадало с его жестким планом. В то же время гибридный iLQR мгновенно пересчитывал траекторию, понимая, что нужно быстрее выставить ноги для стабилизации тела.

🔄 Формирование гибридных событий и три классические эвристики 17:37

Для анализа долгосрочной стабильности циклических движений роботов используется матрица монодромии, которая аккумулирует изменения погрешностей за весь период шага, поочередно перемножая непрерывную динамику и матрицы скачка. Профессор обнаружил, что, меняя параметры поведения робота непосредственно в узкое терапевтическое окно момента удара, можно управлять стабильностью всей системы без изменения глобальной траектории. Этот подход получил название «формирование гибридных событий» (Hybrid Event Shaping).

С помощью этой концепции ученые смогли математически связать и объяснить три знаменитые эмпирические эвристики, которые десятилетиями использовались в робототехнике:

Замедление ракетки при жонглировании: Чтобы стабильно удерживать прыгающий теннисный мяч на одной высоте, робот-ракетка должен соприкасаться с ним в фазе отрицательного ускорения (замедления). Это свойство, описанное учеными Шаалом и Аткесоном в 1993 году, позволяет автоматически гасить избыточную энергию мяча при случайных девиациях.
Ретракция маховой ноги: При ходьбе человек и животные перед самым касанием земли слегка отводят ногу назад. Высокоскоростная съемка подтверждает этот факт. Такое движение выравнивает относительную скорость стопы и грунта, резко расширяя область динамической устойчивости шага.
Эвристика Райберта: Основатель компании Boston Dynamics Марк Райберт в 1984 году эмпирически доказал, что скоростью прыгающего робота можно эффективно управлять, варьируя угол наклона ноги в момент приземления.

Команда применила метод формирования гибридных событий для настройки пятизвенного двуногого робота. Сгенерировав траекторию с минимальным потреблением энергии, исследователи запустили машину без какой-либо непрерывной обратной связи от датчиков. Обычный робот в таких условиях падает уже на третьем шаге. Однако за счет математически выверенной геометрии удара «слепой» робот смог идти стабильно и бесконечно долго. Позже эту технику объединили с iLQR для создания комбинированных систем, что позволило успешно обучить четырехногих роботов стабильно передвигаться по экстремально узким балкам.

🪵 Разрушая допущения: лианы, магниты и микрошипы 31:37

Классические гибридные модели опираются на четыре жестких допущения:

Абсолютно пластический удар (отсутствие отскока);
Полное отсутствие сил адгезии (земля только толкает робота вверх, но не удерживает его);
Жесткий контакт, накладывающий строгие ограничения на скорость;
Неизменность поверхности (робот не деформирует среду).

Часть этих правил поддается корректировке. Например, для робота, карабкающегося по вертикальным металлическим стенам с помощью магнитов, ограничение на силу реакции просто смещается на величину магнитной адгезии. На такого робота исследователи установили портативный рентгенофлуоресцентный датчик (PXRF) для бесконтактного экспресс-анализа загрязнений прямо на стенах конструкций.

Аналогично гибридная модель справляется и с микрошипами — адаптивными мини-крючками, имитирующими лапы насекомых для удержания за неровности камней. На созданном в лаборатории роботе LORIS установлены механизмы с десятью независимыми подпружиненными «пальцами». Робот отлично зарекомендовал себя при восхождении по стенам из шлакоблоков и пористой горной породы — металлургического шлака, огромную кучу которого студенты бесплатно получили на одном из заводов Питтсбурга.

Однако когда робот сталкивается с густой растительностью, гибридный подход терпит крах. Невозможно дискретизировать и рассчитать контакт с сотнями упругих ветвей и лиан. Взамен ученые разработали двухэтапную реактивную стратегию. Специальный программный наблюдатель импульса звеньев (Link Momentum Observer) сравнивает расчетный крутящий момент моторов с реальной скоростью ноги. Если зафиксировано аномальное сопротивление, превышающее порог, включается реактивный алгоритм управления. Не пытаясь определить, где именно находится препятствие, нога совершает дугообразное движение назад и вниз, заставляя гибкую лиану соскользнуть с гладкого корпуса конечности. Весь этот программный комплекс выложен в открытый доступ в виде программного пакета Quad-SDK.

🏜️ Террамеханика: как управлять роботом на песчаных дюнах 40:31

Еще более сложной средой для моделирования является сухой песок. Чтобы изучить поведение колесной техники в таких условиях, команда использовала испытательные стенды лунохода Viper. Инженеры сымитировали критическую поломку — полное заклинивание одного из четырех мотор-колес космического аппарата.

Традиционные методы симуляции требуют обсчета миллионов отдельных песчинок, что исключает возможность управления в реальном времени. Лаборатория докладчика создала легковесную террамеханическую модель, которая оценивает напряжения и силы трения вдоль обода и боковых поверхностей колеса, выдавая точные прогнозы практически мгновенно.

На основе этой модели был разработан алгоритм обратной связи. Когда у макета лунохода блокируется заднее правое колесо, обычная система управления уводит его в неконтролируемый занос. Новый же контроллер динамически перераспределяет скорости и углы поворота остальных трех колес, удерживая аппарат на идеальной прямой линии. Более того, систему научили целенаправленно использовать заклинившее колесо в качестве плуга для копания траншей заданной глубины с целью изучения нетронутых глубоких слоев лунного грунта.

🦖 От рободинозавров до инклюзивного сообщества 43:29

Среди других необычных проектов лаборатории — палеобиоробототехника. В штате инженерного крыла работает профессиональный палеонтолог. Поскольку ученые не могут напрямую понаблюдать за биомеханикой вымерших видов, они используют роботов и физические симуляции для поиска ответов на эволюционные вопросы: например, как мелкие динозавры преодолевали препятствия и какое древнее животное первым перешло с шага на бег. Профессор подчеркнул, что более 99% видов, когда-либо живших на Земле, вымерли, и современная бионика, копируя только существующих животных, упускает колоссальный пласт эффективных природных конструкций. В частности, биологические виды активно используют гибкий позвоночник, тогда как современные роботы представляют собой жесткие «кирпичи с приделанными ногами».

Для обучения езде по сверхсложному рельефу команда применяет комбинацию неидеальных симуляций и трансформеров системной идентификации. Алгоритм обучается в симуляторе на множестве сред с намеренно искаженными физическими параметрами, а при переносе в реальный мир тратит всего несколько секунд на то, чтобы точно определить свое положение в пространстве динамических моделей и скорректировать езду.

В финальной части выступления докладчик затронул острую социальную проблему — катастрофическое отсутствие разнообразия в индустрии робототехники. Согласно профильным исследованиям, при сохранении текущих темпов инклюзии индустрия придет к гендерному паритету лишь к 2055 году. Исследователь призвал коллег к активным действиям:

Вступать в профильные правозащитные и нетворкинг-организации, такие как Black in Robotics, Women in Robotics или Queer in Robotics;
Активно цитировать, приглашать на конференции и брать на менторство молодых ученых из недопредставленных групп, используя готовые верифицированные списки литературы;
Ознакомиться с манифестами и практическими рекомендациями по поддержке инклюзивности в академической среде.