# Сертач Караман о будущем беспилотного транспорта и гоночных дронов

Источник: https://www.youtube.com/watch?v=M1-v-dXIzho
Канал: Lex Fridman
Опубликовано: 20.05.2020

---

В новом выпуске Lex Fridman Podcast известный робототехник и профессор MIT Сертач Караман делится своим уникальным видением будущего автономных систем. Собеседники подробно разбирают технологические вызовы, стоящие перед разработчиками беспилотных автомобилей и летающих дронов, а также фундаментальные ограничения современных вычислительных архитектур. В центре дискуссии — тонкий баланс между безопасностью, эффективностью и готовностью человеческого общества принять роботов в свою повседневную жизнь.

## 🛸 Небо против земли: парадоксы масштабирования робототехники
[[JUMP:1:44]]

При сравнении беспилотных полетов и автономного вождения Сертач Караман отмечает неожиданный парадокс. По его мнению, запуск коммерческих потребительских дронов на базовом уровне технически проще, что и обусловило их быстрый взлет на рынке в последние годы. Однако реальное масштабирование беспилотных полетов в сфере логистики и массового транспорта представляет собой куда более сложную задачу, чем создание самоуправляемых автомобилей. Гость убежден, что человечество увидит крупномасштабное развертывание летающих роботов только после того, как будут решены ключевые проблемы наземного автономного транспорта.

Главная сложность заключается в интеграции роботов в среду, где присутствуют неподготовленные люди. Робототехника успешно развивалась последние 50 лет, но машины работали либо изолированно на заводах, либо в абсолютно пустых пространствах вроде Марса. Внедрение тысяч автономных аппаратов в плотную городскую среду меняет правила игры. 

По словам Карамана, обычные граждане не обучены взаимодействовать с ИИ, они могут даже не подозревать, что перед ними беспилотник, и продолжают жить в пространстве, исторически спроектированном исключительно для людей. Гость прогнозирует, что сверхвысокая плотность автономных систем впервые будет достигнута именно на дорогах, поскольку обеспечить безопасность наземного транспорта в человеческой среде все же проще, чем воздушного.

## 🏙️ Летающие автомобили и «гибкое» воздушное пространство
[[JUMP:5:32]]

Концепция летающих автомобилей десятилетиями оставалась лишь элементом научной фантастики, однако современные технологии способны перевести ее в практическую плоскость. Сертач Караман считает вполне реальной перспективу создания летающего транспорта на 4–8 человек, действующего по принципу воздушного такси. По его расчетам, поездка из Бостона в Манхэттен с крыши на крышу могла бы занимать всего 1,5 часа, ради чего многие клиенты без колебаний переплатили бы лишние 100 долларов. В долгосрочной перспективе (в пределах 50 лет) ученый даже допускает появление аппаратов на принципах ионизации воздуха и магнитных полей, напоминающих летающие тарелки.

Для реализации этой идеи необходимо задействовать так называемое «гибкое воздушное пространство» (agile airspace). Речь идет о высотах, которые находятся:

* Выше зоны, куда человек может докинуть обычный камень, способный сбить легкий дрон;
* Ниже коридоров движения крупных коммерческих лайнеров.

Сегодня это пространство практически пустует. Главным техническим барьером на пути к его освоению Караман называет создание сложнейшего программного обеспечения, которое должно быть на несколько порядков комплекснее современных авиационных систем и обладать абсолютной, доказуемой безопасностью. Использование машинного обучения станет ключевым фактором для наделения воздушных роботов интеллектом, поскольку традиционное программирование силами даже миллиардов разработчиков здесь бессильно.

## 🎮 Иллюзия реальности: симуляция датчиков и «тест для мамы»
[[JUMP:10:35]]

Разработка безопасных роботов немыслима без продвинутых виртуальных сред. Сертач Караман подчеркивает, что симуляции важны не только для обучения моделей, но и для самого процесса проектирования систем. Автомобильная промышленность использует динамические симуляции десятилетиями, однако сейчас индустрия вышла на новый уровень благодаря качественному скачку в симуляции камер.

Ученый разделяет датчики робота на два типа:

* **Интероцептивные (внутренние):** датчики инерции и физика динамики, описываемая обыкновенными дифференциальными уравнениями. Их симулировать относительно легко.
* **Экстероцептивные (внешние):** лазерные дальномеры, радары и камеры, сканирующие окружающий мир. Их достоверная симуляция всегда была камнем преткновения.

Современные технологии трассировки лучей (ray tracing) позволяют симулировать поведение фотонов с высокой точностью, приближая картинку к реальности. Однако сложнейшим вызовом остается моделирование человеческого поведения и жестов. Караман делится личным опытом проведения «теста для мамы или друга»: он отправляет близким два изображения — реальное и отрендеренное, чтобы проверить, смогут ли они заметить подвох. 

Как выяснилось, человеческий мозг, эволюционировавший в окружении себе подобных, мгновенно считывает фальшь, если в симулированную сцену помещен виртуальный пешеход. По мнению гостя, сбор и ручная разметка данных для обучения моделей человеческого поведения жестко ограничены физическими ресурсами людей, что делает эту задачу одной из самых труднорешаемых в ИИ.

## 🚗 Эволюция беспилотников: от карт к теории игр и «абьюзу» роботов
[[JUMP:16:47]]

Оглядываясь на историю развития беспилотного вождения со времен DARPA Urban Challenge, Сертач Караман выделяет три ключевых этапа эволюции технологий:

1.  Картографирование и локализация (алгоритмы SLAM), на которых изначально сфокусировался Google для создания HD-карт.
2.  Революция глубокого обучения (2012–2013 годы), позволившая распознавать другие объекты на дороге.
3.  Предсказание намерений окружающих — этап, который до сих пор остается главным камнем преткновения для всей индустрии.

По оценке Карамана, современная робототехника незаслуженно игнорирует теоретико-игровой аспект вождения — то, как сам беспилотник своим поведением, агрессией или сигналами формирует действия других участников движения. Взаимодействие человека с роботом принципиально отличается от общения людей между собой. 

Если беспилотник пуст, люди начинают воспринимать его как обычную неодушевленную вещь и подсознательно «абьюзят» машину, пытаясь подрезать или не пропустить ее. Роботу приходится быть умнее человека, чтобы выживать в такой среде. 

Исследования Карамана в области социального позиционирования водителей показывают, что ИИ может заранее просчитывать степень агрессивности приближающегося человека по его манере езды. Тем не менее вопрос о том, должен ли сам робот отвечать агрессией на агрессию, остается открытым: человеческое общество крайне болезненно воспринимает жесткое поведение со стороны искусственного интеллекта.

## ⚔️ Стратегическое противостояние: осторожный Waymo против агрессивного Tesla
[[JUMP:24:44]]

Обсуждая подходы лидеров рынка, Лекс Фридман и Сертач Караман противопоставляют две полярные философии: консервативный, ориентированный на безопасность подход Waymo (Google) и агрессивную, инновационную стратегию Tesla под руководством Илона Маска. Караман считает, что обе модели имеют право на жизнь, но ключевым фактором должна быть информированность общества о принимаемых рисках.

Ученый предлагает взглянуть на это противостояние через призму ортогональных бизнес-целей:

* **Waymo** воспринимает свои беспилотники скорее как долгосрочный научно-исследовательский проект. Они не стремятся к мгновенному выводу коммерческого продукта на массовый рынок, а создают фундаментальный «движок ИИ», способный решать комплексные задачи восприятия и предсказания в любых сценариях.
* **Tesla** сделала ставку на рыночный спрос и непрерывные обновления. По мнению Карамана, автоматизация Tesla Autopilot выступает отличной коммерческой функцией, за которую люди готовы доплачивать 5–10 тысяч долларов, получая удовольствие от ощущения сопричастности к технологическому прорыву и видению Илона Маска.

В конечном счете, обе компании используют схожий «двигатель» в виде базового ИИ, но строят на его основе совершенно разные продукты — условно, «легковой автомобиль» и «грузовик» под разные потребительские ниши.

## 🚌 Кейс Optimus Ride: революция микромобильности в закрытых кварталах
[[JUMP:29:47]]

Будучи одним из основателей компании Optimus Ride, Сертач Караман скептически относился к обещаниям коллег по цеху выпустить полностью автономные машины «через два-три года», звучавшим еще в 2014 году. Пройдя школу DARPA Urban Challenge в MIT, он четко осознавал жесткие ограничения вычислительной техники и непредсказуемость человеческого фактора. Это побудило команду Optimus Ride выбрать прагматичный, рыночный подход: вместо хаотичного движения по всему миру они сфокусировались на геоограниченных зонах (geofenced areas) размером примерно 2 на 2 мили.

Примером такого развертывания стал Бруклинский судостроительный завод (Brooklyn Navy Yard) — транспортно изолированная территория, где сотрудникам приходится использовать личные автомобили просто для поездки на обед. Внедрение беспилотных систем в таких локациях позволяет городам возвращать огромные площади, занятые парковками, экономя десятки миллионов (а в масштабах Нью-Йорка — миллиарды) долларов.

Важнейшая инновация Optimus Ride заключается в изменении операционной модели управления флотом машин. Индустрия движется от схемы «один человек — один транспорт» (будь то водитель автомобиля или оператор погрузчика) к концепции, где 10 операторов контролируют 50 беспилотников. 

Караман подчеркивает, что это не классическое дистанционное телеуправление (teleoperation) с очками виртуальной реальности. Операторы работают как авиадиспетчеры (AV controllers): они видят всю карту сети и подключаются только тогда, когда машине требуется высокоуровневая подсказка на сложном перекрестке для повышения эффективности движения, тогда как за безопасность на 100% отвечает сам бортовой ИИ. 

Команда также переосмыслила формат общественного транспорта: вместо громоздких и нелюбимых пассажирами 20-30-местных шаттлов Optimus Ride внедряет маневренные 4-6-местные электромобили, которые сокращают задержки в пути и не требуют даже мобильного приложения — машина сама узнает пассажира в лицо при посадке.

## 👁️ Война датчиков: прав ли Илон Маск, называя лидар «костылем»?
[[JUMP:58:36]]

Знаменитое утверждение Илона Маска о том, что лидары являются «костылем» для беспилотников, вызывает бурные дискуссии в экспертном сообществе. Сертач Караман, активно использовавший лидары во времена технологических конкурсов DARPA, частично соглашается с этим тезисом в долгосрочной перспективе. По его прогнозу, через 20 лет компьютерное зрение разовьется до такой степени, что автомобили смогут безопасно управляться исключительно с помощью камер.

Однако в текущих реалиях индустрии лидар выполняет важнейшую прагматическую функцию: с ним гораздо проще и быстрее построить работающую и демонстрируемую систему. Караман поясняет, что создание аналогичного уровня надежности только на базе камер требует колоссальных математических и инженерных компетенций. 

Архитектура Optimus Ride опирается на глубокий сенсорный синтез (sensor fusion) с минимальным использованием лидаров. В будущем разработчикам придется выбирать между стоимостью самого лидара и вычислительной мощностью процессоров (compute cost), необходимой для обработки «сырого» видеопотока с камер, причем отказ от лидаров может сделать систему более дорогой из-за требований к бортовым суперкомпьютерам.

## ⚡ Сверхзвуковые дроны и гонки Alpha Pilot: преодолевая биологические лимиты
[[JUMP:1:03:26]]

Помимо наземного транспорта, Сертач Караман активно развивает направление агрессивных автономных полетов, участвуя в проекте Lockheed Martin Alpha Pilot Innovation Challenge. Современные гонки дронов представляют собой популярный киберспорт (eSport), где операторы управляют аппаратами через FPV-очки, но в этих системах полностью отсутствует искусственный интеллект. Цель Карамана — создать автономных летающих роботов, способных перемещаться на скоростях, принципиально недоступных для человеческой реакции.

Человеческая биология накладывает жесткие ограничения на скорость обработки информации: задержка между сигналом от сетчатки глаза и сокращением мышц пальцев на пульте управления составляет критические миллисекунды. В своей лаборатории в MIT ученый проектирует системы с частотой опроса сенсоров в 1 килогерц, тогда как человеческий глаз едва воспринимает 100 герц. Подобные роботы видят мир словно в 10-кратном замедлении (10x slow motion).

Эта технология высокопроизводительных вычислений (high throughput computing) имеет прямое прикладное значение для спасения жизней на дорогах. По словам Карамана, ежедневно в США в дорожных авариях гибнет около 100 человек. В момент неизбежного ДТП бортовой компьютер автомобиля мог бы мгновенно отключить мультимедийную систему и перенаправить все вычислительные ресурсы на ИИ безопасности, перехватив управление или скорректировав траекторию движения быстрее, чем это позволяют моторные навыки водителя. Главным аппаратным барьером сейчас выступают медленные медные провода (интерфейсы USB и CSI), которые упираются в предел Шеннона по пропускной способности данных, что требует переноса вычислений непосредственно на матрицы камер.

При тестировании беспилотных дронов на гоночных трассах проявляется ключевое различие между человеком и машиной. При первом прохождении нового незнакомого слаломного трека лучший пилот-человек стабильно побеждает робота. Однако уже к десятому кругу ИИ начинает неуклонно выигрывать: пока человек устает, теряет концентрацию и ошибается, машина без устали и с абсолютной точностью воспроизводит идеальные строки кода.

## 📐 Уравнение Белльмана и проклятие размерности
[[JUMP:1:18:03]]

В завершение беседы Сертач Караман делится самой красивой и глубокой идеей в истории робототехники, которая по сей день вызывает у него трепет — уравнением Белльмана. Сформулированное более полувека назад, оно лежит в основе теории принятия решений и современного обучения с подкреплением (reinforcement learning).

Магия этого уравнения заключается в поразительном контрасте между его внешней простотой (его можно объяснить студентам на первой же лекции) и колоссальной вычислительной сложностью, которую оно скрывает. Уравнение Белльмана наглядно обнажает концепцию «проклятия размерности» (curse of dimensionality). Если система содержит всего 100 переменных, каждая из которых может принимать 10 значений, то общее число возможных комбинаций решений превысит количество атомов в наблюдаемой Вселенной. 

Вся научная карьера Карамана в MIT во многом представляет собой непрерывную борьбу за вычислительную эффективность против этого фундаментального математического барьера. Примечательно, что несмотря на теоретическую неразрешимость сложнейших сценариев в «худшем случае», на практике усредненные жизненные задачи поддаются оптимизации, что ученый называет удивительным и вдохновляющим парадоксом.