Амнон Шашуа: «Вождение — это игра, в которой робот обязан научиться торговаться»

Mobileye 109 тыс. 24 мин 4 мин 29.03.2017
Главное

На конференции Bosch ConnectedWorld 2017 профессор Амнон Шашуа, сооснователь компании Mobileye, представил глубокий анализ технологических вызовов, стоящих перед индустрией беспилотного транспорта. В своем выступлении он выделил три ключевых столпа автономного вождения: сенсорика (sensing), высокоточное картографирование (mapping) и стратегия вождения (driving policy). Особое внимание было уделено тому, почему популярный в Кремниевой долине подход к созданию беспилотников может оказаться тупиковым и как использование искусственного интеллекта (ИИ) позволяет машинам освоить человеческие навыки ведения переговоров на дороге.

📱 Три столпа технологии автономного вождения 0:41

Профессор Шашуа подчеркивает, что для создания полноценного беспилотного автомобиля необходимо решить три фундаментальные задачи :

  1. Сенсорика (Sensing): Сбор данных с камер, радаров и лазерных сканеров (лидаров) для создания модели окружающей среды в реальном времени.
  2. Высокоточное картографирование (HD Mapping): Создание «дорожной книги» с сантиметровой точностью, которая обеспечивает избыточность данных и позволяет системе заглядывать за пределы видимости сенсоров .
  3. Стратегия вождения (Driving Policy): Принятие решений и навыки «переговоров» с другими участниками движения в сложных городских условиях. Именно здесь, по мнению Шашуа, скрыта наиболее сложная часть ИИ .

👁️ Эволюция сенсорики: от объектов к «сильному восприятию» 1:50

В области обработки визуальных данных Mobileye выделяет три уровня сложности :

🗺️ Карта как ловушка: почему подход Silicon Valley может не сработать 6:22

Профессор критикует распространенный подход, который он называет «тяжелым по картам» (map-heavy) .

Традиционный подход (многие компании Кремниевой долины):

  1. Использование лидара для определения объектов в 3D.
  2. Локализация автомобиля на сверхдетальной HD-карте.
  3. Наложение объектов на карту, чтобы понять, где находятся полосы (даже если их не видно).

Главная проблема здесь в том, что 2D-данные (с камер) крайне сложно переводить в 3D-координаты без ошибок. Кроме того, создание и обновление таких карт вручную или специализированными парками машин — это невероятно дорого и не масштабируемо .

Подход Mobileye (map-light): Использование камеры как основного сенсора, так как это единственный датчик, в котором текстура и форма сосуществуют в одном кадре . Система проецирует 3D-карту на 2D-плоскость изображения (что гораздо проще технически) и использует краудсорсинг для обновления карт (технология REM). Это позволяет создавать системы «Level 2+», которые по ощущениям близки к автопилоту , но обходятся без дорогостоящих лидаров .

🚦 Искусство дорожных переговоров: Driving Policy 12:41

Одной из самых острых проблем современной робототехники Шашуа называет излишнюю осторожность беспилотников . В сложных ситуациях, таких как выезд на плотное шоссе или перестроение в пробке, классические алгоритмы пасуют, и водителю-испытателю приходится брать управление на себя.

Ключевые тезисы о поведении на дороге:

В качестве примера Шашуа демонстрирует агрессивный трафик в Израиле, где «вежливый» алгоритм просто никогда не сможет сдвинуться с места . Одной из сложнейших задач является «двойное слияние» (double lane merge), где машины с двух сторон меняются полосами без четких правил приоритета . В таких ситуациях возможны даже «мертвые петли» (deadlocks), когда два водителя блокируют друг друга .

🧠 Машинное обучение против «взрыва данных» 17:33

Для решения задач планирования пути Mobileye использует обучение с подкреплением (Reinforcement Learning) . Однако здесь возникает фундаментальная трудность:

Шашуа заявляет, что Mobileye нашла математический способ гарантировать безопасность без бесконечного пересбора данных . В их модели из 100 000 симуляций сложных слияний произошло 0% аварий . При этом алгоритм крайне эффективен: он занимает всего 1% вычислительной мощности чипа EyeQ, отведенной под сенсорику . Профессор сравнивает это достижение с нейросетью AlphaGo от Google: использование ИИ позволяет «умно» обходить дерево возможных решений, не просчитывая каждый теоретический вариант .

🔚 Итоги 23:05

В завершение Амнон Шашуа резюмирует, что без решения проблемы «Driving Policy» индустрия никогда не увидит настоящих автономных машин . Беспилотник должен быть таким же гибким и решительным, как человек, но при этом гарантированно безопасным.

💬 Цитаты

«Вождение — это мультиагентная игра, и другие агенты — люди. Они агрессивны, они ошибаются, и нам нужно с этим справляться.»

Амнон Шашуа 13:35

«Если мы не создадим бизнес-модель, у нас не будет автономного вождения. HD-карты сегодня слишком дороги и не масштабируемы.»

Амнон Шашуа 11:00
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Sensing
Процесс восприятия окружающей среды через датчики (камеры, радары, лидары).
Driving Policy
Алгоритм принятия решений роботом: когда ускориться, затормозить или перестроиться.
Reinforcement Learning
Метод машинного обучения, при котором система обучается на основе взаимодействия со средой и получения наград или штрафов.
Corner Cases
Редкие, экстремальные ситуации, которые сложно предусмотреть при стандартном обучении системы.
📊 Цифры
🗓 Хронология
  1. 2017 Выступление на конференции Bosch ConnectedWorld, презентация стратегии Driving Policy.
  2. 2017 Демонстрация совместной работы Mobileye и Delphi на 10-километровом маршруте в Лас-Вегасе.
⚖️ Другая сторона
Искусственный интеллект Mobileye Amnon Shashua Autonomous Driving Reinforcement Learning EyeQ