Амнон Шашуа: «Вождение — это игра, в которой робот обязан научиться торговаться»

На конференции Bosch ConnectedWorld 2017 профессор Амнон Шашуа, сооснователь компании Mobileye, представил глубокий анализ технологических вызовов, стоящих перед индустрией беспилотного транспорта. В своем выступлении он выделил три ключевых столпа автономного вождения: сенсорика (sensing), высокоточное картографирование (mapping) и стратегия вождения (driving policy). Особое внимание было уделено тому, почему популярный в Кремниевой долине подход к созданию беспилотников может оказаться тупиковым и как использование искусственного интеллекта (ИИ) позволяет машинам освоить человеческие навыки ведения переговоров на дороге.

📱 Три столпа технологии автономного вождения 0:41

Профессор Шашуа подчеркивает, что для создания полноценного беспилотного автомобиля необходимо решить три фундаментальные задачи :

Сенсорика (Sensing): Сбор данных с камер, радаров и лазерных сканеров (лидаров) для создания модели окружающей среды в реальном времени.
Высокоточное картографирование (HD Mapping): Создание «дорожной книги» с сантиметровой точностью, которая обеспечивает избыточность данных и позволяет системе заглядывать за пределы видимости сенсоров .
Стратегия вождения (Driving Policy): Принятие решений и навыки «переговоров» с другими участниками движения в сложных городских условиях. Именно здесь, по мнению Шашуа, скрыта наиболее сложная часть ИИ .

👁️ Эволюция сенсорики: от объектов к «сильному восприятию» 1:50

В области обработки визуальных данных Mobileye выделяет три уровня сложности :

Детекция объектов: Распознавание автомобилей, пешеходов и знаков. Эта задача считается решенной и уже широко применяется в современных системах помощи водителю (ADAS) .
Понимание свободного пространства: Определение физических границ дороги (бордюры, барьеры, ограждения) и семантического значения разметки .
Проектирование путей (Strong Perception): Самый сложный этап — понимание того, куда ведет конкретная полоса, как потоки сливаются через 50 метров и как ехать при отсутствии разметки. По словам Шашуа, это до сих пор остается открытой проблемой, требующей «сильного восприятия» .

🗺️ Карта как ловушка: почему подход Silicon Valley может не сработать 6:22

Профессор критикует распространенный подход, который он называет «тяжелым по картам» (map-heavy) .

Традиционный подход (многие компании Кремниевой долины):

Использование лидара для определения объектов в 3D.
Локализация автомобиля на сверхдетальной HD-карте.
Наложение объектов на карту, чтобы понять, где находятся полосы (даже если их не видно).

Главная проблема здесь в том, что 2D-данные (с камер) крайне сложно переводить в 3D-координаты без ошибок. Кроме того, создание и обновление таких карт вручную или специализированными парками машин — это невероятно дорого и не масштабируемо .

Подход Mobileye (map-light): Использование камеры как основного сенсора, так как это единственный датчик, в котором текстура и форма сосуществуют в одном кадре . Система проецирует 3D-карту на 2D-плоскость изображения (что гораздо проще технически) и использует краудсорсинг для обновления карт (технология REM). Это позволяет создавать системы «Level 2+», которые по ощущениям близки к автопилоту , но обходятся без дорогостоящих лидаров .

🚦 Искусство дорожных переговоров: Driving Policy 12:41

Одной из самых острых проблем современной робототехники Шашуа называет излишнюю осторожность беспилотников . В сложных ситуациях, таких как выезд на плотное шоссе или перестроение в пробке, классические алгоритмы пасуют, и водителю-испытателю приходится брать управление на себя.

Ключевые тезисы о поведении на дороге:

Вождение — это многопользовательская игра, где партнеры (люди) не всегда следуют правилам, могут быть агрессивны или совершать ошибки .
Для робота критически важно освоить навыки «переговоров» (negotiation skills), чтобы уметь вклиниваться в поток, не создавая аварий, но и не замирая на месте навсегда .

В качестве примера Шашуа демонстрирует агрессивный трафик в Израиле, где «вежливый» алгоритм просто никогда не сможет сдвинуться с места . Одной из сложнейших задач является «двойное слияние» (double lane merge), где машины с двух сторон меняются полосами без четких правил приоритета . В таких ситуациях возможны даже «мертвые петли» (deadlocks), когда два водителя блокируют друг друга .

🧠 Машинное обучение против «взрыва данных» 17:33

Для решения задач планирования пути Mobileye использует обучение с подкреплением (Reinforcement Learning) . Однако здесь возникает фундаментальная трудность:

В обычном обучении (сенсорика) данные можно собрать один раз и прогонять через сеть.
В обучении с подкреплением действия робота меняют окружение. Если изменить алгоритм вождения, придется заново собирать миллионы километров данных, чтобы убедиться в отсутствии редких опасных случаев (Corner Cases) .

Шашуа заявляет, что Mobileye нашла математический способ гарантировать безопасность без бесконечного пересбора данных . В их модели из 100 000 симуляций сложных слияний произошло 0% аварий . При этом алгоритм крайне эффективен: он занимает всего 1% вычислительной мощности чипа EyeQ, отведенной под сенсорику . Профессор сравнивает это достижение с нейросетью AlphaGo от Google: использование ИИ позволяет «умно» обходить дерево возможных решений, не просчитывая каждый теоретический вариант .

🔚 Итоги 23:05

В завершение Амнон Шашуа резюмирует, что без решения проблемы «Driving Policy» индустрия никогда не увидит настоящих автономных машин . Беспилотник должен быть таким же гибким и решительным, как человек, но при этом гарантированно безопасным.