# Амнон Шашуа: «Вождение — это игра, в которой робот обязан научиться торговаться»

Источник: https://www.youtube.com/watch?v=GJ82mk99Agw
Канал: Mobileye
Опубликовано: 29.03.2017

---

На конференции Bosch ConnectedWorld 2017 профессор Амнон Шашуа, сооснователь компании Mobileye, представил глубокий анализ технологических вызовов, стоящих перед индустрией беспилотного транспорта. В своем выступлении он выделил три ключевых столпа автономного вождения: сенсорика (sensing), высокоточное картографирование (mapping) и стратегия вождения (driving policy). Особое внимание было уделено тому, почему популярный в Кремниевой долине подход к созданию беспилотников может оказаться тупиковым и как использование искусственного интеллекта (ИИ) позволяет машинам освоить человеческие навыки ведения переговоров на дороге.

## 📱 Три столпа технологии автономного вождения
[[JUMP:00:41]]

Профессор Шашуа подчеркивает, что для создания полноценного беспилотного автомобиля необходимо решить три фундаментальные задачи [0:41]:

1.  **Сенсорика (Sensing):** Сбор данных с камер, радаров и лазерных сканеров (лидаров) для создания модели окружающей среды в реальном времени.
2.  **Высокоточное картографирование (HD Mapping):** Создание «дорожной книги» с сантиметровой точностью, которая обеспечивает избыточность данных и позволяет системе заглядывать за пределы видимости сенсоров [1:16].
3.  **Стратегия вождения (Driving Policy):** Принятие решений и навыки «переговоров» с другими участниками движения в сложных городских условиях. Именно здесь, по мнению Шашуа, скрыта наиболее сложная часть ИИ [1:36].

## 👁️ Эволюция сенсорики: от объектов к «сильному восприятию»
[[JUMP:01:50]]

В области обработки визуальных данных Mobileye выделяет три уровня сложности [3:50]:

*   **Детекция объектов:** Распознавание автомобилей, пешеходов и знаков. Эта задача считается решенной и уже широко применяется в современных системах помощи водителю (ADAS) [4:17].
*   **Понимание свободного пространства:** Определение физических границ дороги (бордюры, барьеры, ограждения) и семантического значения разметки [4:30].
*   **Проектирование путей (Strong Perception):** Самый сложный этап — понимание того, куда ведет конкретная полоса, как потоки сливаются через 50 метров и как ехать при отсутствии разметки. По словам Шашуа, это до сих пор остается открытой проблемой, требующей «сильного восприятия» [5:10].

## 🗺️ Карта как ловушка: почему подход Silicon Valley может не сработать
[[JUMP:06:22]]

Профессор критикует распространенный подход, который он называет «тяжелым по картам» (map-heavy) [6:29]. 

**Традиционный подход (многие компании Кремниевой долины):**

1.  Использование лидара для определения объектов в 3D.
2.  Локализация автомобиля на сверхдетальной HD-карте.
3.  Наложение объектов на карту, чтобы понять, где находятся полосы (даже если их не видно).

Главная проблема здесь в том, что 2D-данные (с камер) крайне сложно переводить в 3D-координаты без ошибок. Кроме того, создание и обновление таких карт вручную или специализированными парками машин — это невероятно дорого и не масштабируемо [10:56].

**Подход Mobileye (map-light):**
Использование камеры как основного сенсора, так как это единственный датчик, в котором текстура и форма сосуществуют в одном кадре [8:32]. Система проецирует 3D-карту на 2D-плоскость изображения (что гораздо проще технически) и использует краудсорсинг для обновления карт (технология REM). Это позволяет создавать системы «Level 2+», которые по ощущениям близки к автопилоту [11:49], но обходятся без дорогостоящих лидаров [12:15].

## 🚦 Искусство дорожных переговоров: Driving Policy
[[JUMP:12:41]]

Одной из самых острых проблем современной робототехники Шашуа называет излишнюю осторожность беспилотников [13:08]. В сложных ситуациях, таких как выезд на плотное шоссе или перестроение в пробке, классические алгоритмы пасуют, и водителю-испытателю приходится брать управление на себя.

Ключевые тезисы о поведении на дороге:

*   Вождение — это многопользовательская игра, где партнеры (люди) не всегда следуют правилам, могут быть агрессивны или совершать ошибки [13:35].
*   Для робота критически важно освоить навыки «переговоров» (negotiation skills), чтобы уметь вклиниваться в поток, не создавая аварий, но и не замирая на месте навсегда [14:43].

В качестве примера Шашуа демонстрирует агрессивный трафик в Израиле, где «вежливый» алгоритм просто никогда не сможет сдвинуться с места [15:00]. Одной из сложнейших задач является «двойное слияние» (double lane merge), где машины с двух сторон меняются полосами без четких правил приоритета [15:40]. В таких ситуациях возможны даже «мертвые петли» (deadlocks), когда два водителя блокируют друг друга [17:06].

## 🧠 Машинное обучение против «взрыва данных»
[[JUMP:17:33]]

Для решения задач планирования пути Mobileye использует обучение с подкреплением (Reinforcement Learning) [19:02]. Однако здесь возникает фундаментальная трудность:

*   В обычном обучении (сенсорика) данные можно собрать один раз и прогонять через сеть.
*   В обучении с подкреплением действия робота меняют окружение. Если изменить алгоритм вождения, придется заново собирать миллионы километров данных, чтобы убедиться в отсутствии редких опасных случаев (Corner Cases) [19:56].

Шашуа заявляет, что Mobileye нашла математический способ гарантировать безопасность без бесконечного пересбора данных [20:34]. В их модели из 100 000 симуляций сложных слияний произошло 0% аварий [21:13]. При этом алгоритм крайне эффективен: он занимает всего 1% вычислительной мощности чипа EyeQ, отведенной под сенсорику [22:06]. Профессор сравнивает это достижение с нейросетью AlphaGo от Google: использование ИИ позволяет «умно» обходить дерево возможных решений, не просчитывая каждый теоретический вариант [22:19].

## 🔚 Итоги
[[JUMP:23:05]]

В завершение Амнон Шашуа резюмирует, что без решения проблемы «Driving Policy» индустрия никогда не увидит настоящих автономных машин [24:17]. Беспилотник должен быть таким же гибким и решительным, как человек, но при этом гарантированно безопасным.