Профессор Амнон Шашуа: «Камера — самый дешевый и богатый источник данных для беспилотника»

Mobileye 62,1 тыс. 38 мин 5 мин 16.01.2015
Главное

Будущее компьютерного зрения и беспилотного вождения: технологии Mobileye

Профессор Амнон Шашуа, сооснователь и технический директор компании Mobileye, представляет видение развития систем помощи водителю (ADAS) и перехода к полностью автономному управлению. Основной акцент сделан на использовании камер как ключевого сенсора, применении глубокого обучения для моделирования среды и разработке специализированных микропроцессоров EyeQ, способных конкурировать с решениями суперкомпьютерного класса при значительно меньшем энергопотреблении.

🚗 Эволюция и революция в системах безопасности 1:11

Амнон Шашуа выделяет два основных направления в индустрии вождения: эволюционное и революционное . Эволюционный путь связан с активной безопасностью и системами предотвращения столкновений, такими как автономное экстренное торможение (AEB) . Благодаря регуляторным мерам и рейтингам безопасности, к 2018–2019 годам практически каждый новый автомобиль будет оснащен подобными датчиками, где камера играет критическую роль .

Революционный путь — это переход к полностью автоматизированному вождению, который трансформирует сам процесс передвижения . Текущие возможности систем Mobileye уже позволяют детально интерпретировать визуальное поле:

Эти данные обрабатываются с частотой 36 кадров в секунду на чипах EyeQ3 . С 2007 года Mobileye последовательно выводила на рынок инновации: от первого распознавания знаков в BMW 7 серии до систем обнаружения пешеходов в Volvo . В текущем периоде (на момент выступления) компания запускает системы полного экстренного торможения на базе одной камеры совместно с Audi и систему обнаружения крупных животных (лосей, оленей) с Volvo .

👁️ Камера как доминирующий сенсор 6:20

По мнению Шашуа, происходит «вытеснение камерами» (camera disruption) традиционных радаров. Если раньше такие функции, как адаптивный круиз-контроль (ACC) или предупреждение о столкновении, были прерогативой радаров, то теперь они успешно реализуются с помощью монокулярных камер .

Профессор приводит три ключевых аргумента в пользу камер:

  1. Информативность: Камера — это самый богатый источник необработанных данных, способный отразить истинную сложность сцены .
  2. Стоимость: Сам сенсор (imager) стоит всего несколько долларов, что недостижимо для других типов датчиков .
  3. Технологический прогресс: Постоянно растет динамический диапазон и разрешение матриц .

Особое внимание Шашуа уделяет проблеме «ложных срабатываний» (false positive). В то время как «ложные пропуски» (false negative) вредят рейтингу безопасности, ложное торможение на пустой трассе — это катастрофа, ведущая к отзыву автомобилей . Для борьбы с этим Mobileye использует базу данных из более чем 10 миллионов миль записанных поездок, собранных в ходе сотрудничества с 21 автопроизводителем .

🧠 Глубокое обучение и моделирование среды 13:52

Для перехода к автоматизированному вождению недостаточно просто улучшать текущие функции. Шашуа утверждает, что требуются технологические скачки в понимании визуальной информации . Существует две крайности: подход Google (запись огромных массивов 3D-данных перед поездкой) и подход Mobileye — «чувствуй и понимай» (sense and understand) .

Mobileye придерживается идеи минимального использования карт (всего 1 МБ данных на 1 час поездки) и максимальной интерпретации сцены в реальном времени . Это необходимо, так как во многих регионах (например, в Детройте или Израиле) дорожная разметка может быть плохой или отсутствовать вовсе .

Ключевые задачи «завтрашнего дня» по версии Шашуа:

Для решения этих задач компания последние два года интегрирует технологии глубокого обучения (Deep Learning) в архитектуру EyeQ . В отличие от академических моделей (таких как AlexNet), требующих огромных вычислительных мощностей, Mobileye адаптировала сети так, чтобы они занимали всего 5% ресурсов чипа EyeQ3 и 0,3% будущего EyeQ4 .

💻 Аппаратная битва: EyeQ против NVIDIA 28:49

Шашуа вступил в заочную полемику с компанией NVIDIA. Он упомянул демонстрацию платы zFAS от Audi, где использовался чип Tegra X1 . По словам профессора, публика не знала, что на той же плате находится чип EyeQ3, который и выполнял все задачи по компьютерному зрению, показанные в презентации .

Анализируя производительность, Шашуа приводит следующие сравнения:

Следующее поколение, EyeQ4 (образцы ожидаются в октябре текущего года), будет обладать производительностью 2,5 терафлопса. С учетом высокой эффективности использования ресурсов, Шашуа считает, что этот чип превзойдет конкурентов в задачах компьютерного зрения более чем в 10 раз .

🛣️ Будущее: Дорожная карта автоматизации 36:31

Профессор предлагает концепцию «трифокальной» системы камер для беспилотников:

  1. Широкоугольная (150°): Для обнаружения пешеходов и велосипедистов в городе, а также светофоров .
  2. Основная: Стандартное поле зрения для текущих задач ADAS.
  3. Узкоугольная: Для обнаружения мелких объектов (мусора, обломков, ям размером 10 см) на расстоянии 80 метров и более, что необходимо для безопасного движения на высокой скорости без участия рук .

Прогноз развития индустрии от Mobileye:

Шашуа заключает, что камеры станут доминирующим сенсором, а радары и лидары (Lidar) будут использоваться для избыточности и повышения надежности в тех случаях, когда это позволяет стоимость системы .

💬 Цитаты

«Камера — единственный сенсор, который может отразить истинную сложность сцены.»

Амнон Шашуа 07:12

«Ложное срабатывание тормоза — это катастрофа, ведущая к отзыву автомобилей.»

Амнон Шашуа 08:48
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
ADAS
Продвинутые системы помощи водителю (Advanced Driver Assistance Systems).
AEB
Автономное электронное экстренное торможение (Autonomous Emergency Braking).
Deep Learning
Глубокое обучение — метод машинного обучения на основе многослойных нейронных сетей.
EyeQ
Семейство специализированных микропроцессоров компании Mobileye для обработки визуальной информации.
📊 Цифры
🗓 Хронология
  1. 2007 Запуск первой системы слияния камеры и радара (Volvo).
  2. 2015 Выпуск чипа EyeQ3 и систем полного торможения на базе одной камеры.
  3. 2017-2018 Прогнозируемое появление автопилотов для городского движения.
⚖️ Другая сторона
Искусственный интеллект Mobileye EyeQ компьютерное зрение автопилот Amnon Shashua