# Алекс Кендалл: «Мировые модели — это мозг автономного транспорта»

Источник: https://www.youtube.com/watch?v=Zx8xIloYlEc
Канал: Eye on AI
Опубликовано: 08.11.2023

---

## Будущее автономного транспорта: как мировые модели меняют правила игры 🚘
[[JUMP:2:46]]

Автономное вождение долгое время опиралось на классическую робототехнику и детально прописанные карты, однако сейчас индустрия переходит к принципиально новому подходу — обучению «мозга» автомобиля с помощью искусственного интеллекта. Алекс Кендалл, генеральный директор компании Wave, в интервью подкасту *Eye on AI* объясняет, как использование мировых моделей (world models) позволяет создавать системы, способные самостоятельно принимать решения в реальных городских условиях.

### 🧠 Мировые модели как «симулятор будущего»
[[JUMP:0:00]]

По словам Алекса Кендалла, мировая модель — это своего рода математическая функция, которая понимает текущее состояние окружающей среды и предсказывает, как оно изменится под влиянием действий системы.

*   **Принцип работы:** Модель получает данные о состоянии мира и текущем действии, а затем «симулирует» следующее состояние.
*   **Преимущество:** В отличие от LLM (больших языковых моделей), которые лишь предсказывают следующее слово, мировая модель осознает последствия принятых решений, что критически важно для безопасности на дорогах.

Кендалл подчеркивает, что развитие этой технологии идет по трем ключевым направлениям: масштабирование нейросетей, мультимодальность (способность обрабатывать видео, текст и действия одновременно) и использование синтетических данных.

### 🤖 Gaia: «сердце» автономного вождения
[[JUMP:5:13]]

Gaia — это мировая модель, разработанная компанией Wave. Она позволяет системе не только понимать динамику дорожного движения, но и генерировать синтетические данные для обучения.

*   **Генерация сценариев:** Gaia может создавать новые, ранее не виденные ситуации, например, поведение пешехода в условиях густого тумана, что помогает обучать автомобиль справляться с редкими «длиннохвостыми» событиями.
*   **Мультимодальность:** Система способна усваивать знания из интернет-видео и даже текста, например, из официальных правил дорожного движения.
*   **Lingo:** В рамках проекта Wave создала модель *Lingo* — систему, позволяющую пассажиру взаимодействовать с автомобилем через голос, спрашивая, почему машина совершила тот или иной маневр, что способствует выстраиванию доверия.

### 🛠 Архитектура и эффективность обучения
[[JUMP:19:23]]

В отличие от классических систем автономного вождения, использующих глубокое обучение только для восприятия (остальное — ручное программирование), Wave делает ставку на сквозное (end-to-end) обучение одной большой нейронной сетью.

*   **Сжатие данных:** Поскольку объем данных с камер (гигабайты в секунду) слишком велик для обработки в исходном виде, система сжимает их в эффективное представление (embedding space).
*   **Обучение без учителя:** Система обучается через наблюдение за реальным вождением, не требуя разметки каждого объекта вручную.
*   **Масштабирование:** Кендалл отмечает, что при переходе на новые типы транспортных средств (например, с легкового автомобиля на грузовой фургон) требуется лишь 2–3% от первоначального объема данных для достижения аналогичной эффективности.

### 🚦 Перспективы и препятствия
[[JUMP:34:36]]

На текущем этапе технология проходит процесс коммерциализации. Wave уже сотрудничает с такими крупными британскими ритейлерами, как DPD, ASDA и Ocado Group, доставляя продукты в Лондоне.

*   **Регулирование:** Кендалл активно работает с правительством Великобритании, помогая создавать законодательную базу для легализации автономного транспорта.
*   **Вычисления:** Обучение моделей происходит в облаке (Azure), но сама инференс-часть (реальное управление) работает непосредственно на борту автомобиля, что делает решение более устойчивым к сетевым задержкам.
*   **Гуманоидная робототехника:** Кендалл крайне оптимистичен относительно будущего роботов, но считает, что автономные автомобили станут первой массовой формой прикладного воплощенного ИИ (embodied AI) из-за наличия готовой инфраструктуры и данных.

Модель Gaia пока не является открытым исходным кодом (open source), однако компания активно публикует исследовательские работы и делится результатами с научным сообществом.