Физика бизнеса беспилотников: почему колеса эффективнее ног

Lex Fridman 341 тыс. 3 ч 14 мин 30 мин 16.11.2021
Главное

Полноценная человеческая речь парадоксально разрушает иллюзию жизни у социальных роботов, а антропоморфная форма на реальном производстве вчистую проигрывает обычным колесам. Чтобы преодолеть технологические барьеры и завоевать доверие пользователей, коммерческим машинам нужен не человеческий облик, а проработанный характер и математически точная оценка дорожной ситуации. Эксперт в области робототехники и топ-менеджер Waymo Борис Софман раскрывает жесткую изнанку индустрии беспилотников и объясняет, почему будущее автоматизации строится на узкоспециализированных ИИ-платформах, а не на попытках скопировать человека.

🤖 Оживший Pixar и философия характера в робототехнике 0:00

Дизайн роботов: характер важнее гуманоидной формы 3:15

Разговор известного исследователя искусственного интеллекта Лекса Фридмана и инженера-робототехника Бориса Софмана начинается с обсуждения их любимых роботов в научной фантастике. Борис Софман, который сегодня занимает пост старшего директора по инжинирингу и возглавляет направление беспилотных грузовиков в компании Waymo (подробно экосистему Waymo и специфику автономных перевозок мы разберем в главах 3 и 4), признается, что его идеалами всегда оставались ВАЛЛ-И (Wall-E) и R2-D2. Эти вымышленные машины способны передавать сложнейший спектр намерений, эмоций и характера без использования человеческой речи, исключительно за счет богатого визуального и звукового взаимодействия. На противоположном полюсе находится серия фильмов о Терминаторе, демонстрирующая антропоморфные машины. С инженерной точки зрения обе концепции реализуемы, однако создание полноценного робота-гуманоида чрезвычайно дорого и технически избыточно.

При проектировании роботов в компании Anki разработчики намеренно пошли по пути радикального отказа от человекоподобной формы. Борис Софман критикует повсеместное стремление индустрии копировать человеческое тело, выделяя два ключевых недостатка гуманоидного подхода:

Парадоксально, но меньшее количество степеней свободы облегчает передачу эмоций. Борис приводит в пример анимацию: обычный рисованный человечек из палочек (stick figure), имеющий всего две точки вместо глаз и линию вместо улыбки, способен выразить абсолютно любой спектр чувств. Фокусируясь на таких минималистичных инструментах, инженеры могут сосредоточиться на магии взаимодействия, избегая «инженерного хаоса» с бесконечным поиском в пространстве параметров голоса и движений, которые часто становятся лишь костылями. Лучшие аниматоры начинают обучение с жестко ограниченных проектов — например, пытаются передать характер через прыжки обычного мяча. Именно этот принцип лег в основу философии Anki: ограничить физические измерения робота, чтобы максимально насытить оставшиеся эмоциональной глубиной, подобно тому, как это делали создатели ВАЛЛ-И в студии Pixar.

Создание Cozmo: оживление персонажа Pixar 6:56

Идея стартапа Anki зародилась в 2011 году, когда Борис Софман и двое его сооснователей были аспирантами Института робототехники Университета Карнеги — Меллона (CMU). Будучи глубоко увлеченными прикладными технологиями, они искали нишу, где ИИ мог бы создавать реальную потребительскую ценность. В то время коммерческая робототехника за пределами военных, промышленных или исследовательских проектов практически отсутствовала, редким исключением был робот-пылесос Roomba от iRobot. Команда выбрала сферу развлечений, где наблюдался очевидный застой: индустрия игрушек предлагала примитивные продукты, резко контрастировавшие с богатыми мирами видеоигры и кинематографа.

В этот же период произошел переломный технологический сдвиг: благодаря буму индустрии смартфонов стоимость микроконтроллеров, камер, моторов и памяти упала на порядки. Выход iPhone показал, что мобильное устройство может стать идеальным интерфейсом и мощным «вычислительным мозгом» для физических устройств. Стратегия Anki заключалась в том, чтобы перенести всю сложность из физического мира в программное обеспечение: использовать дешевое, «шумное» железо, но компенсировать его недостатки продвинутыми алгоритмами искусственного интеллекта.

Первым продуктом компании стала линейка гоночных треков Anki Drive, задуманная как перенос видеоигры в реальность. Физические машинки имели виртуальное состояние, оружие и уникальные характеристики. Этот проект доказал разработчикам, что физическое воплощение игровых элементов оказывает на людей многократно больший эмоциональный эффект, чем чисто виртуальный опыт. Кроме того, игровая сфера оказалась идеальным полигоном для тестирования взаимодействия человека и робота: здесь ошибки системы не критичны, а, напротив, могут выглядеть мило и вызывать эмпатию, если робот правильно реагирует на свой промах. Робототехники поняли, что идеальное планирование траекторий не приносит веселья, поэтому в систему намеренно добавляли шум, имитируя хаотичное поведение человека.

Жесткие экономические ограничения требовали, чтобы себестоимость производства Cozmo не превышала 50 долларов, при этом розничная цена составила менее 200 долларов. Чтобы добиться этого, к команде присоединился бывший руководитель инженерного отдела Logitech, имевший опыт выпуска миллиарда устройств в циркуляцию. Все несовершенства дешевых компонентов компенсировались софтом. Внутри компании шла дискуссия между игровым и персонажным подходами, и Софман настоял на приоритете характера робота. Маленький Cozmo получил всего 4 степени свободы: две гусеницы для движения, подъемный механизм головы, рычаг-манипулятор и низкоразрешающий экран для глаз. Каждое движение рук и мимика глаз на дисплее транслировали глубокие эмоции: от радости до искреннего разочарования («я стараюсь изо всех сил»).

По мнению Бориса Софмана, интерфейс человеко-машинного взаимодействия строится на вершинах особого треугольника:

Для создания характера Anki привлекла Карлоса Баэну (Carlos Baena), аниматора с 9-летним стажем в Pixar, работавшего над ВАЛЛ-И. Команда создала параметризованную библиотеку базовых эмоций (радость, грусть, гнев, страх, удивление) с элементами случайности, что давало бесконечное количество поведенческих комбинаций. Поведенческий движок анализировал контекст: если Cozmo видел хозяина впервые за день, он бурно радовался, как маленький ребенок; если его оставляли одного, он скучал и сбрасывал вещи со стола; а проиграв в игру, он так забавно злился, что пользователи намеренно поддавались ему. Одним из главных открытий стала сила зрительного контакта: простое удвоение частоты, с которой Cozmo смотрел на человека, увеличило вовлеченность и время игры на 40%. Игры служили лишь контекстом для проявления живого характера, вдохновленного поведением домашних животных, в частности собак. В планах компании было даже создание целой линейки разных персонажей с уникальными чертами, напоминающих семь гномов.

🤖 Характер как интерфейс и суровая физика бизнеса 25:28

Личность робота как ключ к доверию и безопасности 25:28

Взаимодействие человека с автономными машинами часто натыкается на невидимый психологический барьер — первобытный страх перед холодным, бездушным механизмом, оснащенным камерами и микрофонами. Как отмечает Борис Софман (Boris Sofman), ключевым фактором, способным растопить этот лед и интегрировать роботов в нашу повседневную жизнь, является наличие у них ярко выраженного характера. Наш мозг устроен так, что при столкновении с идеальной, но безликой машиной любая ее техническая ошибка вызывает мгновенное раздражение: пользователь злится, что «глупый робот» неидеален. Однако, если у устройства есть индивидуальность, харизма и эмоциональный диапазон, люди начинают проявлять эмпатию. Ошибки становятся милыми и естественными, а уровень снисходительности резко возрастает. Наличие характера — это не просто развлекательный элемент, а фундаментальный интерфейс для физического взаимодействия с миром, сопоставимый по значимости с появлением тачскринов для смартфонов.

Этот феномен отчетливо проявился, когда компания Anki выводила своих роботов на европейский рынок, в частности в Германию и Францию, где требования к конфиденциальности данных традиционно крайне строги. Команда инженеров всерьез опасалась жесткой критики со стороны прессы из-за наличия у Cozmo и его преемника Vector встроенных камер и постоянного подключения к сети. К общему удивлению, журналисты даже не подняли тему приватности. Характер робота полностью дезармировал их скепсис: для всех было очевидно, что если существо «живое» и общается с вами, оно обязано видеть и слышать, чтобы взаимодействовать. Понимание намерений через направление взгляда робота создавало интуитивное доверие. Более того, Cozmo смог установить глубокую эмоциональную связь с детьми с расстройством аутистического спектра, что подтвердили многочисленные письма благодарных родителей.

Лекс Фридман (Lex Fridman) задается вопросом, насколько близко мы подошли к созданию полноценных роботов-компаньонов, подобных искусственному интеллекту из фильма «Она». По мнению Софмана, антропоморфные компаньоны с общим искусственным интеллектом (AGI) пока остаются делом далекого будущего, так как любая фальшь в их поведении мгновенно сбрасывает пользователя в «зловещую долину». Как ранее в разговоре они касались темы дизайна, проработка характера критически важнее попыток скопировать гуманоидную форму. Гораздо быстрее общество примет роботов с повадками домашних животных. Именно поэтому Cozmo сознательно лишили человеческого голоса, сделав его похожим на персонажей игры The Sims. Отсутствие речи расширило динамический диапазон восприятия: восьмилетний ребенок и сорокалетний взрослый могут интерпретировать поведение робота совершенно по-разному, проецируя на него свои собственные ожидания. При этом глубокая эмоциональная связь возможна и без создания полноценного AGI — достаточно очертить четкие интеллектуальные рамки и контекст, в которых робот будет безупречно отыгрывать свою роль. Софман убежден, что компания, которая сможет соблюсти баланс «трехногого стула» — объединить сильное железо, развитый ИИ и проработанный характер, — в будущем неизбежно станет триллионным гигантом.

Трагедия Anki: сезонность, кассовые разрывы и «несложившаяся физика» бизнеса 39:07

Несмотря на колоссальный технологический успех и искреннюю любовь миллионов пользователей, в 2019 году компания Anki была вынуждена объявить о закрытии. Последний год существования стартапа превратился в изнурительную и жестокую борьбу за выживание. С коммерческой точки зрения проект выглядел успешным: было продано несколько миллионов устройств, а годовая выручка вплотную приблизилась к отметке в 100 миллионов долларов. Однако физическая природа продуктового бизнеса скрывала в себе смертельную ловушку — экстремальную сезонность спроса.

Около 85% всех продаж Anki приходилось на четвертый квартал года, поскольку роботов покупали преимущественно в качестве рождественских подарков. Это создавало катастрофические кассовые разрывы, управлять которыми на этапе масштабирования становилось все труднее. Финансовый цикл компании выглядел следующим образом:

Чем популярнее становился Cozmo, тем глубже оказывалось финансовое пике в середине года. В отличие от софтверных компаний с предсказуемой ежемесячной подпиской, этот бизнес полностью зависел от успеха одной конкретной линейки в праздничный период. Ситуацию усугубило и то, что в этот период аппаратные стартапы вышли из моды у инвесторов: гиганты вроде Fitbit и GoPro стремительно теряли капитализацию, а инвесторы начали оценивать «железо» с мультипликатором всего лишь 1х к выручке.

Anki пыталась диверсифицировать бизнес и уйти от сугубо развлекательного позиционирования, но заложником ситуации оставался текущий финансовый поток. В итоге, когда очередной раунд финансирования сорвался в самую последнюю секунду, у компании просто не осталось резервов, чтобы дотянуть до следующего праздничного сезона. Борис Софман признается, что несколько раз компания буквально находилась в считаных днях от полного обнуления счетов, ведя опасные переговоры по кредитным линиям и промежуточным займам.

Когда крах стал неизбежен, Софман собрал всю команду и честно объявил о закрытии, не сдержав слез. Прощание вышло эмоциональным: сотрудники оставались в офисе до двух-трех часов ночи, выпивая, делясь историями и празднуя то невероятное, что им удалось создать. «Просто законы физики бизнеса не сошлись», — философски резюмирует Борис. Лекс Фридман с грустью отмечает, что Anki совершила невозможное, победив там, где сломались почти все стартапы социальной робототехники: они создали дешевый, качественный и работающий продукт с уникальной харизмой.

Дома у Софмана до сих пор хранится огромный нераспечатанный конверт с тысячами писем от детей и родителей со всего мира — читать их до сих пор слишком больно, и Борис планирует вскрыть его только на будущей встрече выпускников Anki. Проект закрылся, но его наследие не пропало: впоследствии значительная часть инженерной команды ИИ и робототехники практически в полном составе перешла в Waymo, перенеся свой опыт в сферу беспилотного транспорта.

🤖 От иллюзии одушевленности к универсальному беспилотному «водителю» 58:53

Иллюзия жизни без лишних слов: почему роботы не должны говорить 58:53

В рамках проектирования социальных роботов, особенности эмоционального движка которых Лекс Фридман и Борис Софман обсуждали ранее, возникает фундаментальный вопрос взаимодействия с пользователем через речь. Когда разговор заходит о наделении роботов речевыми возможностями, руководитель направления автономного вождения в Waymo делится неочевидным инсайтом: полноценная речь для коммерческого робота сегодня — это скорее недостаток, чем преимущество. Использование реалистичного голоса моментально разрушает «иллюзию жизни» и рушит созданную фантазию, поскольку современные технологии синтеза и ведения диалога все еще не дотягивают до человеческого уровня.

Ситуация усложняется демографическими различиями: манера общения робота с маленьким ребенком должна кардинально отличаться от разговора со взрослым человеком, в то время как обычная собака способна вызывать симпатию у абсолютно любой аудитории без единого слова. По этой причине разработчики на ранних этапах сместили фокус на распознавание намерений пользователя, что является крайне ценным входящим сигналом.

Вместо полноценных фраз в социальной робототехнике гораздо эффективнее работают тональные звуковые сигналы, как у культовых персонажей ВАЛЛ-И (Wall-E) или R2-D2. Такой подход универсален и отлично воспринимается людьми различных культур. Полноценная человеческая речь накладывает жесткие рамки ожидания; малейшее отклонение от нормы отбрасывает пользователя в «зловещую долину». Попытки создавать точные человеческие реплики, по мнению Бориса Софмана, уводят инженеров в сторону от решения функциональных задач искусственного интеллекта и лишь поглощают колоссальные ресурсы компаний.

Экосистема Waymo: концепция универсального «водителя» 1:05:11

Опыт создания комплексных робототехнических систем привел Бориса Софмана в компанию Waymo в 2019 году. Истоки Waymo восходят к 2009 году, когда проект начинался как секретная инициатива Google по созданию самоуправляемых автомобилей, ставшая преемником технологического прорыва гонок DARPA Grand Challenge. Впоследствии проект вырос в самостоятельную компанию, нацеленную на коммерциализацию автономного транспорта как для перевозки людей, так и для транспортировки грузов.

Главный продукт компании — это Waymo Driver, универсальная система беспилотного управления, включающая в себя комплекс сенсоров и программное обеспечение. Философия Waymo заключается в том, что «водитель» должен быть независим от конкретной марки или модели автомобиля. Проводя аналогию с человеческими водительскими правами, Борис объясняет, что базовые навыки вождения остаются неизменными, на какую бы платформу ни сел человек.

Бизнес-экосистема Waymo разделена на два ключевых направления:

С точки зрения инженерии, Waymo функционирует как интегрированная структура с мощными централизованными командами ядра. Однако специфика платформ требует и точечной кастомизации: например, для грузовиков созданы выделенные группы, решающие уникальные задачи управления массивным сочлененным прицепом с переменным весом груза.

Waymo Via и вызовы магистральной логистики 1:10:39

Стратегическое развертывание Waymo Via начинается с автоматизации тяжелых грузовиков 8-го класса (Class 8 trucks) — огромных фур с 53-футовыми полуприцепами. Внедрение беспилотных технологий в этой сфере продиктовано жесткой экономической необходимостью.

Внедрение беспилотных технологий в этой сфере продиктовано жесткой экономической необходимостью:

Лекс Фридман вспоминает свой разговор со СТИВОМ ВИЧЕЛЛИ (Steve Viscelli), подтверждая, что реальность дальнобойщиков полна тяжелых условий — некоторые из них проводят в дороге по 300 дней в году. Роботизация призвана восполнить пустующие рабочие места в условиях острого дефицита кадров.

Для первоначального решения столь сложной задачи Waymo Via сознательно выбирает магистральные шоссе (freeways). В отличие от хаотичных городских улиц, американские фривеи обладают строгой структурой и высокой степенью единообразия, что позволяет эффективно масштабировать систему беспилотного «водителя».

🚛 Революция в автономных перевозках: модель хабов 1:20:07

Для Waymo критически важно максимально быстро выйти на рынок, так как именно реальная эксплуатация дает бесценные данные, которые невозможно получить в симуляции. Чтобы ускорить этот процесс, компания приняла стратегическое решение упростить операционную задачу, внедрив модель «трансферных хабов».

Вместо того чтобы пытаться сразу автоматизировать весь сложный путь от склада до склада через городские улицы, Waymo фокусируется на маршрутах «хаб — хаб». Эти специализированные терминалы располагаются вблизи въездов на шоссе. Такая архитектура позволяет:

Борис Софман отмечает, что хотя они активно изучают и развивают возможности работы на городских улицах (поскольку Waymo обладает колоссальным опытом в этом благодаря легковым беспилотникам), именно модель хабов обеспечивает наилучшую отдачу от инвестиций (ROI) на текущем этапе. Тем не менее, по мере развития технологий, компания планирует всё глубже проникать в логистическую цепочку, постепенно сокращая необходимость в ручном управлении. В контексте уровней автоматизации, которые ранее обсуждались в беседе, Софман подчеркивает, что L4 — это не обязательно «ездить везде и всегда», а полная автономность внутри четко заданного домена (маршрута, условий эксплуатации), что позволяет реализовать эффективные коммерческие перевозки уже сегодня.

🛠 Особенности сенсоров и физики тяжелых машин 1:33:30

Управление 36-тонным грузовиком кардинально отличается от вождения легкового автомобиля, что накладывает строгие требования на физику и сенсорный стек системы. Основные вызовы связаны с динамикой: тормозной путь тяжелой машины значительно длиннее, а маневры требуют учета не только тягача, но и прицепа.

Критически важными становятся вопросы безопасности:

Инженеры Waymo проводят экстремальные испытания на специальных полигонах, буквально пытаясь «перевернуть» грузовик с помощью тренировочных колес на прицепе, чтобы точно определить границы безопасности. Полученные данные превращаются в высокоточные программные ограничения, гарантирующие, что машина всегда будет действовать в рамках физически допустимого. При этом, несмотря на специфику «железа», большая часть технологий восприятия и планирования переносится из легкового сегмента, что дает компании значительное преимущество в масштабировании.

🧠 Зрение робота и «проблема оценки»: как доказать безопасность беспилотника 1:40:16

Сенсорный стек Waymo и преимущество раннего слияния данных 1:40:16

Для обеспечения полной автономности Борис Софман и команда Waymo полагаются на избыточность и взаимодополнение различных типов сенсоров. В основе системы лежит лидар, который Софман называет «невероятным датчиком» благодаря его способности обеспечивать идеальную точность локализации и плотность данных . В отличие от камер, лидар обладает свойством консистентности: его сигнал не зависит от времени суток, положения солнца или ослепляющих бликов, так как он физически измеряет время возвращения лазерного луча от препятствия .

Однако у каждого датчика есть свои пределы. Лидар ограничен в дальности, что критично для тяжелых грузовиков, которым требуется видеть путь на сотни метров вперед для безопасного торможения. Поэтому на больших дистанциях (до километра и далее) первичными становятся камеры высокого разрешения и радары . Радар особенно ценен тем, что он лучше других сенсоров «прошивает» плохие погодные условия и напрямую передает информацию о скорости окружающих объектов .

Ключевой технологический сдвиг в Waymo произошел в подходе к обработке этой информации — переходе от «позднего слияния» (late fusion) к «раннему» (early fusion):

По словам Софмана, раннее слияние позволяет системе компенсировать шумы. Например, во время дождя лидар может давать ложные отражения, а камера — искаженную картинку из-за капель на линзе. Единая ML-модель видит всю совокупность сигналов и гораздо эффективнее отфильтровывает помехи, выявляя реальные объекты там, где отдельный сенсор мог бы совершить ошибку .

Интересно, что модели поведения для грузовиков Waymo на 85% обучаются на данных, собранных легковыми автомобилями компании в городских условиях . Фундаментальные принципы — как люди переходят дорогу или как другие водители реагируют на препятствия — идентичны для всех типов дорог.

Роль симуляции в обучении автономных систем 1:51:00

Физический пробег по дорогам общего пользования — это лишь вершина айсберга. Борис Софман раскрывает впечатляющую пропорцию: на каждую милю, пройденную в реальности, Waymo проезжает около 1000 миль в симуляции . При реальном пробеге более чем в 20 миллионов миль, виртуальный опыт компании превышает 20 миллиардов миль.

Симуляция в Waymo выполняет три важнейшие функции:

  1. Проверка регрессии: гарантия того, что новое обновление ПО не сломало то, что раньше работало идеально .
  2. Воспроизведение инцидентов: если в реальном мире произошло неоптимальное взаимодействие с человеком, этот сценарий проигрывается в виртуальной среде тысячи раз с небольшими вариациями («фаззинг»), чтобы найти лучшее решение .
  3. Стресс-тестирование: создание «синтетических» агентов — виртуальных лихачей или непредсказуемых пешеходов, которые позволяют проверить систему в ситуациях, которые слишком опасно или дорого воссоздавать на полигоне .

Софман подчеркивает, что реальное вождение — это наименее эффективный способ тестирования, так как критические события происходят в нем крайне редко . Симуляция же позволяет «сжимать» время и фокусироваться исключительно на сложных сценариях.

Проблема оценки безопасности (The Evaluation Problem) 1:53:32

Самым сложным вызовом в индустрии беспилотников Софман считает не само вождение, а «проблему оценки» (evaluation problem) . Создать впечатляющее демо-видео, где машина едет сама, относительно просто. Гораздо труднее статистически доказать, что робот безопаснее человека в долгосрочной перспективе.

Сложность заключается в невероятно высокой планке, заданной людьми-водителями:

Чтобы доказать превосходство беспилотника, нужно набрать колоссальный объем данных, подтверждающих, что система справляется с «длинным хвостом» (long tail) редких событий — от выбегающих на дорогу животных до сложных зон дорожных работ с ручным регулированием движения .

Лекс Фридман предлагает своего рода «тест Тьюринга для вождения» — полосу препятствий, которую робот не знает заранее . Софман соглашается, отмечая, что Waymo уже использует подобные методы, искусственно создавая экстремальные ситуации: проезд на красный свет встречного транспорта, внезапно лопнувшие шины или загрязнение сенсоров птичьим пометом .

В конечном счете, разработка беспилотника — это переход от оптимизации «среднего случая» (в чем силен обычный машинный труд) к гарантии безопасности в «худшем случае» . Как отмечает Софман, это требует заимствования подходов из аэрокосмической отрасли, где цена одной ошибки слишком высока, чтобы полагаться только на удачные тесты .

🤖 Waymo против Tesla: противостояние стратегий автономности

Развитие беспилотного транспорта сегодня представляет собой одно из самых захватывающих технологических соревнований, где доминируют два принципиально разных подхода: Waymo и Tesla. Борис Софман отмечает, что фундаментальное различие между компаниями кроется в философии построения системы с самого первого дня.

Waymo сфокусирована исключительно на создании технологии уровня L4 (полная автономность без участия человека). Это определяет всё: от разработки специализированного сенсорного стека и вычислительной инфраструктуры до инвестиций в архитектуру безопасности. Такой «узкий» фокус позволяет компании оптимизировать систему на каждом этапе. Переход от L2 (помощь водителю) к L4 — это не просто итеративное улучшение, а качественный скачок, требующий радикально иного подхода к сложности. Как отмечает Софман, Waymo уже эксплуатирует полноценный беспилотный сервис в Чандлере (штат Аризона), и эти реальные данные становятся критически важными для масштабирования. При этом компания не боится радикальных изменений: текущее поколение системы Waymo фундаментально отличается от того, с чего начинались первые беспилотные поездки.

Tesla же выбирает стратегию массового сбора данных с миллионов серийных автомобилей, оснащённых камерами. Лекс Фридман подчеркивает, что этот подход опирается на веру в то, что «чистое зрение» и машинное обучение могут решить задачу быстрее, если у вас есть доступ к огромному массиву реальных дорожных ситуаций. Сила Tesla — в использовании реальных водителей, которые помогают обучать систему.

Тем не менее, перед отраслью стоят общие вызовы:


🏙 Беспилотники и архитектура городов будущего

Появление автономного транспорта не просто изменит то, как мы передвигаемся, — оно радикально переформатирует саму структуру наших городов. Борис Софман уверен, что в будущем, когда беспилотники станут естественной частью ландшафта, они принесут изменения, сопоставимые с влиянием интернета или мобильных телефонов.

Одним из самых значимых эффектов станет переосмысление городского пространства, которое сегодня катастрофически неэффективно. Статистика показывает, что до 30% трафика в часы пик в крупных городах вызвано простым поиском парковочного места. Избавление от необходимости хранить личные автомобили в центре города позволит освободить огромные площади под другие нужды, делая жизнь в мегаполисах более комфортной и менее хаотичной.

Кроме того, технология автономного вождения позволит:

Борис Софман — оптимист в отношении этих перемен. Несмотря на неизбежные временные сложности при внедрении новой технологии, он видит в беспилотном транспорте важнейший инструмент для поддержки растущего населения и стареющего общества в ближайшие 50 лет. В конечном итоге, повышение безопасности (около 95% ДТП сегодня вызваны человеческим фактором) и общая эффективность станут мощными драйверами общественного запроса на перемены.

🤖 Парадоксы автоматизации: почему роботы меняют рынок труда и гуманоиды проигрывают на заводах 2:30:37

Миф о сокращении рабочих мест: чему Amazon научился у роботов Kiva 2:30:37

Внедрение технологий автоматизации неизбежно вызывает общественную дискуссию о потере рабочих мест и экономическом давлении на людей. Лекс Фридман отмечает, что для многих работа — это источник идентичности, личной гордости и ремесленного мастерства. Борис Софман соглашается с важностью оценки этих долгосрочных эффектов, подчеркивая необходимость создания грамотной государственной политики переобучения. Однако реальный опыт показывает, что роботизация редко превращается в игру с нулевой суммой. Например, развитие беспилотного транспорта формирует новые типы профессий, такие как операторы центров удаленной поддержки для мониторинга машин и помощи клиентам.

Еще более наглядным примером служит кейс складских роботов Kiva, приобретенных компанией Amazon. До их появления сотрудники складов тратили часы на то, чтобы обойти территорию и вручную собрать все элементы заказа. Роботы Kiva, запущенные как стартап еще в 2006 году, полностью изменили этот паттерн: теперь маленькие оранжевые платформы сами подъезжают под нужные стеллажи, приподнимают их и привозят к сотруднику, а специальная лазерная указка подсвечивает товар, который нужно взять.

Когда Борис Софман изучал этот опыт изнутри, топ-менеджмент складов поделился поразительной статистикой: после внедрения роботов пропускная способность склада выросла более чем в два раза. Это привело к тому, что фокус работы сместился на финальные стадии комплектации и отправки посылок. В итоге общее количество рабочих мест на складе практически не изменилось, но кардинально выросла эффективность всей системы. Автоматизация открывает новые экономические возможности, но требует от бизнеса осознанности и инвестиций в создание адаптационных «мостов» для сотрудников.

В поисках «киллер-фичи»: экономические ловушки потребительской робототехники 2:34:55

Развивая тему коммерциализации, Лекс Фридман приводит в пример домашнего робота Astro от Amazon. Ранее в разговоре собеседники подробно касались создания робота Cozmo и истории закрытия компании Anki, обсуждая проблемы доверия и провалы социальных роботов. Анализируя Astro, Борис Софман выражает сомнение в его рыночном успехе: при цене около $1500 устройство все еще ищет свою «киллер-фичу». Подвижность робота — интересное инженерное решение, но для обычных потребителей планка полезности должна быть беспрецедентно высокой.

Почему же большинству робототехнических стартапов так тяжело выжить, в то время как iRobot преуспел благодаря стабильной прибыли от пылесосов? По мнению Софмана, главная опасность кроется в нескольких системных ошибках:

В этой индустрии по-прежнему нет стандартизации, поэтому для выживания критически важен идеальный product-market fit. В свое время команда Anki сфокусировалась на сфере развлечений именно потому, что там общая планка качества физических игрушек была низкой, что позволило предложить прорывной продукт по защищенной цене. Успех в робототехнике требует «идеального шторма» — совпадения зрелости технологий, доступной цены и гениального UX-дизайна, подобно тому, как iPhone выстрелил после двадцати лет чужих неудачных попыток.

Иллюзия человеческой формы: почему гуманоидные роботы проигрывают в эффективности 2:43:49

Логическим продолжением спора о поиске правильного форм-фактора становится обсуждение humanoid-роботов и проекта Tesla Bot. Пока такие компании, как Waymo, инвестируют в революционные, но узкоспециализированные транспортные экосистемы, Илон Маск делает ставку на универсального антропоморфного робота. Борис Софман категоричен: сегодня гуманоидная форма — это область чистых исследований, а не коммерции. В реальном мире существует ничтожно мало задач, где человеческая форма действительно необходима. С точки зрения физики колеса кратно эффективнее ног, а обилие суставов и степеней свободы лишь усложняет конструкцию и увеличивает стоимость.

Лекс Фридман оппонирует, заявляя, что фабрики изначально спроектированы под параметры человека. Однако Софман уверен, что для заводов такой подход ошибочен: там нужно оптимизировать конкретные показатели вроде силы или мобильности, из-за чего человеческая форма оказывается избыточной в одних плоскостях и ограниченной в других. Попытка скопировать человека лишает разработчиков гибкости, ведь они автоматически переносят на машину все человеческие слабости.

И хотя Борис восхищается «магией» движения двуногих роботов от Boston Dynamics, он призывает разделять технический восторг и бизнес-логику. Впрочем, общее развитие алгоритмов восприятия со временем приведет к полной пересборке логистики — вплоть до создания автономных грузовиков будущего, оптимизированных исключительно под автономию, а не под комфорт водителя-человека.

🧠 Организационный хаос беспилотников и компас для предпринимателя 2:56:21

Организационные вызовы масштабирования беспилотных проектов 2:56:21

За последние два десятилетия робототехника и сфера искусственного интеллекта совершили огромный скачок, превратившись из нишевого увлечения энтузиастов в одну из самых востребованных и перспективных индустрий мира. Однако за внешним лоском технологических достижений скрывается колоссальный менеджерский вызов. Как отмечает Борис Софман, когда речь заходит о беспилотных автомобилях, технические трудности — это лишь вершина айсберга; организационные вызовы здесь буквально зашкаливают. Сегодня профильные компании насчитывают тысячи инженеров, но готовых и проверенных методик управления такими сложными структурами в этой отрасли практически не существует.

Борис Софман проводит показательное сравнение со зрелыми, устоявшимися технологическими сферами, такими как разработка операционных систем. В проектировании ОС базовые элементы давно канонизированы: инженеры четко понимают, как функционируют файловая система, виртуальная память, кэширование и как выстраивать модульную архитектуру через фиксированные API. Это позволяет эффективно и предсказуемо масштабировать разработку силами огромных команд. В сфере автономного вождения такой стабильности нет и в помине — технологические стеки и организационные структуры здесь постоянно переизобретаются с нуля под давлением новых открытий.

Главный барьер на пути к эффективному масштабированию заключается в том, что ключевые проблемы беспилотников невозможно изолировать внутри одного департамента. Ярким примером служит задача взаимодействия с пешеходами. Это не локальный баг, который можно поручить отдельной группе программистов. Данная проблема одновременно лежит на стыке сразу нескольких фундаментальных областей:

В результате возникает сложнейшая многомерная матрица взаимосвязей, которая начинает всерьез перенапрягать ментальные способности руководителей. Управлять тысячами людей, запертых в этой постоянно меняющейся системе ограничений, и при этом ежедневно обеспечивать измеримый прогресс — уникальная управленческая задача, успешных примеров решения которой в истории технологий пока крайне мало.

Советы фаундерам: как выжить в предпринимательском горниле 2:58:32

Размышляя о своем опыте руководства технологическими компаниями, Борис Софман называет стартап самым захватывающим и полезным опытом в жизни, который практически невозможно получить в рамках классического корпоративного найма. Тем не менее, предпринимательский путь — это череда брутальных эмоциональных качелей и жесточайших кризисов. Первое железное правило Бориса для любого начинающего фаундера — никогда не запускать проект в одиночку. Наличие надежных сооснователей критически важно: только разделяя бремя с теми, кто находится в самом эпицентре шторма, можно пережить самые темные дни стартапа.

Основной шок для вчерашних студентов и ученых заключается в крушении привычной картины мира. В академической среде или школе действует понятное правило пропорциональности: если ты приложил много усилий и написал хорошую работу, ты гарантированно получишь высокий результат или ученую степень. В мире стартапов эта логика полностью ломается. Предприниматель может провести 50 изнурительных питчей перед инвесторами, выложиться на максимум, но так и не встретить понимания своего видения.

В процессе построения технологического бизнеса фаундер неизбежно сталкивается со специфическим «горнилом» испытаний:

Тем не менее, этот режим постоянной борьбы за выживание Борис Софман называет парадоксально удовлетворяющим. Именно в моменты кризисов «жизни и смерти» формируется уникальная магия коллектива, когда все сотрудники превращаются в единое целое, самоотверженно сражающееся ради общей цели.

Барьер «новой категории»: от технологий к ценности для пользователя 3:01:09

В классической формуле стартап-успеха — команда, исполнение и рынок — Борис Софман безоговорочно ставит рынок на первое место. Молодые инженеры часто совершают ошибку, полагая, будто выдающийся интеллект и упорный труд способны преодолеть любое препятствие. Однако динамика рынка, специфика выбранной индустрии и правильный тайминг входа оказывают определяющее влияние на исход дела, порой полностью нивелируя качество исполнения.

В качестве примера идеального рынка Борис Софман приводит Waymo. С финансовой точки зрения эта компания представляет собой абсолютную аномалию: масштабы инвестиций и затрат на ранних этапах, задолго до генерации существенной выручки, не имеют аналогов в истории бизнеса и сопоставимы разве что с космической программой США. Но этот риск оправдан, поскольку Waymo нацелена на мультитриллионный рынок автономного транспорта. Даже с учетом любых дисконтов потенциальный масштаб победы делает текущие миллиардные затраты тривиальными. Напротив, выбрав неверную или излишне зарегулированную нишу — например, здравоохранение, где циклы внедрения инноваций из-за институциональных барьеров занимают по 10 лет, — фаундеры рискуют разбиться о непреодолимые стены.

Другая серьезная ловушка для робототехнических стартапов — это проблема создания новой потребительской категории, с которой Борис столкнулся лично. Одно дело — автоматизировать грузовые перевозки, где функционал автофуры понятен любому клиенту без лишних слов, и совсем другое — объяснить обывателю, зачем ему нужен домашний робот. Такие компании, как Nest или iRobot (создатели Roomba), добились колоссального успеха, потому что они привязывали свои инновации к уже существующим и понятным категориям товаров — «умным» термостатам и автоматическим пылесосам. Roomba смогла занять впечатляющие 15% мирового рынка пылесосов именно благодаря очевидности своего ценностного предложения: люди ненавидят убираться вручную, а робот делает это сам.

В то же время, выводя на рынок робота Cozmo, команда столкнулась с тем, что люди банально не понимали сути продукта, воспринимая его как обычную, пусть и дорогую игрушку. В 2013 году компании пришлось пережить сложнейший и болезненный пивот в маркетинговой стратегии. Инженеры перестали делать упор на объяснение того, насколько продвинутые технологии и сложный код скрываются внутри устройства. Вместо этого они сосредоточились на эмоциях, характере и личности робота, создавая вирусные ролики, набиравшие миллионы просмотров. Маркетинг должен отвечать на простой потребительский вопрос: «Почему это весело и зачем это нужно обычной семье?», а не хвастаться сложностью архитектуры. (Ранее в беседе Лекс Фридман и Борис Софман детально разбирали дизайн Cozmo, вдохновленный персонажами Pixar, и то, как личность робота формирует доверие).

Формула карьеры: синергия растущих рынков и жизненного баланса 3:09:14

Отвечая на вопрос Лекса Фридмана о советах для студентов и молодых людей, Борис Софман формулирует концепцию карьерного компаса. Он подчеркивает, что невозможно достичь максимума своего потенциала в сфере, к которой ты не испытываешь искренней страсти. Идеальный сценарий — найти точку пересечения между тем, что вы по-настоящему любите, и растущими потребностями мирового рынка.

Для молодых людей, интересующихся технологиями, Борис выделяет машинное обучение как наиболее перспективный и универсальный фундамент. Освоение ML не привязывает человека к одной узкой профессии. Напротив, этот гибкий инструментарий позволяет за жизнь сменить до восьми различных карьер в абсолютно полярных индустриях, оставаясь экспертом высшего уровня. Работа в быстрорастущих секторах критически важна: сам рост индустрии непрерывно генерирует новые возможности, расширяет поле задач и не позволяет профессиональным навыкам устареть, давая специалисту кратно больше «попыток забить гол».

В финале беседы Борис Софман делится глубоко личным уроком, предостерегая новое поколение от чрезмерного, обсессивного трудоголизма. Признавая, что в определенные периоды жизни он сам работал на грани безумия, Борис подчеркивает важность своевременной калибровки приоритетов. Одержимость работой легко уводит в экстремальные состояния, которые со временем становится невозможно развернуть вспять. Сегодня он гораздо сильнее ценит семью, общение с детьми и старых друзей. Жизненный успех и счастье кроются не только в создании прорывных автономных систем, но и в сохранении подлинных человеческих связей, любви и дружбы.

💬 Цитаты

«The closer you try to get to human form, the more you expect the strengths to match, and that's not the way AI works. By moving away from human form, you can change the rules and embrace your strengths and bypass your weaknesses.»

«Когда у вас нет характера и вы совершаете ошибку как робот, люди говорят: 'глупый робот ошибся'. Когда у вас есть персонаж и вы ошибаетесь, возникает эмпатия.»

Борис Софман 25:56

«Просто законы физики бизнеса не сошлись.»

Борис Софман 44:17

«Самая сложная проблема в автономном вождении — это на самом деле проблема оценки, а не само вождение.»

«Если вы хотите автомобиль, который никогда не попадает в аварии, пусть это будет автомобиль, который вообще никуда не ездит.»

Борис Софман 22:17

«Сегодня робот в гуманоидной форме — это исследование. Существует очень мало ситуаций, когда вам действительно нужна гуманоидная форма для решения проблемы.»

👥 Спикер
📖 Термины
Cozmo
Социальный робот компании Anki, созданный с использованием анимационных практик студии Pixar.
Waymo Driver
Универсальная беспилотная платформа для управления различными типами транспортных средств в экосистеме Waymo.
Early fusion (раннее слияние)
Метод объединения сырых данных лидаров и камер, позволяющий нейросетям эффективнее фильтровать погодные шумы.
L4-автономность
Высокий уровень автоматизации управления, при котором система полностью контролирует движение и не требует вмешательства человека.
Технологии и IT Waymo Anki Борис Софман беспилотные грузовики робототехника