Парадокс Моравека и иллюзия ИИ: манифест легенды робототехники

Lex Fridman 161 тыс. 2 ч 24 мин 29 мин 03.09.2021
Главное

Эволюция потратила 600 миллионов лет на развитие перцепции и моторики, но современные инженеры пытаются обхитрить природу чистыми вычислениями. Легендарный робототехник Родни Брукс уверен: слепое обучение нейросетей зашло в тупик, а беспилотные автомобили никогда не поедут без глобальной перестройки городов. Создатель Roomba развенчивает мифы Кремниевой долины и объясняет, почему настоящему разуму необходим физический контекст, а не терабайты изолированных данных.

🤖 Механическая эстетика, ледяные кубы и метафора вычислений 1:34

Механическая эстетика и обещания интерфейса: робот Domo 1:34

Разговор Лекса Фридмана с легендарным робототехником Родни Бруксом начинается с вопроса о красоте. На просьбу назвать самый удивительный и эстетичный автомат, с которым ему приходилось работать, ученый указывает на робота Domo. Этот гуманоидный робот, созданный его аспирантом Аароном Эдсингером (Aaron Edsinger) и инженером-механиком Джеффом Вебером (Jeff Weber), сегодня занимает место в офисе Даниэлы Рус, директора лаборатории CSAIL в MIT.

Domo представляет собой верхнюю половину человеческого торса: две руки с трехпалыми кистями и подвижные глазные яблоки, оснащенные камерами. Родни Брукс описывает его как истинное произведение искусства: кабели скрыты внутри корпуса, а различные механические узлы анодированы в разные цвета. Однако за внешней изысканностью скрывается важный инженерный принцип. Брукс убежден, что внешний вид робота не должен давать пользователю избыточных обещаний.

«Если ваш робот выглядит как Альберт Эйнштейн, он должен быть таким же умным, как Альберт Эйнштейн», — иронизирует исследователь.

Именно поэтому у Domo нет сложной мимики — его лицо ограничено лишь подвижными глазами, которые служат исключительно для демонстрации механизма визуального внимания. Люди и животные считывают направление взгляда как знак намерения. Позже этот концепт Родни Брукс частично адаптировал для промышленных машин Baxter и Sawyer, где на специальном экране отображались графические глаза, показывающие рабочим на фабрике, куда робот повернет свою руку в следующий момент.

От лотка для льда к искусственному разуму: детство ученого 4:40

Путь Родни Брукса в науку начался в Южной Австралии, где он родился в конце 1954 года. Ключевым стимулом для него стали две детские научно-популярные книги 1961 года из серии How and Why Wonder Books: одна была посвящена электричеству, а вторая — «гигантским мозгам» и роботам. Картинки в этих изданиях, изображавшие футуристических андроидов, занимающихся сваркой под водой, поразили воображение восьмилетнего мальчика.

Осознав свои скромные возможности в создании сложной механики, юный Брукс сосредоточился на конструировании «мозгов» для своих устройств. Ограниченный рамками семейного бюджета, он проявил поразительную изобретательность. Его первой обучающейся системой стал обычный пластиковый лоток для льда.

Устройство работало по химическому принципу:

Эта примитивная электрохимическая сеть со временем «обучалась» и в итоге могла выполнять простейшее сложение чисел. Позже, скопив деньги на первые транзисторы, Брукс перешел к сборке полноценных логических вентилей и триггеров.

Пределы вычислений: Тьюринг, Минский и природа человеческого мышления 7:19

Обсуждая знаменитый вопрос Алана Тьюринга «Могут ли машины мыслить?» из его работы 1950 года, Родни Брукс занимает жесткую материалистическую позицию. Он убежден, что люди сами по себе являются биологическими машинами, а значит, машины определенно способны мыслить. Однако вопрос о том, понимаем ли мы сегодня, как построить подобный разум, остается открытым.

Корни этой проблемы уходят в саму историю понятия «вычисление». Брукс напоминает, что фундаментальная статья Тьюринга 1936 года вовсе не ставила целью изобретение компьютера. Математик пытался опровергнуть одну из задач Давида Гильберта — проблему разрешимости (Entscheidungsproblem). Для этого Тьюрингу потребовалось строго формализовать сугубо механический процесс, который выполняли люди-вычислители (в те годы слово computer означало профессию клерка, переносящего числа на бумагу при расчете математических таблиц).

Тьюринг смоделировал этот процесс через бесконечную бумажную ленту и набор простых инструкций для чтения, записи и стирания символов. При этом он отталкивался от интуитивного предположения, что человеческая память строго ограничена. В последующие десятилетия математики, такие как Марвин Минский в своей книге «Конечные и бесконечные машины» и Дональд Кнут в первом томе «Искусства программирования», пытались нащупать истинные границы вычислений. Кнут, к примеру, отмечал, что шаг алгоритма не должен требовать от человека мгновенного знания того, верна ли Великая теорема Ферма, поскольку на тот момент это было неизвестно. К 1975 году консенсус окончательно оформился: вычисления — это то, что легко реализуется в кремнии, что и подстегнуло закон Мура.

Четырехквадрантная матрица и книга «Not Even Wrong» 14:39

Сейчас Родни Брукс работает над масштабной книгой под рабочим названием «Not Even Wrong» («Даже не неправильно») объемом около 480 страниц. В основе ее концепции лежит четырехквадрантная матрица наук, разделенная по двум осям: «Наука — Инженерия» и «Интеллект — Жизнь».

Она объединяет четыре ключевые дисциплины:

  1. Искусственный интеллект (Инженерия / Интеллект)
  2. Искусственная жизнь (Инженерия / Жизнь)
  3. Нейробиология (Наука / Интеллект)
  4. Абиогенез (Наука / Жизнь)

Все эти направления сформировались в их современном виде в период с 1945 по 1965 год. Брукс указывает на огромный перекрестный вклад ученых того времени. Например, в Исследовательской лаборатории электроники MIT Уоррен Мак-Каллок и Вальтер Питтс еще в 1943 году заложили основы искусственных нейросетей, вдохновившись логикой Бертрана Рассела. Позже их идеи заимствовал Минский для своей диссертации 1953 года, а Джон фон Нейман использовал термин «нейроны» при проектировании архитектуры компьютера EDVAC в 1945 году.

Главный тезис Брукса заключается в том, что три из этих четырех дисциплин сделали вычисления своей главной метафорой. Сначала возникла идея «компьютеры — это люди» (поскольку они копировали действия живых вычислителей), а затем маятник качнулся в сторону «люди — это компьютеры» (в вычислительной нейробиологии).

Однако Брукс сомневается, что цифровые вычисления — идеальная метафора для объяснения Вселенной или живого мозга. Он приводит поэтичный пример с барабаном: если ударить по мембране, на ней возникают стабильные точки затухания волн. Компьютер может рассчитывать их координаты часами, но сам барабан «знает» их мгновенно, без всяких калькуляций. Символично, что самая первая компьютерная программа, написанная Адой Лавлейс для аналитической машины Бэббиджа, была предназначена как раз для вычисления чисел Бернулли, необходимых для поиска таких стабильных точек на плоскости.

В завершение главы Брукс размышляет о том, что человеческое сознание и разум могут быть результатом не просто работы «куска мяса в черепной коробке», а сложного социального взаимодействия и способности выносить инструменты мышления во внешний мир. Настоящий разум рождается в коммуникации, чего полностью лишены современные изолированные нейросети.

🤖 Контекст, парадоксы и «слова-чемоданы»: почему роботы до сих пор не видят мир как мы 25:08

Контекст против пикселей: тупик машинного восприятия 25:08

Рассуждая о перспективах искусственной жизни в контексте четырехквадрантной матрицы наук, которую собеседники затрагивали ранее в разговоре, Родни Брукс (Rodney Brooks) указывает на фундаментальное различие между биологическим и машинным интеллектом. Любая известная нам форма жизни — будь то собака или осьминог с его уникальной распределенной архитектурой — воспринимает мир и действует в нем совершенно иначе, чем современные ИИ-системы. Человеческое зрение феноменально, поскольку оно опирается на глубокий контекст, а не просто на фиксацию фотонов сетчаткой.

В качестве примера Родни Брукс (Rodney Brooks) приводит константность восприятия цвета: синий цвет стоящей в студии звуковой коробки конструируется нашим мозгом на основе понимания всей окружающей обстановки и освещения. Из-за отсутствия такого глобального контекста современные нейросети легко обмануть. Достаточно нанести пару незначительных меток на дорожный знак «Стоп», и система глубокого обучения совершит грубую ошибку, хотя для человека знак останется абсолютно очевидным. Стремясь быстрее опубликовать академические статьи, исследователи просто заваливают алгоритмы размеченными данными в надежде, что машина сама во всем разберется. Однако разметка картинок и решение проблемы «заземления символов» (symbol grounding problem) — это принципиально разные вещи. Живые существа обладают сложным перцептивным пониманием: например, собака по одному запаху у столба способна определить, сколько собак были здесь за последние 10 часов, какого они пола и как давно ушли. Машина же видит лишь изолированный моментальный снимок, упуская то, что философ Брайан Кантвелл Смит называет «регистрацией» — устойчивой связью между воспринимающим субъектом и объектом.

Парадокс Моравека: почему шахматы — это легко, а удержать равновесие — трудно 28:24

Лекс Фридман (Lex Fridman) отмечает, что эта перцептивная глубина напрямую подводит к знаменитому парадоксу Моравека, согласно которому абстрактные рассуждения даются машинам легко, а восприятие и мобильность — невероятно тяжело. Родни Брукс (Rodney Brooks) лично застал формулирование этого принципа: в свое время он делил один рабочий кабинет с Хансом Моравеком, когда тот создавал своего первого мобильного робота, а сам Брукс занимался компьютерным зрением.

Корни нашей неверной интуиции относительно сложности задач уходят в 1950–1960-е годы, когда первыми разработчиками ИИ в лаборатории MIT были исключительно умные студенты. Они считали истинным интеллектом то, в чем были хороши сами: игру в шахматы или взятие сложных интегралов. То, что мог делать любой младенец — например, видеть предметы и передвигаться, — казалось им тривиальным и не требующим ума. Когда в 1990-х годах компьютер Deep Blue обыграл Гарри Каспарова, пресса трубила о грядущем тотальном превосходстве машин; аналогичные восторги сопровождали и успех AlphaZero. Однако Брукс подчеркивает, что с точки зрения эволюции все абсолютно логично:

Высшие когнитивные функции развились на базе мощнейшего эволюционного фундамента восприятия, который инженеры сейчас пытаются воссоздать с нуля. В робототехнике нет простых задач, и редукционизм здесь не работает: ни точные 3D-координаты, ни миллионы меток на изображениях не заменят роботам подлинного понимания физического мира.

Секретные лаборатории и полуторагодовалые гении: загадка манипуляции 33:50

Особенно остро проблема восприятия встает в вопросах манипуляции объектами. Родни Брукс (Rodney Brooks) делится личным наблюдением за своим 16-месячным внуком. Оказавшись в новом доме, ребенок впервые подошел к низкому окну с незнакомой ручкой. Мальчик мгновенно сообразил скоординировать действия двух рук: одной он толкал раму, а другой одновременно поворачивал ручку, чтобы открыть окно. Для робототехники такая синергия в абсолютно незнакомой среде — это запредельный уровень сложности, ведь ребенок никогда раньше не видел подобных окон.

Современные методы обучения с подкреплением (RL) пытаются решить задачи манипуляции методом грубого случайного поиска. Брукс вспоминает свой визит в штаб-квартиру DeepMind в Лондоне несколько лет назад. В закрытой зоне роботы Sawyer — созданные компанией Брукса Rethink Robotics и выбранные за их податливость и способность чувствовать силу — часами хаотично бились об стены, пытаясв методом проб и ошибок нащупать правильное действие. Родни иронизирует, что ему даже запретили посмотреть на его собственных роботов из-за строжайшей секретности Google. Такой подход в корне противоречит поведению человека. Тот же внук Брукса в возрасте 18 месяцев, играя с коробкой, оснащенной множеством разных замков, не трогал поверхности хаотично. Он сразу визуально выделял механизм и исследовал именно его, применяя врожденный «префильтр», который радикально сужает пространство поиска и отсекает миллиарды лишних вычислений.

Опасность «слов-чемоданов» и уроки истории машинного обучения 39:49

Несмотря на свой скепсис по поводу создания полноценного ИИ, Родни Брукс (Rodney Brooks) признает, что успехи глубокого обучения на базе ImageNet в распознавании образов были по-настоящему шокирующими для компьютерного зрения. Однако когда Лекс Фридман (Lex Fridman) пытается разглядеть в триумфе AlphaZero шаг к универсальному разуму, указывая на способность системы обучаться без человеческого участия, Брукс призывает к осторожности. Он предостерегает от магии «слов-чемоданов» (suitcase words) — терминов вроде «обучение», которые журналисты и пиар-службы используют слишком расширенно.

Существует множество типов обучения: можно учиться езде на велосипеде, латыни или игре в шахматы, и все это принципиально разные ментальные процессы. Нынешние алгоритмы лишь улучшают показатели по узкой метрике и полностью ломаются при малейшем изменении условий. Когда Брукс спросил у создателей AlphaGo, что произойдет, если увеличить размер доски с 19x19 до 21x21, те открыто признали, что система полностью откажет.

История искусственного интеллекта циклична. Еще в 1961 году Дональд Мичи описал механизмы самообучения через игру с самим собой, а в начале 1960-х Артур Самуэль создал программу для игры в шашки, победившую чемпиона мира. Причем Самуэль использовал колоссальное по тем временам преимущество: будучи инженером в IBM, он запускал алгоритм на целой «ферме» серийных компьютеров по ночам. Игры вроде го или шахмат — это системы со 100% открытой информацией и очень коротким математическим описанием текущего состояния. Физический мир и человеческий разум устроены несоизмеримо сложнее, и простым масштабированием вычислительной мощности эту перцептивную пропасть не преодолеть.

🚗 Беспилотный транспорт: иллюзия близости и суровая реальность 54:28

Беспилотные автомобили и Tesla Autopilot 54:28

Обсуждая роботов, работающих в реальном мире, Лекс Фридман (Lex Fridman) и Родни Брукс (Rodney Brooks) подробно остановились на технологиях автономного вождения. Лекс Фридман восхищается инженерным прорывом компании Tesla, которая смогла переписать систему автопилота с нуля, отказавшись от решений Mobileye, и совершила ставку на чистое компьютерное зрение (pure vision) без использования радаров. По мнению ведущего, успехи команды под руководством Андрея Карпати и их «движок данных» (data engine) для поиска пограничных случаев (edge cases) заставляют переосмыслить границы возможного в ИИ.

Родни Брукс, будучи опытным практиком, признает масштаб проделанной инженерами работы, но относится к обещаниям скорой победы скептически. Он делится собственным опытом использования современных ассистентов: его личный Mercedes E450 2021 года выпуска оснащен превосходной системой машинного зрения и сонарами. Брукс в восторге от синтезированного панорамного вида сверху на 360 градусов, помогающего при парковке, и отмечает, что это первый автомобиль, который он водит с января без единой царапины. Тем не менее ученый напоминает, что технологическая эйфория — это лишь «повтор одного и того же фильма», который длится десятилетиями.

Чтобы вернуть беседу к историческому контексту, Родни Брукс приводит два малоизвестных факта:

Главная проблема, по мнению Брукса, заключается в том, что люди видят эффектную демонстрацию (демо) и необоснованно проецируют её на полную готовность технологии к любым условиям. Физические ограничения камер непреодолимы без качественного скачка в сенсорах: современные матрицы не обладают динамическим диапазоном человеческого глаза, который охватывает около 11 порядков. Из-за этого беспилотные машины мгновенно «слепнут», когда яркое солнце падает на белую поверхность, провоцируя опасные инциденты.

Кроме того, существует колоссальный разрыв в ожиданиях общества. Инженеры мыслят рационально и полагают, что если автопилот снизит ежегодную смертность на дорогах США (составляющую около 35 000 человек) хотя бы на 10%, это станет триумфом. Однако общественная психология устроена иначе: если беспилотные автомобили убьют даже 10 человек за год, это вызовет бурю негодования и жесткие юридические запреты.

Инфраструктура для беспилотного транспорта 1:05:36

Родни Брукс убежден, что полноценная интеграция робомобилей в повседневную жизнь не может быть сведена к простой формуле «убрать водителя из существующей машины и оставить всё как есть» — слишком длинен «длинный хвост» непредвиденных дорожных ситуаций. Исторический опыт показывает, что любая радикально новая транспортная технология требует тотальной перестройки среды. Когда в начале XX века появились автомобили, человечеству пришлось полностью перестроить структуру городов и переписать законы. Например, юридическая ответственность за переход улицы в неположенном месте (jaywalking) была целенаправленно внедрена под давлением автомобильных компаний, чтобы освободить проезжую часть от пешеходов и минимизировать смертность.

В качестве примера успешной, но жестко ограниченной автоматизации Брукс приводит рельсовый транспорт. В США сегодня действует всего 15 или 16 полностью беспилотных поездов, причем практически все они изолированы внутри аэропортов. Первая попытка запустить полноценное беспилотное городское метро в Гонолулу планировалась на 2017 год, но столкнулась с бесконечными задержками. В то же время в Японии беспилотные поезда, курсирующие на искусственный остров в Токийском заливе, работают безупречно. Но их безопасность держится не на «умных» алгоритмах, а на радикальных инженерных решениях:

Брукс признается, что еще пять лет назад ожидал прагматичного шага от властей Калифорнии — выделения крайней левой полосы на шоссе 101 исключительно для беспилотного транспорта. Это позволило бы владельцам Tesla и других машин безопасно активировать автономный режим в предсказуемой среде. Однако этого не произошло. Брукс предполагает, что виной тому агрессивный маркетинг Tesla, заявляющей о создании «полного автопилота» (Full Self-Driving) вместо того, чтобы кооперироваться с государством ради изменения дорожной инфраструктуры. Подобная инфраструктурная проблема стоит и перед беспилотными магистральными грузовиками: их движение по хайвеям в ночное время выглядит абсолютно логичным, но для съезда на обычные городские дороги им потребуются специализированные пересадочные хабы или участие водителя-человека.

Лекс Фридман выражает скептицизм по поводу государственного участия, напоминая, что власти всегда критически отстают в модернизации дорожной сети. Тем не менее Брукс указывает на примеры скрытой эволюции инфраструктуры под нужды технологий. На шоссе 280 в Кремниевой долине, имеющем бетонное покрытие, белые линии разметки недавно начали обводить черными контурами. Без этой незначительной модификации система удержания полосы в современных автомобилях Брукса просто теряет ориентацию. Внедрение роботов в реальный мир пойдет быстрыми темпами только тогда, когда сама окружающая среда начнет системно адаптироваться под их технические ограничения.

Позже в диалоге, когда Лекс Фридман затронул тему беспилотных такси Waymo, Родни Брукс еще раз напомнил, что за внешней безупречностью таких систем всегда скрывается жесткая привязка к картам и непубличная работа удаленных операторов поддержки, готовых выслать спасательный автомобиль в случае банальной блокировки машины дорожным конусом.

🚀 Вера в инновации, прогнозы до 2050 года и суровая реальность беспилотников 1:15:28

Роль веры и амбиций в технологических прорывах 1:15:28

В разговоре о научно-техническом прогрессе Лекс Фридман (Lex Fridman) отмечает определенную жесткость Родни Брукса (Rodney Brooks) в критике современных технологий и раздутого вокруг них хайпа. Однако ведущий задает важный вопрос: возможно ли вообще достичь кажущегося «невозможным» прорыва, не веря в него слепо? Родни Брукс безоговорочно соглашается с этим тезисом. В качестве примера он приводит невероятный скачок человечества: от первого полета братьев Райт в 1903 году до высадки человека на Луну в 1969 году прошло всего 66 лет — отрезок, равный длине средней человеческой жизни. При этом даже один из братьев Райт всего за год до исторического полета не верил, что тяжелые аппараты когда-либо смогут подняться в воздух.

Проблема Брукса заключается не в самом оптимизме, а в необоснованных логических скачках, которые совершают люди, не понимающие сути работы систем. Вспоминаются времена создания компании iRobot, когда инженерам тоже приходилось искренне верить в безумную на тот момент идею коммерческой домашней робототехники. Брукс направляет свою критику на тех, кто ничего не делает сам, но заявляет о скором наступлении технологической сингулярности.

Отдельно собеседники касаются фигуры Илона Маска. Брукс высоко оценивает успехи SpaceX, но разделяет её проекты на реализуемые и фантастические. Вертикальная посадка ракет и использование решетчатых рулей — это инженерные задачи, которые уже прорабатывались с 1960-х годов и тестировались на ракетах вроде DC-X. Маск проявил себя как гениальный предприниматель, готовый к колоссальным личным финансовым рискам, и довел это до коммерческого воплощения. В то же время проект Hyperloop требует фундаментально новых, никем не продемонстрированных технологий, поэтому Брукс считает его утопичным. Главная претензия ученого к Маску — это неспособность проводить четкую грань между готовыми к внедрению технологиями и далекими фантазиями. Лекс Фридман, вспоминая свои наблюдения в MIT, добавляет, что излишний скепсис академического сообщества по отношению к Tesla Autopilot (подробно обсуждавшемуся ранее в разговоре) часто мешает разглядеть настоящую инженерную «магию» за пеленой чрезмерного маркетинга. Брукс же парирует это необходимостью защищать розничных инвесторов и обычных потребителей, принимающих громкие заявления за чистую монету. Тем не менее, жесткие и амбициозные дедлайны действительно заставляют инженеров прыгать выше головы и делать лучшую работу в их жизни.

Долгосрочные прогнозы Родни Брукса: эксперимент длиною в 32 года 1:26:52

Чтобы не быть голословным критиком, Родни Брукс с 1 января 2018 года запустил уникальный эксперимент в своем личном блоге. Он зафиксировал строгий набор долгосрочных технологических прогнозов в сфере искусственного интеллекта, беспилотного транспорта и освоения космоса, обязавшись проверять их состояние каждый год в течение 32 лет — вплоть до 1 января 2050 года. К этому моменту ученому исполнится 95 лет. Этот шаг стал ответом на безответственность футурологов, чьи несбывшиеся предсказания со временем просто забываются обществом.

Брукс открыто признает собственные ошибки и излишний оптимизм. Например, он прогнозировал появление выделенной полосы для беспилотных автомобилей на шоссе 101 к определенному году, чего так и не случилось. Другое его предсказание касалось запуска полноценного сервиса беспилотных такси на всех улицах города Кембриджпорт, штат Массачусетс, к 2035 году. Сейчас Брукс относится к этому скептически: узкие дороги Кембриджпорта, хаотичные грузовики доставки и люди, регулярно нарушающие правила одностороннего движения, делают эту задачу практически невыполнимой для полностью автономных систем.

Беспилотные такси Waymo и Cruise в суровой реальности Сан-Франциско 1:32:25

Обсуждая текущее состояние индустрии, Брукс предлагает оценить относительно простую сетку улиц Сан-Франциско к северу от Маркет-стрит. Дороги там широкие, но движение осложняют постоянно паркующиеся службы доставки. Живя в этом районе, Родни ежедневно наблюдает автомобили Cruise, Waymo и Zoox. На момент записи интервью во всех машинах все еще сидят подстраховывающие водители, причем Брукс заметил деталь: часто водитель не имеет права перехватить управление без согласования с удаленным офисом, из-за чего машины могут подолгу стоять на месте в ожидании команды диспетчера.

Брукс делится показательным случаем, произошедшим прямо под окнами его дома пятничным вечером. Беспилотник Cruise повернул направо и намертво заблокировал пешеходный переход, поскольку в двух футах от него стояла женщина и пыталась дистанционно открыть заблокированную дверь своей машины. Любой человек сразу понял бы, что она занята своими ключами и не прыгнет под колеса, но алгоритм испугался потенциальной опасности и замер. В результате мужчина с детской коляской был вынужден обходить застрявший беспилотник сзади, выходя прямо на оживленный перекресток. По мнению Брукса, в данном случае безопасность окружающих, которые не давали согласия на участие в таких экспериментах, была скомпрометирована.

Ученый убежден, что появление коммерческих такси «из точки А в точку Б» без водителей по всему Сан-Франциско не случится в ближайшие 10 лет, а для районов к югу от Маркет-стрит этот срок будет еще больше. Реальное и безопасное внедрение робомобилей начнется с ограниченных зон:

Еще одна фундаментальная проблема беспилонников — это взаимодействие человека и робота (HRI). Брукс рассказывает, что его коллеги ради шутки «пытают» автономные машины: пешеходы быстро понимают, что достаточно занести одну ногу над бордюром, чтобы заставить робомобиль застыть на месте. Подростки будут постоянно пользоваться этим. Роботы обязаны научиться «давать отпор» и взаимодействовать активнее. Например, инженеры Waymo научили свои машины слегка подаваться вперед на перекрестках с четырехсторонним стопом, чтобы показать человеческим водителям свое намерение ехать следующим, иначе их бы просто никто никогда не пропускал.

Практический опыт iRobot: от борьбы с бомбами до ликвидации на Фукусиме 1:37:45

Когда Лекс Фридман спрашивает Брукса о главном поводе для гордости за всю историю существования компании iRobot, ответ Родни оказывается неожиданным и далеким от потребительской электроники. В марте 2011 года компания направила свои технологические решения в Японию для ликвидации последствий аварии на атомной электростанции Фукусима-1.

Несмотря на то, что Япония всегда считалась мировым лидером в робототехнике, хваленые человекоподобные роботы от Honda оказались абсолютно бесполезны в условиях реальной катастрофы, так как никогда не тестировались в грязи и завалах. У iRobot же к тому моменту было развернуто около 6500 телеуправляемых интеллектуальных роботов в Ираке и Афганистане, которые на протяжении 9 лет занимались разминированием придорожных бомб. Этот жесткий многолетний опыт работы в экстремальных полевых условиях позволил американским роботам эффективно помочь в критической ситуации на АЭС.

В завершение темы Брукс с иронией вспоминает, как начинал карьеру в качестве чистого математика, а закончил «продавцом пылесосов», намекая на создание легендарного робота-пылесоса Roomba. Разбирая старые архивы электронных писем из 1990-х годов для судебного процесса, Брукс вновь ощутил тот чистый инженерный азарт, с которым их команда в условиях жесточайшего бюджета пыталась создать работающий продукт. Но детальная история создания Roomba и коммерческие барьеры на ее пути заслуживают отдельного глубокого рассмотрения.

🤖 От 512 байт памяти до краха за 150 миллионов: как Roomba завоевал мир, а Rethink Robotics проиграла рынку 1:40:50

Экономика за 50 центов: как создавался Roomba 1:40:50

В начале 2000-х годов рынок домашней уборки выглядел совершенно иначе. На нем уже существовал робот-пылесос Electrolux Trilobite, но его стоимость составляла огромные 2000 евро, что делало устройство недоступным для массового потребителя. Родни Брукс (Rodney Brooks) и его команда изначально целились в принципиально другую розничную цену — $200. Чтобы продукт оставался прибыльным на полке магазина, себестоимость его компонентов должна была быть экстремально низкой.

Родни Брукс вспоминает, как во время поездок на конференции ИТ-институтов в Тайбэй он специально оставался там на несколько дополнительных дней. Ученый отправлялся в город Синьчжу, чтобы вести переговоры с крошечными бесфабричными (fabless) компаниями, существовавшими вокруг гиганта TSMC. Эти мелкие фирмы создавали урезанные, лишенные половины кремния процессоры на базе архитектуры 6802 (которая когда-то использовалась в Apple I), сохраняя их жизнеспособность. В поисках экономии Брукс колесил по Гонконгу, посещая фабрики, производившие простейшие портативные игры и музыкальные открытки, поскольку общий бюджет на вычислительные мощности робота составлял всего около 50 центов. В итоге он нашел микросхему от компании Winbond: она обладала ничтожными 512 байтами оперативной памяти, укладывалась в жесткий бюджет и полностью закрывала технические потребности инженеров.

До этого момента молодая iRobot сменила 14 провальных бизнес-моделей. Прорыв случился в 2002 году. Рискнув, команда превысила одобренный советом директоров бюджет в три раза и выпустила к рождественскому сезону 70 тысяч пылесосов. Продукт вышел на рынок 18 сентября 2002 года и был полностью распродан к Рождеству. Удивительно, но даже спустя почти два десятилетия Roomba остается ключевым коммерческим продуктом iRobot. Сегодня запуск подобного бизнеса требует колоссальных капиталовложений — например, раунды финансирования Series B для современных роботехнических стартапов вроде Covariant достигают $80 миллионов.

Иллюзия точности: инженерные компромиссы и закрытие Rethink Robotics 1:47:55

Другим важнейшим, но куда менее коммерчески успешным детищем Родни Брукса стала компания Rethink Robotics, закрытие которой обошлось инвесторам в 150 миллионов долларов потерянного капитала. Несмотря на драматичный финал, создатель гордится главным достижением проекта: им удалось «выпустить промышленных роботов из клеток». Они создали безопасные для человека манипуляторы, которые рабочие на заводах могли перепрограммировать вручную, просто показывая траекторию движения, без написания кода.

Проект сгубила череда компромиссов, когда основатель позволил инженерам отговорить себя от первоначального видения. Брукс планировал поставлять сверхдешевых одноруких роботов за $3000, ориентированных на компании, которые никогда прежде не использовали автоматизацию (что переводило бы покупку из долгого инвестиционного бюджета, CAPEX, в быстрый операционный, OPEX). Первые прототипы собирались из легких пластиковых редукторов. Однако инженеры по управлению начали жаловаться на «пульсацию крутящего момента» (torque ripple) из-за несовершенства пластиковых шестерен, мешавшую плавному контролю усилий. Один из механиков предложил временно перейти на металлический цилиндрический редуктор, пообещав закончить работу за шесть недель. На решение этой технической проблемы ушло долгих два года.

В результате себестоимость резко выросла, а генеральный директор настоял, что роботу необходима вторая рука. Их первый готовый продукт, робот Baxter, вышел на рынок с ценником в $25 000. Единственными покупателями оказались владельцы традиционных фабрик, которые привыкли оценивать технику по жестким критериям: им требовалась ювелирная точность позиционирования в 0,1 мм. Брукс пытался доказать, что Baxter работает подобно человеку — ему не нужны слепые точные координаты, ведь он использует силомоментный контроль (force control), аккуратно нащупывая детали и пазы. Консервативный рынок переубедить не удалось. Пытаясь дать клиентам желаемую точность, компания потратила еще два года на разработку однорукого робота Sawyer за $35 000. Продукт оказался переоцененным для своей ниши.

Финальную точку в истории Rethink Robotics поставили не инженеры, а геополитика. У компании были готовые покупатели, но сделки раз за разом блокировал Комитет по иностранным инвестициям США (CFIUS). Любой финансовый консорциум содержал долю китайского капитала, и банкиры в последний момент отзывали предложения из-за оборонных ограничений США. Когда у стартапа закончились наличные, один из претендентов применил агрессивное юридическое давление, дождался закрытия фирмы и выкупил все активы Rethink за 1/30 от цены, предложенной неделей ранее. Единственным утешением для Брукса стало то, что всю уникальную команду инженеров буквально за неделю раскупили другие технологические гиганты.

Экраны вместо глаз и ловушка теста Тьюринга 1:55:59

Одной из самых узнаваемых черт робота Baxter стал дисплей, имитирующий человеческое лицо и глаза. Экран нес важную практическую функцию: во время бес кодового обучения он показывал оператору, как именно машина понимает текущую задачу. Реакция рынка оказалась неоднозначной: часть клиентов требовала заменить лицо сухими графиками эффективности, а другие, напротив, просили вернуть «человеческий» взгляд в новых модификациях. Лекс Фридман (Lex Fridman) отмечает, что многие ведущие робототехники намеренно избегают подобных интерфейсов, видя в роботе исключительно утилитарный станок. Брукс соглашается: будущая триллионная корпорация в сфере робототехники обязана в совершенстве реализовать именно эмоциональную связь человека и машины.

Ранее в разговоре собеседники вскользь касались парадокса Моравека и сложности восприятия мира роботами, что напрямую влияет на их интеграцию в человеческую среду. По мнению Брукса, до подлинного партнерства и романтической привязанности к ИИ в духе фильма «Она» человечеству еще очень далеко, а хронология фантастической ленты «Бегущий по лезвию» оказалась слишком оптимистичной. Лучшим фильмом о будущем ИИ ученый считает «Двухсотлетнего человека». В этой картине наглядно показана истинная технологическая конвергенция: пока робот пытается стать более человечным, сами люди постепенно модифицируют свои тела, превращаясь в киборгов. Брукс подчеркивает, что этот процесс уже идет полным ходом — от генетического редактирования детей до медицинских имплантов и слуховых аппаратов, которые носит он сам.

Размышляя о речевых системах (в рамках конкурса Alexa Prize, где хорошим результатом считается удержание беседы в течение 20 минут), Брукс объясняет, почему так трудно создать ИИ, с которым захочется поговорить по душам пару часов. Еще в 1960-х годах программа Eliza Джозефа Вейценбаума шокировала мир тем, насколько охотно люди доверяли текстовому интерфейсу. Однако современным голосовым помощникам критически не хватает непрерывности контекста: они не помнят, о чем с ними говорили вчера, у них нет разделяемых с человеком воспоминаний и полностью отсутствуют личные жизненные цели или намерения.

Именно поэтому Брукс скептически относится к классическому тесту Тьюринга. В оригинальной статье Алан Тьюринг использовал его как риторический прием, а не как объективный стандарт интеллекта. Сегодня тест выродился в банальную игру по обману судей каверзными вопросами. Брукс с улыбкой вспоминает «Олимпиаду ИИ», проходившую в Лаборатории искусственного интеллекта MIT в конце 1980-х годов. Во время игры в имитацию, где требовалось отличить по переписке мужчину от женщины, один из исследователей нашел универсальный вопрос-маркер: «Были ли у вас в детстве зеленые пластиковые солдатики и что вы с ними делали?». Женщина, пытавшаяся выдать себя за мужчину, пускалась в длинные описания выстраивания армий и тактических битв. Настоящий мужчина отвечал коротко: «Я наступал на них ногами». Живой язык и свободный диалог остаются сложнейшим танцем, который демонстрирует подлинный уровень развития интеллекта куда ярче, чем компьютерное зрение.

Ближе к концу этой части беседы Лекс Фридман переводит разговор на воспоминания о золотой эпохе Лаборатории ИИ в MIT (CSAIL), которой Родни Брукс руководил долгие годы, и о его дружбе с легендарными пионерами индустрии.

🌐 Наследие MIT и размышления о смысле жизни 2:05:38

Золотая эпоха лаборатории ИИ и критика «корпоративного заточения» 2:05:38

Оглядываясь на десятилетия работы в Массачусетском технологическом институте (MIT), Родни Брукс признаётся в глубоком личном разочаровании: он не задал легендарным коллегам тех вопросов, которые сегодня кажутся ему критически важными . Работая над своей новой книгой, учёный осознал, что многие мотивы и детали великих открытий 1950-х и 60-х годов навсегда ушли вместе с их авторами. Он вспоминает четверговые обеды факультета, где за одним столом сидели титаны, основавшие ИИ, робототехнику и Всемирную паутину, но в то время повседневная рутина скрывала от него масштаб момента .

Один из таких упущенных диалогов — разговор с Джозефом Ликлайдером, человеком, который ещё в начале 60-х заложил фундамент Project MAC в MIT и предвидел симбиоз человека и компьютера . Родни Брукс также сетует, что так и не спросил Марвина Минского напрямую, почему тот вместе с Сеймуром Пейпертом в своей книге 1968 года «Перцептроны» фактически уничтожил направление нейронных сетей на десятилетия . Это кажется Бруксу трагическим парадоксом, ведь докторская диссертация самого Минского была посвящена именно нейросетям . Одной из причин такой жесткой позиции могла быть специфическая черта характера Марвина — Родни Брукс вспоминает его слова о том, что ключом к продуктивности является «ненависть ко всему, что ты сделал в прошлом» .

Современное состояние академической среды вызывает у Брукса беспокойство. Он критикует практику технологических гигантов, таких как Google и Facebook, которые «коллекционируют» таланты, словно голливудских звёзд, и «запирают» их внутри корпораций .

Для Брукса 2020 год не стал переломным для отрасли. Он считает, что ни одна корпорация сейчас не ведет мир к мечте так, как это делали первопроходцы в университетах, поскольку корпоративная среда неизбежно подавляет радикальные идеи в угоду краткосрочным результатам .

Дональд Кнут и «дымящаяся» микросхема: случай из 70-х 2:14:50

Родни Брукс с теплотой вспоминает времена, когда доступ к высоким технологиям казался научной фантастикой. В 1977 году в Стэнфорде он уже пользовался электронной почтой и работал на терминалах, способных отображать живое видео, — технологиях, которые остальной мир увидит лишь спустя десятилетия . Однако самым ярким воспоминанием того периода стала забавная и нервная история, связанная с Дональдом Кнутом, легендарным автором «Искусства программирования» и создателем системы компьютерной верстки TeX.

События происходили в лаборатории ИИ в конце 70-х, где Кнут работал над TeX по ночам. Однажды ночью огромный мейнфрейм, занимавший пространство размером с несколько холодильников, вышел из строя из-за неисправного дисковода . Родни Брукс вместе с инженером Робертом Полом пытались починить систему: они сняли панели и начали проверять платы. В этот момент в помещение вошёл высокий Дональд Кнут и замер над ними в ожидании, когда же компьютер снова заработает .

Под пристальным взглядом гения инженеры занервничали. Они быстро вычислили неисправную микросхему серии 7400, вытащили её из разъёма и вставили новую. Однако, как только они включили питание, из платы пошёл дым . Из-за волнения они вставили микросхему задом наперёд. К счастью, ошибку удалось быстро исправить, и мейнфрейм ожил, позволив Кнуту продолжить работу. Для Брукса этот эпизод символизирует ту эпоху: смесь благоговения перед великими умами и «грязной» работы с железом, которая лежала в основе ранней компьютерной магии .

Ожидание финала: атеизм, старение и надежда на книгу 2:17:11

В завершение беседы Лекс Фридман затрагивает темы экзистенциального характера. Родни Брукс признаётся, что пандемия COVID-19 заставила его острее почувствовать собственную смертность . Он не боится самого факта смерти, но его пугает перспектива «угасания» (dribbling) — потери когнитивных способностей и деталей памяти . Чтобы бросить вызов времени, Брукс ежегодно публикует прогнозы, рассчитанные до середины 2050-х годов, когда ему должно исполниться 95 лет .

Как убежденный атеист, Брукс смотрит на Вселенную как на хаотичное и случайное место. Его научный интерес сосредоточен на том, как в этом беспорядке возникает порядок и сложность — именно этому посвящена книга, которую он стремится дописать . Говоря о смысле жизни, он выделяет несколько ключевых тезисов:

Главным своим наследием Брукс считает не созданных им роботов — ранее он упоминал о создании Roomba и Baxter — а возможность повлиять на мышление будущих поколений. Он мечтает, чтобы через сто лет кто-нибудь прочитал его книгу и изменил свой взгляд на мир, совершив следующий великий прорыв в науке . Несмотря на осознание того, что история в конечном итоге стирает имена почти 100% людей, Брукс находит жизнь «чертовски весёлой» . Роботы для него остаются одним из самых захватывающих способов взаимодействия с этой абсурдной, но прекрасной реальностью.

💬 Цитаты

«Если ваш робот выглядит как Альберт Эйнштейн, он должен быть таким же умным, как Альберт Эйнштейн»

Родни Брукс 03:32

«What did evolution spend its time on? It spent its time on getting us to perceive and move in the world — that was 600 million years.»

Родни Брукс (Rodney Brooks) 31:25

«Моё внутреннее чутье подсказывает, что внедрение ускорится тогда, когда начнется инженерная перестройка самой окружающей среды.»

Родни Брукс (Rodney Brooks) 1:10:37

«Чтобы достичь невозможного, вы должны верить, что это возможно.»

«Google, покупая робототехнические компании, просто запирает людей, лишая их возможности создавать что-то значимое для мира.»

👥 Спикер
📖 Термины
Парадокс Моравека
Принцип, согласно которому сложное абстрактное мышление требует мало вычислений, а простая моторика и восприятие — огромных ресурсов.
The grounding problem
Проблема укоренения значений: концепция того, как символы и слова обретают реальный физический смысл в реальном мире.
Compliance (податливость)
Способность конструкции или приводов робота гибко реагировать на внешние силы ради безопасного взаимодействия со средой.
Тест Тьюринга
Исторический эмпирический тест, изначально задуманный Аланом Тьюрингом как риторический прием, а не строгий маркер оценки интеллекта.
Искусственный интеллект Родни Брукс робототехника iRobot беспилотные автомобили ИИ