Джули Ша из MIT: «Роботы должны понимать, о чем думает человек»

The TWIML AI Podcast 845 46 мин 5 мин 22.11.2021
Главное

На стыке робототехники, аэрокосмической инженерии и когнитивистики рождается будущее, в котором машины не просто выполняют алгоритмы, а становятся полноценными партнерами людей. Профессор MIT Джули Ша (Julie Shah) исследует, как искусственный интеллект может предсказывать действия человека и адаптироваться к ним в критически важных сферах: от сборки самолетов Boeing до проведения кардиохирургических операций.

🤖 Робототехника как системная дисциплина 0:01

Джули Ша начала свой путь в науке с мечты о космосе, что привело её в Массачусетский технологический институт (MIT) на факультет аэронавтики и астронавтики . По её словам, именно работа в авиакосмической отрасли привила ей любовь к системам, где время и безопасность имеют критическое значение .

В процессе обучения Ша осознала, что аэрокосмическая инженерия, как и робототехника, — это прежде всего системная дисциплина. Её увлечение теорией управления и автопилотами переросло в глубокий интерес к «человеческому фактору». Как утверждает профессор, автопилоты должны проектироваться с учетом возможностей пилотов-людей, что требует понимания обеих сторон уравнения «человек-машина» .

Свою исследовательскую работу Джули строит на пересечении нескольких областей:

В 2010 году, защитив докторскую диссертацию, она основала Interactive Robotics Group. В лаборатории работают специалисты разного профиля — от программистов до психологов — для создания ИИ-моделей, которые «вписываются в возможности человека, как фрагменты пазла» .

🏭 От сборки Boeing к гибкому производству 4:13

Перед тем как стать профессором, Джули Ша провела год в компании Boeing в Сиэтле, изучая применение робототехники в авиастроении . Этот опыт изменил её взгляд на автоматизацию.

По словам Ша, вопреки ожиданиям, сборка гигантских лайнеров вроде 737 или 777 до сих пор напоминает «человеческий улей» — подавляющее большинство работ выполняется вручную . Основная проблема внедрения роботов заключается не в их механических способностях, а в сложности интеграции в ручной рабочий процесс.

Джули выделяет ключевой бизнес-фактор: в автомобилестроении экономия всего полусекунды рабочего времени может стать решающим аргументом в пользу внедрения новой технологии . Если робот не может предсказать, куда человек потянется за деталью дальше, он создает трение и замедляет процесс, делая автоматизацию бессмысленной.

🧠 Моделирование когнитивного состояния человека 9:41

Главный вызов для ИИ-агентов в команде — это понимание того, что происходит в голове у партнера-человека. Ша утверждает, что эффективная совместная работа людей строится на трех столпах:

  1. Знание того, о чем думает партнер.
  2. Предсказание его следующего шага.
  3. Использование этой информации в режиме реального времени для корректировки собственного плана .

Для реализации этого в робототехнике лаборатория Ша использует байесовские графические модели и непараметрические методы .

Проблема «ментальных моделей»

Профессор приводит пример с метрополитеном: в Нью-Йорке поезда ходят «вверх» и «вниз» (uptown/downtown), а в Бостоне — «входящие» и «исходящие» (inbound/outbound). Переключение происходит в произвольной точке в центре города . ИИ-модель, обучающаяся без учителя (unsupervised learning), вряд ли сама догадается до такой специфической человеческой логики .

Джули полагает, что вместо попыток построить универсальную модель человеческого сознания, нужно дать людям возможность легко «подправлять» скрытое пространство (latent space) модели через простые подсказки .

🏥 Командный когнитивный статус и медицина 31:28

Исследования Джули Ша выходят за рамки взаимодействия «один на один». Совместно с Гарвардской медицинской школой (Harvard Medical School) её команда изучает динамику работы в операционных при кардиохирургических вмешательствах .

В таких сложных средах возникает понятие «командного когнитивного статуса». Это не просто сумма мыслей каждого участника, а общая осведомленность группы о плане и текущих рисках . Джули отмечает, что даже если робот не участвует в операции физически, система ИИ может выступать в роли наблюдателя, который фиксирует сбои в рабочем процессе или недопонимание между врачами .

По мнению гостьи, такие системы могут анализировать диалоги и действия бригады, чтобы в нужный момент предложить «корректирующее действие» или помочь в обучении резидентов через разбор полетов (after-action review) .

🔄 Кросс-тренинг: как научить робота сопереживать 37:34

Одним из самых успешных подходов лаборатории стал «кросс-тренинг» (cross-training) . В человеческих командах это «золотой стандарт»: чтобы лучше работать вместе, партнеры на время меняются ролями. Медсестра не может заменить хирурга, но в небольших однородных группах смена ролей позволяет понять трудности партнера и адаптировать свое поведение .

Группа Ша внедрила этот метод для роботов:

Эксперименты показали, что такой подход значительно улучшает ментальную модель робота у человека и повышает качество обучения ИИ по сравнению со стандартным обучением с подкреплением . Это связано с тем, что прямая демонстрация роли робота человеком более информативна, чем простые сигналы «хорошо/плохо» (reward), смысл которых часто неоднозначен .

🔮 Будущее: от симуляции к реальности 41:40

Джули Ша видит большой потенциал в переносе обучения из виртуальной среды на завод. Идеальный сценарий: рабочий и робот тренируются вместе в 2D или 3D симуляции, выстраивают общую модель поведения, а затем выходят на сборочную линию и сразу начинают работать эффективно .

Однако существует проблема «изменения распределения данных» (out of distribution). Ша делится забавным наблюдением: когда исследователи пытались собрать данные о том, как человек работает один, чтобы потом обучить робота, выяснилось, что при появлении робота человек мгновенно меняет свое поведение . Исследователям даже приходилось самим «притворяться роботами», имитируя их движения, чтобы собрать реалистичные данные, но как только появлялась настоящая машина, человек снова действовал иначе .

Профессор резюмирует, что её глобальная цель — сделать системы ИИ легко настраиваемыми и адаптируемыми под нужды экспертов (врачей, пилотов, рабочих), которые не являются специалистами в машинном обучении .

💬 Цитаты

«Роботы могут выполнять части работы, но сборка крупного коммерческого самолета — это все еще 'улей' ручного труда.»

«Половина секунды эффективности может определить успех или провал бизнес-кейса для внедрения новой технологии.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
PomDP
Частично наблюдаемый марковский процесс принятия решений, используемый для моделирования систем с неопределенностью.
Системная дисциплина
Область инженерии, фокусирующаяся на проектировании и управлении сложными системами как единым целым.
Скрытое пространство (Latent Space)
Представление данных в сжатом виде, где нейросеть выделяет важные, но не видимые явно признаки.
📊 Цифры
🗓 Хронология
  1. 2010 Джули Ша получила степень доктора философии (PhD) в MIT.
  2. 2011 Начало работы в качестве профессора и открытие лаборатории в MIT.
⚖️ Другая сторона
Искусственный интеллект Julie Shah MIT CSAIL Boeing Human-Robot Collaboration Bayesian models