# Джули Ша из MIT: «Роботы должны понимать, о чем думает человек»

Источник: https://www.youtube.com/watch?v=0N3rw6zxHCY
Канал: The TWIML AI Podcast
Опубликовано: 22.11.2021

---

На стыке робототехники, аэрокосмической инженерии и когнитивистики рождается будущее, в котором машины не просто выполняют алгоритмы, а становятся полноценными партнерами людей. Профессор MIT Джули Ша (Julie Shah) исследует, как искусственный интеллект может предсказывать действия человека и адаптироваться к ним в критически важных сферах: от сборки самолетов Boeing до проведения кардиохирургических операций.

## 🤖 Робототехника как системная дисциплина
[[JUMP:00:01]]

Джули Ша начала свой путь в науке с мечты о космосе, что привело её в Массачусетский технологический институт (MIT) на факультет аэронавтики и астронавтики [01:07]. По её словам, именно работа в авиакосмической отрасли привила ей любовь к системам, где время и безопасность имеют критическое значение [00:54].

В процессе обучения Ша осознала, что аэрокосмическая инженерия, как и робототехника, — это прежде всего системная дисциплина. Её увлечение теорией управления и автопилотами переросло в глубокий интерес к «человеческому фактору». Как утверждает профессор, автопилоты должны проектироваться с учетом возможностей пилотов-людей, что требует понимания обеих сторон уравнения «человек-машина» [02:13].

Свою исследовательскую работу Джули строит на пересечении нескольких областей:

*   **Аэрокосмическая инженерия:** дисциплина и надежность систем.
*   **Компьютерные науки (CSAIL):** автоматизированное планирование и составление расписаний [02:40].
*   **Инженерия человеческого фактора (Human Factors Engineering):** изучение того, как люди взаимодействуют с технологиями [02:27].

В 2010 году, защитив докторскую диссертацию, она основала **Interactive Robotics Group**. В лаборатории работают специалисты разного профиля — от программистов до психологов — для создания ИИ-моделей, которые «вписываются в возможности человека, как фрагменты пазла» [03:07].

## 🏭 От сборки Boeing к гибкому производству
[[JUMP:04:13]]

Перед тем как стать профессором, Джули Ша провела год в компании **Boeing** в Сиэтле, изучая применение робототехники в авиастроении [04:25]. Этот опыт изменил её взгляд на автоматизацию.

По словам Ша, вопреки ожиданиям, сборка гигантских лайнеров вроде 737 или 777 до сих пор напоминает «человеческий улей» — подавляющее большинство работ выполняется вручную [04:53]. Основная проблема внедрения роботов заключается не в их механических способностях, а в сложности интеграции в ручной рабочий процесс.

Джули выделяет ключевой бизнес-фактор: в автомобилестроении экономия всего **полусекунды** рабочего времени может стать решающим аргументом в пользу внедрения новой технологии [22:03]. Если робот не может предсказать, куда человек потянется за деталью дальше, он создает трение и замедляет процесс, делая автоматизацию бессмысленной.

## 🧠 Моделирование когнитивного состояния человека
[[JUMP:09:41]]

Главный вызов для ИИ-агентов в команде — это понимание того, что происходит в голове у партнера-человека. Ша утверждает, что эффективная совместная работа людей строится на трех столпах:

1. Знание того, о чем думает партнер.
2. Предсказание его следующего шага.
3. Использование этой информации в режиме реального времени для корректировки собственного плана [08:35].

Для реализации этого в робототехнике лаборатория Ша использует **байесовские графические модели** и непараметрические методы [13:34].

### Проблема «ментальных моделей»
Профессор приводит пример с метрополитеном: в Нью-Йорке поезда ходят «вверх» и «вниз» (uptown/downtown), а в Бостоне — «входящие» и «исходящие» (inbound/outbound). Переключение происходит в произвольной точке в центре города [12:40]. ИИ-модель, обучающаяся без учителя (unsupervised learning), вряд ли сама догадается до такой специфической человеческой логики [11:26].

Джули полагает, что вместо попыток построить универсальную модель человеческого сознания, нужно дать людям возможность легко «подправлять» скрытое пространство (latent space) модели через простые подсказки [11:50].

## 🏥 Командный когнитивный статус и медицина
[[JUMP:31:28]]

Исследования Джули Ша выходят за рамки взаимодействия «один на один». Совместно с Гарвардской медицинской школой (Harvard Medical School) её команда изучает динамику работы в операционных при кардиохирургических вмешательствах [33:39].

В таких сложных средах возникает понятие **«командного когнитивного статуса»**. Это не просто сумма мыслей каждого участника, а общая осведомленность группы о плане и текущих рисках [35:35]. Джули отмечает, что даже если робот не участвует в операции физически, система ИИ может выступать в роли наблюдателя, который фиксирует сбои в рабочем процессе или недопонимание между врачами [34:56].

По мнению гостьи, такие системы могут анализировать диалоги и действия бригады, чтобы в нужный момент предложить «корректирующее действие» или помочь в обучении резидентов через разбор полетов (after-action review) [35:09].

## 🔄 Кросс-тренинг: как научить робота сопереживать
[[JUMP:37:34]]

Одним из самых успешных подходов лаборатории стал **«кросс-тренинг» (cross-training)** [38:51]. В человеческих командах это «золотой стандарт»: чтобы лучше работать вместе, партнеры на время меняются ролями. Медсестра не может заменить хирурга, но в небольших однородных группах смена ролей позволяет понять трудности партнера и адаптировать свое поведение [39:04].

Группа Ша внедрила этот метод для роботов:

*   Сначала человек и робот выполняют свои задачи [40:09].
*   Затем человек в симуляции берет на себя роль робота, выполняя его работу [40:21].
*   Робот в это время «наблюдает» за тем, как человек выполняет его функции.

Эксперименты показали, что такой подход значительно улучшает ментальную модель робота у человека и повышает качество обучения ИИ по сравнению со стандартным обучением с подкреплением [41:12]. Это связано с тем, что прямая демонстрация роли робота человеком более информативна, чем простые сигналы «хорошо/плохо» (reward), смысл которых часто неоднозначен [40:59].

## 🔮 Будущее: от симуляции к реальности
[[JUMP:41:40]]

Джули Ша видит большой потенциал в переносе обучения из виртуальной среды на завод. Идеальный сценарий: рабочий и робот тренируются вместе в 2D или 3D симуляции, выстраивают общую модель поведения, а затем выходят на сборочную линию и сразу начинают работать эффективно [42:07].

Однако существует проблема «изменения распределения данных» (out of distribution). Ша делится забавным наблюдением: когда исследователи пытались собрать данные о том, как человек работает один, чтобы потом обучить робота, выяснилось, что при появлении робота человек мгновенно меняет свое поведение [44:21]. Исследователям даже приходилось самим «притворяться роботами», имитируя их движения, чтобы собрать реалистичные данные, но как только появлялась настоящая машина, человек снова действовал иначе [44:35].

Профессор резюмирует, что её глобальная цель — сделать системы ИИ легко настраиваемыми и адаптируемыми под нужды экспертов (врачей, пилотов, рабочих), которые не являются специалистами в машинном обучении [45:39].