Гурдип Полл из Microsoft: «Мы строим Windows для автономных систем»

The TWIML AI Podcast 660 58 мин 4 мин 01.02.2021
Главное

Будущее промышленной автоматизации неразрывно связано с переходом от жестких алгоритмов к гибким автономным системам, способным обучаться в виртуальных мирах. Гурдип Полл, корпоративный вице-президент Microsoft, в беседе с Сэмом Чаррингтоном на подкасте TWIML AI обсуждает, как объединение глубокого обучения с подкреплением и традиционного инженерного опыта позволяет создавать интеллектуальные системы управления — от производства Cheetos до оптимизации энергопотребления небоскребов.

🎓 30 лет инноваций: путь к автономным системам 0:13

Гурдип Полл работает в Microsoft уже 31 год . Его карьера разделилась на три ключевых этапа: сетевые технологии (включая запуск Wi-Fi в Windows XP), создание систем коммуникаций (от Office Communication Server до Microsoft Teams) и, наконец, искусственный интеллект .

Полл отмечает, что его текущая работа над автономными системами — это результат синтеза достижений в области компьютерного зрения, обработки естественного языка и понимания контекста («ambient intelligence») . В 2018 году Microsoft сделала стратегический шаг в этом направлении, купив стартап Bonsai. Марк Хэммонд, сооснователь Bonsai, считал, что создание платформы для обучения машин (machine teaching) — задача именно для такого гиганта, как Microsoft, поскольку стартапам сложно в одиночку строить горизонтальные инструменты для промышленных предприятий .

🏗️ Биты против Атомов: специфика промышленного ИИ 7:31

Гурдип Полл проводит четкую грань между RPA (роботизированной автоматизацией процессов) и автономными системами. В то время как RPA работает исключительно с "битами" (цифровыми процессами), автономные системы взаимодействуют с "атомами" — физическими объектами .

Ключевые отличия физического мира, по мнению Полла:

🍟 Примеры применения: от Shell до Cheetos 11:37

Обсуждаемые технологии уже находят применение в самых разных отраслях:

🎮 Симуляция — ключ к обучению без разрушений 16:25

Одной из главных проблем RL является необходимость миллионов итераций для выработки надежной стратегии. В реальном мире это привело бы к поломке тысяч роботов и потере тонн сырья . Решением стала связка специализированных симуляторов и облачных вычислений.

Гурдип упоминает проект AirSim — симулятор с открытым исходным кодом от Microsoft Research, который изначально создавался для дронов . Он использует графические движки (Unreal Engine, Unity) для создания фотореалистичных миров и физических условий . Сегодня AirSim имеет более 10 000 звезд на GitHub и используется для обучения ИИ восприятию реальности .

Для случаев, когда у заказчика нет готового симулятора, команда Полла применяет Deep Simulation Networks. Это нейросетевая архитектура, которая может «выучить» физику процесса на основе накопленных данных (IoT-датчиков), фактически создавая цифровой двойник предприятия .

🧠 От нейросетей к «Мозгу» (The Brain) 31:17

Полл использует термин «Мозг» для описания архитектуры управления. По его словам, даже Билл Гейтс интересовался, зачем использовать такое антропоморфное название .

«Мозг» в понимании Microsoft — это не одна нейросеть, а иерархическая коллекция моделей . Например, для робо-руки одна модель отвечает за зрение, вторая — за планирование траектории «тянуться», третья — за захват объекта. Эта модульность позволяет сочетать обучаемые нейросети с классическими программными алгоритмами .

🛡️ Безопасность и инженерное доверие 48:19

Одной из главных преград для внедрения ИИ в индустрию является недоверие профессиональных инженеров (механиков, химиков). Гурдип вспоминает свой опыт разработки стека TCP/IP для Windows: в начале 90-х команда выпускала по 20 обновлений в неделю, реагируя на атаки, пока не пришло понимание, что безопасность должна быть заложена в архитектуру .

Чтобы убедить инженеров, Microsoft создала проект Moab — небольшой трехопорный робот, балансирующий шарик для пинг-понга . Если классический ПИД-регулятор (PID) неплохо справляется с удержанием шарика, то только решение на базе RL может «поймать» шарик, брошенный на платформу сверху, или катать его по сложной траектории .

Для обеспечения безопасности в критических сценариях (например, бурение или работа робота рядом с людьми) используется концепция Safe Action Layer . Это отдельный слой логики, который проверяет каждое действие «Мозга» на соответствие жестким правилам (предикатной логике) перед тем, как подать сигнал на исполнительный механизм . Если рука робота пытается выйти за «красную линию» безопасности, система просто блокирует это действие, независимо от того, насколько «эффективным» его посчитала нейросеть .

🔮 Будущее: горизонтальная платформа 55:28

Полл прогнозирует, что мы входим в «эру автономных систем». Если сейчас такие гиганты, как Tesla или Waymo, строят вертикально интегрированные, закрытые системы, то цель Microsoft — создать «Windows для автономных систем» . Это будет горизонтальный набор инструментов, позволяющий любому инженеру без глубоких познаний в Data Science описать задачу через цели (goals), обучить «мозг» в симуляторе и развернуть его на физическом объекте .

💬 Цитаты

«Если у вас есть проблема и вы моделируете ее как задачу обучения с подкреплением, теперь у вас есть две проблемы.»

Гурдип Полл (цитируя Джона Лэнгфорда) 43:43

«Мы хотим создать горизонтальные компоненты... своего рода Windows для автономных систем.»

Гурдип Полл 57:13
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Reinforcement Learning (RL)
Метод машинного обучения, при котором агент учится принимать решения, получая вознаграждение или наказание от среды.
Machine Teaching
Подход, при котором акцент смещается с алгоритмов на эксперта-человека, который разбивает сложную задачу на простые шаги для ИИ.
Safe Action Layer
Программная прослойка, проверяющая команды нейросети на соответствие правилам безопасности перед выполнением физического действия.
PID-регулятор
Классический механизм управления с обратной связью, широко используемый в автоматике для поддержания заданного значения параметра.
📊 Цифры
🗓 Хронология
  1. 1991 Гурдип Полл начал карьеру в Microsoft.
  2. 2001 Выпуск Windows XP с поддержкой Wi-Fi, которой руководил Полл.
  3. 2015 Запуск проекта AirSim внутри Microsoft Research.
  4. 2018 Microsoft приобрела стартап Bonsai для развития промышленного ИИ.
⚖️ Другая сторона
Искусственный интеллект Microsoft Bonsai Reinforcement Learning AirSim Autonomous Systems