# Гурдип Полл из Microsoft: «Мы строим Windows для автономных систем»

Источник: https://www.youtube.com/watch?v=-WJVzx99lUY
Канал: The TWIML AI Podcast
Опубликовано: 01.02.2021

---

Будущее промышленной автоматизации неразрывно связано с переходом от жестких алгоритмов к гибким автономным системам, способным обучаться в виртуальных мирах. Гурдип Полл, корпоративный вице-президент Microsoft, в беседе с Сэмом Чаррингтоном на подкасте TWIML AI обсуждает, как объединение глубокого обучения с подкреплением и традиционного инженерного опыта позволяет создавать интеллектуальные системы управления — от производства Cheetos до оптимизации энергопотребления небоскребов.

## 🎓 30 лет инноваций: путь к автономным системам
[[JUMP:00:13]]

Гурдип Полл работает в Microsoft уже 31 год [00:56]. Его карьера разделилась на три ключевых этапа: сетевые технологии (включая запуск Wi-Fi в Windows XP), создание систем коммуникаций (от Office Communication Server до Microsoft Teams) и, наконец, искусственный интеллект [01:36].

Полл отмечает, что его текущая работа над автономными системами — это результат синтеза достижений в области компьютерного зрения, обработки естественного языка и понимания контекста («ambient intelligence») [03:36]. В 2018 году Microsoft сделала стратегический шаг в этом направлении, купив стартап **Bonsai**. Марк Хэммонд, сооснователь Bonsai, считал, что создание платформы для обучения машин (machine teaching) — задача именно для такого гиганта, как Microsoft, поскольку стартапам сложно в одиночку строить горизонтальные инструменты для промышленных предприятий [06:39].

## 🏗️ Биты против Атомов: специфика промышленного ИИ
[[JUMP:07:31]]

Гурдип Полл проводит четкую грань между RPA (роботизированной автоматизацией процессов) и автономными системами. В то время как RPA работает исключительно с "битами" (цифровыми процессами), автономные системы взаимодействуют с "атомами" — физическими объектами [09:03].

Ключевые отличия физического мира, по мнению Полла:

*   **Законы физики:** Системы должны учитывать механику, динамику жидкостей и трение [09:28].
*   **Динамические изменения:** Каждое действие робота или контроллера меняет состояние окружающего мира, что делает обучение с подкреплением (Reinforcement Learning, RL) идеальным инструментом для таких задач [10:06].
*   **Человеческая экспертиза:** В отличие от обработки больших данных (Big Data), где алгоритмы часто ищут корреляции с нуля, в промышленности уже существуют эксперты. Ключ к успеху — «извлечение» их знаний и их интеграция в модель [10:56].

## 🍟 Примеры применения: от Shell до Cheetos
[[JUMP:11:37]]

Обсуждаемые технологии уже находят применение в самых разных отраслях:

*   **Производство продуктов питания (PepsiCo):** Процесс экструзии Cheetos крайне чувствителен к влажности и качеству кукурузной муки [13:34]. Автономная система корректирует параметры оборудования в реальном времени, обеспечивая идеальную «хрусткость» каждой партии [14:28].
*   **Нефтегазовый сектор (Shell):** Управление огромными буровыми установками для горизонтального бурения требует невероятной точности. ИИ помогает направлять буровые долота эффективнее, чем это делают люди-операторы [12:31].
*   **Авиация (Bell Flight):** Разработка систем автономного взлета и посадки для вертикальных летательных аппаратов [15:05].
*   **Управление климатом (HVAC):** Оптимизация систем отопления и вентиляции в крупных зданиях позволяет экономить миллионы долларов и сокращать углеродный след [12:05].

## 🎮 Симуляция — ключ к обучению без разрушений
[[JUMP:16:25]]

Одной из главных проблем RL является необходимость миллионов итераций для выработки надежной стратегии. В реальном мире это привело бы к поломке тысяч роботов и потере тонн сырья [17:06]. Решением стала связка специализированных симуляторов и облачных вычислений.

Гурдип упоминает проект **AirSim** — симулятор с открытым исходным кодом от Microsoft Research, который изначально создавался для дронов [19:55]. Он использует графические движки (Unreal Engine, Unity) для создания фотореалистичных миров и физических условий [20:48]. Сегодня AirSim имеет более 10 000 звезд на GitHub и используется для обучения ИИ восприятию реальности [21:40].

Для случаев, когда у заказчика нет готового симулятора, команда Полла применяет **Deep Simulation Networks**. Это нейросетевая архитектура, которая может «выучить» физику процесса на основе накопленных данных (IoT-датчиков), фактически создавая цифровой двойник предприятия [39:05].

## 🧠 От нейросетей к «Мозгу» (The Brain)
[[JUMP:31:17]]

Полл использует термин «Мозг» для описания архитектуры управления. По его словам, даже Билл Гейтс интересовался, зачем использовать такое антропоморфное название [34:20].

«Мозг» в понимании Microsoft — это не одна нейросеть, а иерархическая коллекция моделей [34:35]. Например, для робо-руки одна модель отвечает за зрение, вторая — за планирование траектории «тянуться», третья — за захват объекта. Эта модульность позволяет сочетать обучаемые нейросети с классическими программными алгоритмами [35:16].

## 🛡️ Безопасность и инженерное доверие
[[JUMP:48:19]]

Одной из главных преград для внедрения ИИ в индустрию является недоверие профессиональных инженеров (механиков, химиков). Гурдип вспоминает свой опыт разработки стека TCP/IP для Windows: в начале 90-х команда выпускала по 20 обновлений в неделю, реагируя на атаки, пока не пришло понимание, что безопасность должна быть заложена в архитектуру [49:14].

Чтобы убедить инженеров, Microsoft создала проект **Moab** — небольшой трехопорный робот, балансирующий шарик для пинг-понга [27:38]. Если классический ПИД-регулятор (PID) неплохо справляется с удержанием шарика, то только решение на базе RL может «поймать» шарик, брошенный на платформу сверху, или катать его по сложной траектории [28:19].

Для обеспечения безопасности в критических сценариях (например, бурение или работа робота рядом с людьми) используется концепция **Safe Action Layer** [51:22]. Это отдельный слой логики, который проверяет каждое действие «Мозга» на соответствие жестким правилам (предикатной логике) перед тем, как подать сигнал на исполнительный механизм [51:36]. Если рука робота пытается выйти за «красную линию» безопасности, система просто блокирует это действие, независимо от того, насколько «эффективным» его посчитала нейросеть [53:18].

## 🔮 Будущее: горизонтальная платформа
[[JUMP:55:28]]

Полл прогнозирует, что мы входим в «эру автономных систем». Если сейчас такие гиганты, как Tesla или Waymo, строят вертикально интегрированные, закрытые системы, то цель Microsoft — создать «Windows для автономных систем» [57:18]. Это будет горизонтальный набор инструментов, позволяющий любому инженеру без глубоких познаний в Data Science описать задачу через цели (goals), обучить «мозг» в симуляторе и развернуть его на физическом объекте [44:23].