Хизер Горр: „В критических системах вы обязаны тестировать ИИ до абсолютного изнеможения“

The TWIML AI Podcast 644 45 мин 4 мин 13.11.2023
Главное

В новом выпуске подкаста TWIML AI Сэм Чаррингтон беседует с Хизер Горр, ведущим менеджером по продуктовому маркетингу MATLAB в компании MathWorks. Обсуждение сосредоточено на специфике развёртывания систем машинного и глубокого обучения на аппаратных средствах (Edge AI), а также на том, как инженерные дисциплины и классический ИИ находят точки соприкосновения в критически важных отраслях.

🛠️ Пересечение инженерии и ИИ: наследие MATLAB 0:00

Хизер Горр пришла в сферу машинного обучения из физики, защитив диссертацию (PhD) около 10 лет назад . В то время она занималась анализом микроскопических изображений для определения концентрации жидкостей, что позволяло ставить медицинские диагнозы по капле крови или слезы . Этот опыт привел её в MathWorks, где сегодня огромное сообщество инженеров и ученых интегрирует методы ИИ в традиционные системы.

По словам Горр, сегодня наблюдается конвергенция сообщества исследователей ИИ и инженерного сообщества . Ключевые тезисы этой интеграции:

🏗️ Физические модели против данных: концепция цифровых двойников 6:12

Существует мнение, что машинное обучение постепенно вытесняет традиционное физическое моделирование, однако Хизер Горр утверждает, что эти подходы дополняют друг друга . Она приводит в пример компанию Baker Hughes, занимающуюся предиктивным обслуживанием насосов .

Главная проблема в таких индустриях — дефицит данных о поломках. Никто не хочет намеренно ломать дорогое оборудование ради сбора обучающей выборки . В этом случае:

  1. Физическая модель используется для симуляции отказов, утечек и изменений параметров .
  2. Сгенерированные данные дополняют реальные сеты для обучения моделей.
  3. Создается «цифровой двойник» (Digital Twin), позволяющий инженерам в реальном времени сравнивать показатели работающего агрегата с эталонной моделью и тестировать изменения параметров в безопасной среде .

🏎️ Путь модели на железо: от Python до кристалла 9:29

Развёртывание ИИ в автомобильной или аэрокосмической отрасли кардинально отличается от облачных решений. Хизер описывает кейс Mercedes-Benz: команда использовала PyTorch для создания модели глубокого обучения и проводила квантование в Python . Однако для финального шага — внедрения в автомобиль — потребовался инструмент Fixed-Point Designer в MATLAB .

Это необходимо, потому что реальные устройства часто не поддерживают вычисления с плавающей точкой (floating-point math) с нужной скоростью или энергоэффективностью . Инженеры используют MATLAB для проверки того, как модель, созданная «художниками-исследователями», будет вести себя в строгих рамках аппаратных ограничений .

Процесс осложняется тем, что в разработке участвуют огромные междисциплинарные команды :

📉 Проектирование с конца: ограничения Edge-устройств 16:18

По мнению Горр, разработку Edge AI нужно начинать «с конца» — с понимания ограничений целевого устройства .

🧪 Верификация и V&V (Validation and Verification) 29:43

В миссионно-критичных системах надежность модели важнее её точности на бумаге. Горр выделяет четыре этапа тестирования, принятых в индустрии (например, по стандартам ISO) :

  1. MIL (Model-in-the-Loop): Проверка логики ИИ внутри блок-диаграммы всей системы в симуляторе (Simulink) .
  2. SIL (Software-in-the-Loop): Код модели переводится на C/C++ и тестируется как программный компонент .
  3. PIL/FIL (Processor/FPGA-in-the-Loop): Проверка работы алгоритма непосредственно на целевом процессоре или матрице FPGA .
  4. HIL (Hardware-in-the-Loop): Устройство с моделью подключается к физическому симулятору остальной системы (например, симулятору полета или движения автомобиля), имитируя реальную эксплуатацию .

Хизер подчеркивает, что такие тесты должны проводиться до абсолютного изнеможения системы, чтобы исключить любые риски для человеческих жизней .

🛡️ Безопасность и жизненный цикл модели 37:30

Инженеры также обязаны учитывать состязательные атаки (adversarial examples) и системные смещения (bias). Поскольку «симулировать общество» невозможно, команды фокусируются на симуляции экстремальных граничных случаев (corner cases) через физические модели . Если модель ошибается в критической ситуации, вводится матрица стоимостей (cost matrix), жестко штрафующая алгоритм за опасные для жизни классификации .

Работа над Edge-системой не заканчивается после деплоя. Модели требуют обновления по мере поступления новых данных. Существуют два подхода:

В завершение Горр отмечает, что специализированный MLOPs для встраиваемых систем сейчас рождается на стыке классических методов IT-разработки (CI/CD, Jenkins) и многолетнего опыта модельно-ориентированного проектирования (Model-Based Design) .

💬 Цитаты

«Вы не хотите ломать насос, чтобы получить данные. Мы используем физическую модель, которую можно ломать сколько угодно.»

Хизер Горр 07:46

«Разработка должна начинаться с понимания того, что произойдет на устройстве в самом конце.»

Хизер Горр 17:12
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Квантование (Quantization)
Процесс перевода весов нейросети из формата с плавающей точкой в более простые форматы (например, 8-битные целые числа) для ускорения работы на железе.
HIL (Hardware-in-the-Loop)
Метод тестирования, при котором реальное электронное устройство подключается к симулятору, имитирующему окружение (двигатель, самолет и т.д.).
Edge AI
Запуск алгоритмов искусственного интеллекта непосредственно на конечном устройстве (камере, датчике, контроллере), а не в облаке.
📊 Цифры
🗓 Хронология
  1. 1992 Запуск Neural Network Toolbox в MATLAB.
  2. 2014 Хизер Горр присоединяется к MathWorks после получения степени PhD в физике.
⚖️ Другая сторона
Инженерия MathWorks MATLAB Simulink Edge AI Baker Hughes