Хизер Горр: „В критических системах вы обязаны тестировать ИИ до абсолютного изнеможения“

В новом выпуске подкаста TWIML AI Сэм Чаррингтон беседует с Хизер Горр, ведущим менеджером по продуктовому маркетингу MATLAB в компании MathWorks. Обсуждение сосредоточено на специфике развёртывания систем машинного и глубокого обучения на аппаратных средствах (Edge AI), а также на том, как инженерные дисциплины и классический ИИ находят точки соприкосновения в критически важных отраслях.

🛠️ Пересечение инженерии и ИИ: наследие MATLAB 0:00

Хизер Горр пришла в сферу машинного обучения из физики, защитив диссертацию (PhD) около 10 лет назад . В то время она занималась анализом микроскопических изображений для определения концентрации жидкостей, что позволяло ставить медицинские диагнозы по капле крови или слезы . Этот опыт привел её в MathWorks, где сегодня огромное сообщество инженеров и ученых интегрирует методы ИИ в традиционные системы.

По словам Горр, сегодня наблюдается конвергенция сообщества исследователей ИИ и инженерного сообщества . Ключевые тезисы этой интеграции:

Долголетие технологий: Пакет Neural Network Toolbox в MATLAB появился ещё в 1992 году . Инструментарий для работы с нейросетями не является чем-то принципиально новым для инженеров, хотя масштаб применения колоссально вырос.
Сосуществование языков: В реальности «языковых войн» (MATLAB против Python) не существует . В сложных системах разработчики часто используют Python и PyTorch для исследований и прототипирования, а MATLAB и Simulink — для интеграции модели в систему управления, цифровой обработки сигналов и финального развёртывания на железе .
Ориентация на управление: Огромный интерес вызывает обучение с подкреплением (Reinforcement Learning), так как оно напрямую ложится на задачи классического управления (Controls) .

🏗️ Физические модели против данных: концепция цифровых двойников 6:12

Существует мнение, что машинное обучение постепенно вытесняет традиционное физическое моделирование, однако Хизер Горр утверждает, что эти подходы дополняют друг друга . Она приводит в пример компанию Baker Hughes, занимающуюся предиктивным обслуживанием насосов .

Главная проблема в таких индустриях — дефицит данных о поломках. Никто не хочет намеренно ломать дорогое оборудование ради сбора обучающей выборки . В этом случае:

Физическая модель используется для симуляции отказов, утечек и изменений параметров .
Сгенерированные данные дополняют реальные сеты для обучения моделей.
Создается «цифровой двойник» (Digital Twin), позволяющий инженерам в реальном времени сравнивать показатели работающего агрегата с эталонной моделью и тестировать изменения параметров в безопасной среде .

🏎️ Путь модели на железо: от Python до кристалла 9:29

Развёртывание ИИ в автомобильной или аэрокосмической отрасли кардинально отличается от облачных решений. Хизер описывает кейс Mercedes-Benz: команда использовала PyTorch для создания модели глубокого обучения и проводила квантование в Python . Однако для финального шага — внедрения в автомобиль — потребовался инструмент Fixed-Point Designer в MATLAB .

Это необходимо, потому что реальные устройства часто не поддерживают вычисления с плавающей точкой (floating-point math) с нужной скоростью или энергоэффективностью . Инженеры используют MATLAB для проверки того, как модель, созданная «художниками-исследователями», будет вести себя в строгих рамках аппаратных ограничений .

Процесс осложняется тем, что в разработке участвуют огромные междисциплинарные команды :

Hardware-эксперты, работающие с сенсорами.
Data Scientists, создающие архитектуру моделей.
Сертификационные специалисты и юристы, так как в авиации и автопроме нельзя просто внедрить алгоритм без жесткой проверки на безопасность .

📉 Проектирование с конца: ограничения Edge-устройств 16:18

По мнению Горр, разработку Edge AI нужно начинать «с конца» — с понимания ограничений целевого устройства .

Окно данных: Если устройство получает поток данных с наносекундным разрешением, но может хранить в памяти только 2 секунды потока, исследователь не имеет права обучать модель на 10-секундных паттернах .
Препроцессинг: Все «красивые» методы очистки данных и извлечения признаков (feature engineering), которые работают на мощном ноутбуке, должны быть воспроизводимы на устройстве в режиме реального времени .
Упрощение: Часто вместо сложной регрессии выгоднее использовать метод «ближайшего соседа» или простые физические формулы (вроде F=ma), если они обеспечивают нужную точность при минимальной задержке .

🧪 Верификация и V&V (Validation and Verification) 29:43

В миссионно-критичных системах надежность модели важнее её точности на бумаге. Горр выделяет четыре этапа тестирования, принятых в индустрии (например, по стандартам ISO) :

MIL (Model-in-the-Loop): Проверка логики ИИ внутри блок-диаграммы всей системы в симуляторе (Simulink) .
SIL (Software-in-the-Loop): Код модели переводится на C/C++ и тестируется как программный компонент .
PIL/FIL (Processor/FPGA-in-the-Loop): Проверка работы алгоритма непосредственно на целевом процессоре или матрице FPGA .
HIL (Hardware-in-the-Loop): Устройство с моделью подключается к физическому симулятору остальной системы (например, симулятору полета или движения автомобиля), имитируя реальную эксплуатацию .

Хизер подчеркивает, что такие тесты должны проводиться до абсолютного изнеможения системы, чтобы исключить любые риски для человеческих жизней .

🛡️ Безопасность и жизненный цикл модели 37:30

Инженеры также обязаны учитывать состязательные атаки (adversarial examples) и системные смещения (bias). Поскольку «симулировать общество» невозможно, команды фокусируются на симуляции экстремальных граничных случаев (corner cases) через физические модели . Если модель ошибается в критической ситуации, вводится матрица стоимостей (cost matrix), жестко штрафующая алгоритм за опасные для жизни классификации .

Работа над Edge-системой не заканчивается после деплоя. Модели требуют обновления по мере поступления новых данных. Существуют два подхода:

Офлайн-обновление: Сбор данных, переобучение в облаке и повторная прошивка устройства .
Онлайн-обновление (на устройстве): Использование апостериорных вероятностей для легкой корректировки параметров модели без полного переобучения .

В завершение Горр отмечает, что специализированный MLOPs для встраиваемых систем сейчас рождается на стыке классических методов IT-разработки (CI/CD, Jenkins) и многолетнего опыта модельно-ориентированного проектирования (Model-Based Design) .