# Мэтт Пауэлл из ISS: «Для распознавания лица нужно 60 пикселей между бровями»

Источник: https://www.youtube.com/watch?v=Zk20h-Eu2qU
Канал: Eye on AI
Опубликовано: 02.02.2024

---

Современные системы видеонаблюдения переросли роль пассивных регистраторов, превратившись в мощные инструменты интеллектуального анализа данных. В новом выпуске подкаста «Eye on AI» Мэтт Пауэлл (Matt Powell), управляющий директор компании Intelligent Security Systems (ISS) в Северной Америке, рассказал о том, как алгоритмы машинного зрения управляют дорожным движением, спасают жизни в больницах и почему будущее безопасности — в «граничных» вычислениях (Edge AI), а не в облаке.

## 🏗️ От шоколадной фабрики до 3,5 миллионов камер
[[JUMP:02:45]]

История компании ISS (Intelligent Security Systems) началась в 1996 году с решения прикладной задачи на шоколадной фабрике в Восточной Европе — подсчёта продукции на конвейере [03:12]. Основатель компании быстро осознал, что для обучения более совершенных алгоритмов требуется больше видеоданных, что привело к созданию собственного цифрового видеорегистратора (NVR) в 1996–1998 годах [03:25]. 

Ключевые вехи развития компании:

*   **2003 год:** запуск первых алгоритмов биометрии лица.
*   **2004 год:** выпуск систем распознавания номерных знаков (LPR) и аналитики транспортных средств [03:37].
*   **Текущий статус:** более 30 патентов, 18 офисов по всему миру и около 3,5 миллионов камер, работающих на аналитике ISS на 300 000 объектах [04:17].

Мэтт Пауэлл отмечает, что хотя интеллектуальная собственность компании всегда базировалась в США (Нью-Джерси), её глобальное присутствие долгое время превосходило узнаваемость на североамериканском рынке [04:30].

## 💻 Архитектура вычислений: почему облако проигрывает «краю»
[[JUMP:05:10]]

Один из главных технических вопросов индустрии — где именно обрабатывать видеопоток. Мэтт Пауэлл утверждает, что для задач безопасности реального времени облачные вычисления пока не подходят из-за задержек (latency) и ограничений пропускной способности [05:52].

Основные тезисы Пауэлла об архитектуре систем:

*   **Локальные серверы (On-premise):** Необходимы для сложных задач, таких как детекция оружия или контроль использования страховочных тросов на стройках. Только локальная обработка позволяет мгновенно отправить уведомление о происшествии [09:11].
*   **Ограниченность камер:** Современные камеры обладают лишь 10–15% вычислительной мощности GPU, необходимой для работы высокоточных нейросетей (точность 99%). По прогнозам эксперта, этот показатель может вырасти до 75% в ближайшие три года [29:54].
*   **Роль облака:** В облачные системы передаются уже обработанные метаданные для формирования отчётов, дашбордов и долгосрочного анализа, в то время как первичная аналитика происходит на месте [06:33].

## 🧠 Скелетные модели и 50 модулей аналитики
[[JUMP:13:51]]

ISS использует библиотеку из примерно 50 специализированных программных модулей. Вместо того чтобы пытаться создать «универсальный ИИ», компания фокусируется на узких задачах [14:30].

Технологические особенности моделей:

1.  **Скелетные модели:** Система строит математическую модель человеческого скелета. Это позволяет определять сложные действия: держится ли человек за поручень на лестнице, участвует ли в драке или бежит [15:22].
2.  **Точность из коробки:** Благодаря доступу к данным с 3,5 млн камер в 56 странах, модели ISS на 90% готовы к работе в любых условиях освещения и ракурсах сразу после установки [17:36].
3.  **Обучение на данных:** Пауэлл приводит пример курьёзного, но трагичного случая с конкурентами-стартапами. Они обучали модель падения человека, заставляя сотрудников падать и перекатываться перед камерой. Однако когда у реального посетителя случился сердечный приступ, система его не распознала, так как он упал «не по сценарию» [20:51].

## 🏙️ Мехико и «умные города»: 60 000 камер в одной сети
[[JUMP:32:04]]

Самым масштабным примером внедрения технологий ISS является Мехико. Это одна из сложнейших муниципальных систем безопасности в мире [32:35].

Инфраструктура Мехико включает:

*   **60 000 камер**, интегрированных в единую сеть.
*   **10 000 модулей** детектирования бега и агрессивного поведения [32:48].
*   **1 000 систем** распознавания лиц и 1 000 систем LPR для контроля транспорта.
*   **13 000 киосков экстренной связи** с двусторонней видеосвязью и круглосуточным медицинским центром, где дежурят 30 специалистов [33:27].

По словам Пауэлла, помимо безопасности, города всё чаще используют ИИ для транспортного планирования (ITS). Аналитика позволяет выявлять «почти случившиеся» аварии (near misses), когда пешеходы переходят дорогу в неположенном месте из-за неудобного расположения остановок, и корректировать городскую среду [48:53].

## 🏥 Применение в медицине и бизнесе
[[JUMP:35:42]]

Помимо охраны правопорядка, ИИ-видеонаблюдение активно проникает в специализированные ниши:

*   **Здравоохранение (Virtual Care):** Камеры в палатах больниц отслеживают, не упал ли пациент с кровати и не покинул ли он зону самовольно. Это критически важно для предотвращения травм и контроля пациентов с деменцией [35:55].
*   **Сельское хозяйство:** Пауэлл упоминает системы для животноводческих ферм, которые распознают начало родов у коров и свиней по специфическому поведению, отправляя уведомление фермеру ночью [44:31].
*   **Промышленная безопасность:** Детекция средств индивидуальной защиты (каски, жилеты) и контроль опасных зон.

## 👤 Биометрия: мифы и реальные возможности
[[JUMP:54:04]]

Мэтт Пауэлл развеял некоторые мифы о распознавании лиц, подчеркнув технические требования и этические аспекты.

*   **Правило 60 пикселей:** Для надёжной идентификации лица системе необходимо минимум 60 пикселей между бровями человека. Современные 2-мегапиксельные камеры позволяют добиться этого на расстоянии до 3 метров [54:47].
*   **Распознавание паттернов:** Пауэлл предпочитает термин «распознавание паттернов», а не «лиц». Система ISS способна преобразовать 2D-изображение из соцсетей в 3D-биометрическую модель, анализируя уникальные кривые скул и расстояние между узлами лица [1:02:20].
*   **Универсальность:** Те же алгоритмы, что распознают лица, могут быть обучены распознавать рисунок ушной раковины или даже отличать огурцы от моркови (запрос от конных заводов, чтобы следить за рационом лошадей) [56:08].

Мэтт Пауэлл убежден, что в ближайшие пять лет нас ждёт взрывной рост возможностей «подключённого транспорта» (V2X). Видеоаналитика будет напрямую взаимодействовать с автомобилями, предупреждая водителей о пешеходах за углом и автоматически управляя светофорами для оптимизации трафика [51:37].