Современные системы видеонаблюдения переросли роль пассивных регистраторов, превратившись в мощные инструменты интеллектуального анализа данных. В новом выпуске подкаста «Eye on AI» Мэтт Пауэлл (Matt Powell), управляющий директор компании Intelligent Security Systems (ISS) в Северной Америке, рассказал о том, как алгоритмы машинного зрения управляют дорожным движением, спасают жизни в больницах и почему будущее безопасности — в «граничных» вычислениях (Edge AI), а не в облаке.
🏗️ От шоколадной фабрики до 3,5 миллионов камер 2:45
История компании ISS (Intelligent Security Systems) началась в 1996 году с решения прикладной задачи на шоколадной фабрике в Восточной Европе — подсчёта продукции на конвейере . Основатель компании быстро осознал, что для обучения более совершенных алгоритмов требуется больше видеоданных, что привело к созданию собственного цифрового видеорегистратора (NVR) в 1996–1998 годах .
Ключевые вехи развития компании:
- 2003 год: запуск первых алгоритмов биометрии лица.
- 2004 год: выпуск систем распознавания номерных знаков (LPR) и аналитики транспортных средств .
- Текущий статус: более 30 патентов, 18 офисов по всему миру и около 3,5 миллионов камер, работающих на аналитике ISS на 300 000 объектах .
Мэтт Пауэлл отмечает, что хотя интеллектуальная собственность компании всегда базировалась в США (Нью-Джерси), её глобальное присутствие долгое время превосходило узнаваемость на североамериканском рынке .
💻 Архитектура вычислений: почему облако проигрывает «краю» 5:10
Один из главных технических вопросов индустрии — где именно обрабатывать видеопоток. Мэтт Пауэлл утверждает, что для задач безопасности реального времени облачные вычисления пока не подходят из-за задержек (latency) и ограничений пропускной способности .
Основные тезисы Пауэлла об архитектуре систем:
- Локальные серверы (On-premise): Необходимы для сложных задач, таких как детекция оружия или контроль использования страховочных тросов на стройках. Только локальная обработка позволяет мгновенно отправить уведомление о происшествии .
- Ограниченность камер: Современные камеры обладают лишь 10–15% вычислительной мощности GPU, необходимой для работы высокоточных нейросетей (точность 99%). По прогнозам эксперта, этот показатель может вырасти до 75% в ближайшие три года .
- Роль облака: В облачные системы передаются уже обработанные метаданные для формирования отчётов, дашбордов и долгосрочного анализа, в то время как первичная аналитика происходит на месте .
🧠 Скелетные модели и 50 модулей аналитики 13:51
ISS использует библиотеку из примерно 50 специализированных программных модулей. Вместо того чтобы пытаться создать «универсальный ИИ», компания фокусируется на узких задачах .
Технологические особенности моделей:
- Скелетные модели: Система строит математическую модель человеческого скелета. Это позволяет определять сложные действия: держится ли человек за поручень на лестнице, участвует ли в драке или бежит .
- Точность из коробки: Благодаря доступу к данным с 3,5 млн камер в 56 странах, модели ISS на 90% готовы к работе в любых условиях освещения и ракурсах сразу после установки .
- Обучение на данных: Пауэлл приводит пример курьёзного, но трагичного случая с конкурентами-стартапами. Они обучали модель падения человека, заставляя сотрудников падать и перекатываться перед камерой. Однако когда у реального посетителя случился сердечный приступ, система его не распознала, так как он упал «не по сценарию» .
🏙️ Мехико и «умные города»: 60 000 камер в одной сети 32:04
Самым масштабным примером внедрения технологий ISS является Мехико. Это одна из сложнейших муниципальных систем безопасности в мире .
Инфраструктура Мехико включает:
- 60 000 камер, интегрированных в единую сеть.
- 10 000 модулей детектирования бега и агрессивного поведения .
- 1 000 систем распознавания лиц и 1 000 систем LPR для контроля транспорта.
- 13 000 киосков экстренной связи с двусторонней видеосвязью и круглосуточным медицинским центром, где дежурят 30 специалистов .
По словам Пауэлла, помимо безопасности, города всё чаще используют ИИ для транспортного планирования (ITS). Аналитика позволяет выявлять «почти случившиеся» аварии (near misses), когда пешеходы переходят дорогу в неположенном месте из-за неудобного расположения остановок, и корректировать городскую среду .
🏥 Применение в медицине и бизнесе 35:42
Помимо охраны правопорядка, ИИ-видеонаблюдение активно проникает в специализированные ниши:
- Здравоохранение (Virtual Care): Камеры в палатах больниц отслеживают, не упал ли пациент с кровати и не покинул ли он зону самовольно. Это критически важно для предотвращения травм и контроля пациентов с деменцией .
- Сельское хозяйство: Пауэлл упоминает системы для животноводческих ферм, которые распознают начало родов у коров и свиней по специфическому поведению, отправляя уведомление фермеру ночью .
- Промышленная безопасность: Детекция средств индивидуальной защиты (каски, жилеты) и контроль опасных зон.
👤 Биометрия: мифы и реальные возможности 54:04
Мэтт Пауэлл развеял некоторые мифы о распознавании лиц, подчеркнув технические требования и этические аспекты.
- Правило 60 пикселей: Для надёжной идентификации лица системе необходимо минимум 60 пикселей между бровями человека. Современные 2-мегапиксельные камеры позволяют добиться этого на расстоянии до 3 метров .
- Распознавание паттернов: Пауэлл предпочитает термин «распознавание паттернов», а не «лиц». Система ISS способна преобразовать 2D-изображение из соцсетей в 3D-биометрическую модель, анализируя уникальные кривые скул и расстояние между узлами лица .
- Универсальность: Те же алгоритмы, что распознают лица, могут быть обучены распознавать рисунок ушной раковины или даже отличать огурцы от моркови (запрос от конных заводов, чтобы следить за рационом лошадей) .
Мэтт Пауэлл убежден, что в ближайшие пять лет нас ждёт взрывной рост возможностей «подключённого транспорта» (V2X). Видеоаналитика будет напрямую взаимодействовать с автомобилями, предупреждая водителей о пешеходах за углом и автоматически управляя светофорами для оптимизации трафика .