Кимберли Тан: «Видеоаналитика перестраивает физический мир в 2024 году»

a16z (Andreessen Horowitz) 4,6 тыс. 12 мин 2 мин 26.12.2023
Главное

Новая эра компьютерного зрения: как видеоаналитика меняет физический мир 1:48

Технологии компьютерного зрения и видеоинтеллекта выходят на этап стремительного внедрения, становясь мощным инструментом для трансформации реального сектора экономики. Кимберли Тан, инвестиционный партнер в Andreessen Horowitz (a16z), полагает, что 2024 год станет переломным моментом, когда разрозненные инновации в области «железа», программного обеспечения и моделей искусственного интеллекта объединятся в масштабируемые бизнес-решения.

Смена парадигмы: от «программного обеспечения» к «физическому миру» 3:07

По мнению Тан, текущий тренд можно охарактеризовать как переход от концепции «программное обеспечение поглощает мир» к идее «программное обеспечение поглощает физический мир». Несмотря на повсеместное распространение камер — от смартфонов до систем видеонаблюдения на предприятиях — большая часть видеоданных сегодня существует пассивно и не анализируется.

Компании решают проблему отсутствия инфраструктуры с помощью комбинированной модели «оборудование + ПО». Успех такой стратегии уже доказан: например, компания Flock Safety выстроила крупный бизнес, поставляя собственные камеры и софт для обеспечения безопасности в жилых районах и школах. Теперь этот опыт планируется масштабировать на другие сектора:

Факторы «идеального шторма» 4:15

Эксперт выделяет четыре ключевых фактора, которые делают 2024 год временем для массового внедрения видеоаналитики:

  1. Снижение стоимости вычислений: Расходы на облачные вычисления падают, что делает обработку массивных потоков видеоданных экономически целесообразной.
  2. Развитие Edge Computing: Удешевление производительных чипов и рост качества камер позволяют запускать сложные модели ИИ непосредственно на устройствах, минимизируя затраты на передачу данных.
  3. Эволюция нейросетей: Использование архитектуры трансформеров (изначально созданной для языка) в задачах компьютерного зрения, таких как классификация объектов, значительно повысило эффективность распознавания.
  4. Развитие бизнес-моделей: Появление компаний-первопроходцев, таких как Flock Safety, предоставило новым стартапам готовые сценарии по выходу на сложные, «традиционные» рынки.

Новые сценарии применения 6:51

Внедрение интеллектуальных систем позволяет автоматизировать процессы, которые десятилетиями оставались ручными и неэффективными. Тан приводит конкретные примеры:

Приватность и этические границы 8:35

Обсуждая риски сценариев «Большого брата», Тан подчеркивает, что разработчики должны внимательно относиться к вопросам конфиденциальности. По её словам, существуют проверенные методы защиты прав пользователей:

Эксперт убеждена, что компании обязаны тесно сотрудничать с регуляторами и стейкхолдерами, чтобы технология воспринималась обществом не как инструмент слежки, а как способ улучшения качества жизни.

💬 Цитаты

«Я верю, что в 2024 году мы увидим новые применения компьютерного зрения и видеоинтеллекта в реальном мире.»

Кимберли Тан 01:48

«Это своего рода новый поворот в идее «программное обеспечение поглощает мир» — в данном случае программное обеспечение поглощает физический мир.»

Ведущий a16z 03:07
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Компьютерное зрение
Область ИИ, позволяющая компьютерам распознавать, анализировать и интерпретировать визуальные данные из видео и изображений.
Edge Computing
Вычисления на периферии, при которых данные обрабатываются непосредственно на устройстве или рядом с ним, а не в удаленном облаке.
Трансформеры
Архитектура нейронных сетей, которая совершила прорыв в обработке естественного языка и теперь успешно применяется в анализе изображений.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Computer Vision Flock Safety a16z Edge Computing