Фатих Порикли о будущем ИИ: от автономных авто до мобильного ИИ

The TWIML AI Podcast 552 57 мин 2 мин 26.06.2023
Главное

Инновации в компьютерном зрении: Оптимизация данных и архитектур от Qualcomm AI 2:55

Исследовательская команда Qualcomm AI представила ряд передовых разработок на конференции CVPR, сфокусировавшись на двух ключевых направлениях: эффективном использовании данных для обучения и создании оптимизированных архитектур нейронных сетей. Как отмечает Фатих Порикли, старший директор по технологиям Qualcomm AI, современный прогресс в области компьютерного зрения и генеративного ИИ требует решений, которые не только показывают высокую точность, но и способны эффективно работать на граничных (edge) устройствах — смартфонах и мобильных гаджетах.

📊 Максимизация потенциала данных 3:06

Одной из главных проблем машинного обучения является нехватка размеченных данных, особенно для таких задач, как оценка движения (optical flow). Исследователи предложили инновационные методы аугментации, которые позволяют обходиться меньшим количеством реальных меток.

🏗️ Оптимизированные архитектуры для граничных устройств 7:12

Для работы на смартфонах ИИ-модели должны быть низкопотребляющими и экономными с точки зрения памяти, сохраняя при этом точность «тяжелых» серверных систем.

🤖 Генеративный ИИ на вашем смартфоне 48:31

Важным достижением стала демонстрация работы модели ControlNet непосредственно на мобильном устройстве. В отличие от классического Stable Diffusion, где генерация идет из случайного шума, ControlNet позволяет пользователю задавать структуру (позу, контуры, глубину) с помощью референсного изображения.

По словам Фатиха Порикли, компании удалось оптимизировать эту массивную модель (1,5 млрд параметров) таким образом, что она генерирует качественное изображение менее чем за 5 секунд на Android-смартфоне. Это не только обеспечивает высокую скорость, но и гарантирует приватность пользователя, так как обработка происходит локально, без обращения к облачным серверам.

💬 Цитаты

«Wherever there is video, Optical flow is an essential task that we need to do.»

Фатих Порикли 13:31

«The accuracy of this smaller Network can achieve can be at the same level as the teacher.»

Фатих Порикли 38:20
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Optical Flow
Задача компьютерного зрения по определению вектора перемещения каждого пикселя между кадрами видео.
Knowledge Distillation
Процесс обучения компактной модели («ученика») на основе знаний более крупной и мощной модели («учителя»).
Catastrophic Forgetting
Проблема нейросетей, при которой изучение новой информации приводит к полной потере навыков, приобретенных ранее.
Zero-shot learning
Способность модели решать задачи, для которых она не проходила специальное обучение на примерах.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Qualcomm AI Computer Vision Knowledge Distillation Generative AI ControlNet