Христос Луизос: «Обучение нейросетей на смартфонах сэкономит бюджет приватности»

The TWIML AI Podcast 582 40 мин 4 мин 01.05.2023
Главное

Лид: В рамках подкаста The TWIML AI Podcast исследователь Христос Луизос (Christos Louizos) из Qualcomm AI Research представил инновационный метод оптимизации гиперпараметров через партиционирование (разделение) нейронных сетей. Разработка направлена на решение критических проблем федеративного обучения: высокого расхода трафика, энергопотребления и истощения «бюджета приватности» при многократных итерациях обучения на мобильных устройствах.

🧠 Эффективность федеративного обучения: проблема ресурсов и приватности 4:00

Традиционные методы оптимизации гиперпараметров, такие как случайный поиск (random search) или поиск по сетке (grid search), требуют многократного повторения процесса обучения . В условиях классического машинного обучения это допустимо, однако для федеративного обучения (Federated Learning) на периферийных устройствах (Edge devices) такой подход неприемлем по нескольким причинам:

🧩 Механизм партиционирования нейронной сети 8:00

Предложенный Христосом Луизосом метод опирается на концепцию предельного правдоподобия (marginal likelihood). Основная идея заключается в том, что оптимальные гиперпараметры позволяют модели обучаться максимально быстро и эффективно обобщать знания .

Алгоритм работает следующим образом:

  1. Разделение данных и модели: Набор данных и нейронная сеть делятся на $K$ непересекающихся частей (партиций) .
  2. Формирование подсетей: Подсети $(\text{sub-networks})$ определяются случайным выбором подмножества параметров для каждого слоя .
  3. Иерархическая структура: Подсети организованы по принципу матрешки. Первая подсеть обучается на первом фрагменте данных. Вторая подсеть является надмножеством первой и обучается на втором фрагменте, сохраняя информацию о первом . Последняя, $K$-я подсеть, представляет собой полную модель, обученную на всём наборе данных .
  4. Валидация «внутри» цикла: Части данных, которые не видела конкретная подсеть, используются как валидационные для оценки способности к обобщению. Этот сигнал используется для корректировки гиперпараметров прямо в процессе одного цикла обучения .

В ходе экспериментов было установлено, что инициализация неиспользуемых параметров случайными значениями работает лучше, чем их обнуление (sparsity) . Хотя разреженность была бы выгоднее для энергоэффективности, эмпирические данные показали преимущество стандартной случайной инициализации.

📊 Результаты и бенчмарки на наборах данных Vision 16:00

Для проверки эффективности алгоритма использовались стандартные наборы данных для компьютерного зрения: CIFAR-10, Tiny ImageNet и варианты MNIST .

Особое внимание уделили оптимизации гиперпараметров аффинных аугментаций (вращение, сдвиг). В эксперименте с Rotated CIFAR-10 (где изображения были предварительно повернуты) модель должна была самостоятельно «найти» правильный угол поворота как гиперпараметр, чтобы восстановить точность .

Ключевые выводы:

🛰️ Обзор других исследований Qualcomm на ICLR 26:31

Христос Луизос также кратко осветил другие работы коллег, принятые на конференцию ICLR:

🔮 Будущее федеративного обучения 38:44

В завершение беседы Христос Луизос выделил два главных вызова для индустрии:

  1. Отсутствие меток: Сейчас федеративное обучение хорошо работает там, где пользователь неявно маркирует данные (например, автодополнение текста). Для классификации изображений нужно научиться эффективно обучать модели на неразмеченных данных с мобильных устройств .
  2. Снятие ограничений по питанию: Текущие стандарты требуют подключения к Wi-Fi и зарядке для начала обучения. Цель Qualcomm — оптимизировать пайплайны настолько, чтобы обучение могло происходить на ходу, используя мобильный интернет и заряд батареи, не доставляя дискомфорта пользователю .
💬 Цитаты

«Каждый раз, когда вы сообщаете что-то о своих данных, вы раскрываете информацию о них. В итоге вы тратите большую часть своего бюджета приватности.»

Христос Луизос 06:48

«Мы хотим двигаться в направлении, где можно будет обучать модели прямо на батарее и передавать данные через мобильную связь.»

Христос Луизос 40:03
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Федеративное обучение
Метод машинного обучения, при котором модель тренируется на множестве децентрализованных устройств без обмена исходными данными.
Гиперпараметры
Настройки алгоритма обучения (например, скорость обучения или параметры аугментации), которые задаются до начала процесса.
Бюджет приватности
Математическая мера риска раскрытия личных данных при использовании дифференциальной приватности.
NeRF
Нейронные поля сияния, метод генерации 3D-сцен на основе набора 2D-изображений с помощью нейросетей.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Христос Луизос Qualcomm AI Research Federated Learning ICLR Hyperparameter Optimization