NeurIPS 2023: Уязвимости ИИ, проблемы детерминизма и методы обучения

Передовые исследования в области ИИ: итоги постерной сессии NeurIPS 2023 🔬 0:02

Вечерняя постерная сессия на конференции NeurIPS 2023 стала площадкой для демонстрации прорывных идей в машинном обучении — от методов обхода защиты нейросетей до проблем детерминизма вычислений. Янник Кильхер провел репортаж с мероприятия, пообщавшись с исследователями об их работах, которые затрагивают фундаментальные уязвимости и ограничения современных алгоритмов.

🛡️ Камуфляжные адверсариальные патчи 1:20

Одной из тем обсуждения стали адверсариальные патчи — специально созданные изображения, которые при наложении на объект заставляют ИИ-модели ошибаться в классификации. Участник по имени Феникс представил работу, посвященную «камуфлированным» патчам.

Суть проблемы: Большинство существующих методов создания адверсариальных атак создают визуально заметные искажения, которые легко обнаруживаются системами защиты.
Решение: Авторы разработали подход, который маскирует патч под элементы изображения (например, одежду человека), делая его невидимым для человеческого глаза и трудным для детекции нейросетями.
Метод: Используется эволюционный алгоритм, который оптимизирует расположение, размер, цвет и прозрачность патча до достижения «бюджета» атаки, за которым искажение становится критическим для модели.
Результаты: Эмпирические исследования подтверждают, что даже при малых изменениях отдельных областей изображения удается успешно «обмануть» передовые системы распознавания.

Исследователи рассматривают это как промежуточный этап: текущие результаты получены на цифровом уровне, но работа уже ведется над переносом метода в физическую среду.

🔄 Непрерывное обучение без примеров (Exemplar-free Continual Learning) 5:00

Другой важный вопрос — как обучать модели новым классам данных, не забывая старые, при условии, что исходные данные предыдущих классов недоступны (exemplar-free). По словам исследователей, в индустрии это критично, так как невозможно постоянно хранить и переобучать модель на всем массиве данных клиентов.

Технический подход: Использование пространства эмбеддингов для представления классов. Вместо стандартного евклидова расстояния применяется расстояние Махаланобиса, учитывающее распределение данных в признаковом пространстве.
Стабильность против пластичности: Основная проблема «стабильности и пластичности» заключается в том, что при изучении нового (высокая пластичность) модель «забывает» старое (низкая стабильность), или наоборот.
Реализация: Из-за ограниченного количества обучающих примеров (например, 500 образцов на класс в CIFAR-100) исследователи применяют аппроксимацию ковариационных матриц для выполнения операций инверсии.

💻 Недетерминизм машинного обучения на разном «железе» 8:14

Исследовательницы Нора и Лейинг представили работу, демонстрирующую, что результаты инференса (вывода) нейросетей могут варьироваться в зависимости от используемого аппаратного обеспечения.

Проблема: Даже при одинаковых входных данных инференс на разных CPU или GPU дает разные результаты. Это вызвано особенностями выполнения операций с плавающей запятой, которые не являются ассоциативными: порядок их выполнения (агрегации) меняется при использовании разных инструкций или количества ядер.
Масштаб: В исследовании проанализировано 75 различных платформ, на которых было зафиксировано 26 различных результатов для одного и того же алгоритма.
GPU и рандомизация: На графических ускорителях ситуация сложнее: библиотеки акселераторов выбирают алгоритмы свертки «на лету» на основе микробенчмарков, что делает процесс недетерминированным даже на одном и том же GPU в разных сессиях.
Риски: Хотя для обычного пользователя погрешность в седьмом знаке после запятой не важна, в критических областях, таких как форензика, это может приводить к смене метки классификации. Исследователи подчеркивают, что такая ошибка в ранних слоях нейросети может значительно усиливаться в последующих слоях.

📈 Консервативная оценка функций ценности в офлайн-обучении 14:16

Последняя работа была посвящена методам обучения с подкреплением (Reinforcement Learning) в условиях, когда взаимодействие с реальной средой невозможно (офлайн-обучение).

Главная цель: Консервативная оценка функции ценности состояния (V-function) для обеспечения безопасности обучения.
Метод: Введение «бонусного члена» (bonus term), который позволяет модели немного исследовать область вне доступного набора данных, сохраняя при этом общую консервативность.
Выбор параметров: Оптимальный коэффициент штрафа (lambda) выбирается путем анализа функции потерь: слишком высокое значение делает обучение «небезопасным» и медленным.

Сравнительные тесты показывают, что предложенная консервативная оценка позволяет достичь более стабильной и эффективной производительности в различных средах.