Янник Кильхер о VOS: «Метод работает, но вопросы остались»

Yannic Kilcher 14,3 тыс. 35 мин 2 мин 13.03.2022
Главное

🧠 Борьба с «неизвестным»: Virtual Outlier Synthesis (VOS) 4:01

В современном машинном обучении одна из критических проблем — распознавание данных, которые выходят за рамки обучающей выборки (out-of-distribution, OOD). Ведущий канала Янник Кильхер (Yannic Kilcher) детально разобрал работу «Learning What You Don't Know by Virtual Outlier Synthesis», авторы которой — Шифан До, Цзюнин Ван, Му Тай и Ишань Ли — предлагают новый метод генерации «виртуальных выбросов» для повышения безопасности нейросетей.

🚫 Проблема «высокой уверенности» в неизвестном 6:27

Традиционные классификаторы обучаются разделять классы внутри заданного набора данных. Янник Кильхер отмечает, что в пространстве признаков это выглядит как проведение линейных границ.

Кильхер указывает, что создание полноценной генеративной модели, которая «знала» бы, где данных нет, требует огромных вычислительных ресурсов и может негативно повлиять на основную задачу классификации.

🛠 Метод VOS: синтез виртуальных выбросов 16:58

Авторы статьи предлагают более изящное решение: генерировать «виртуальные выбросы» (virtual outliers) непосредственно в латентном пространстве (предпоследний слой сети), а не в исходном пиксельном пространстве.

  1. Гауссово моделирование: В процессе обучения модель вычисляет эмпирическое среднее значение и ковариацию для каждого класса, предполагая, что данные распределены по многомерному нормальному закону.
  2. Сэмплирование: Из этих распределений синтезируются точки, которые находятся «далеко» от центров классов (с низкой вероятностью).
  3. Обучение классификатора: Сеть учится проводить границы не только между известными классами, но и отсекать эти виртуальные выбросы.

📉 Математика уверенности и функция потерь 27:11

В качестве меры неопределенности используется так называемая «свободная энергия» (отрицательная логарифмическая функция раздела).

🧪 Критика и вопросы от Янника Кильхера 22:55

Несмотря на успешные результаты на бенчмарках (например, уменьшение числа ложноположительных срабатываний), Янник Кильхер высказывает ряд сомнений:

В заключение, Янник Кильхер отмечает, что, несмотря на теоретические вопросы, метод демонстрирует высокую практическую эффективность, что делает его крайне интересным инструментом для систем, где цена ошибки (safety-critical applications) очень высока.

💬 Цитаты

«Outliers we all know them, we all hate them. How can these data points just be out of distribution not in the training data?»

Янник Кильхер 00:01

«If this really works, this could mean a lot for especially for safety critical applications.»

Янник Кильхер 04:28
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Out-of-distribution (OOD)
Данные, которые модель не видела в процессе обучения и которые статистически отличаются от обучающей выборки.
Латентное пространство
Скрытое представление данных внутри нейросети, полученное после обработки входной информации слоями сети.
UMAP
Алгоритм для нелинейного снижения размерности данных, часто используемый для визуализации высокоразмерных признаков.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект VOS Yannic Kilcher Virtual Outlier Synthesis Out-of-Distribution Detection