NeurIPS 2023: Инновации в ИИ от грамматик до коррекции данных

Yannic Kilcher 13,3 тыс. 57 мин 3 мин 26.12.2023
Главное

Инновации на NeurIPS 2023: от грамматик до исправления данных

На конференции NeurIPS 2023, крупнейшем мировом событии в области машинного обучения, ведущий канала Янник Кильхер (Yannic Kilcher) пообщался с исследователями, представившими свои работы. Темы варьировались от алгоритмов сегментации видео и адаптации нейросетей к новым условиям до коррекции искажений в данных и оптимизации обучения на множестве задач. Авторы представили подходы, которые позволяют улучшить производительность моделей, не прибегая к дорогостоящему переобучению с нуля.

🎥 Сегментация действий с помощью грамматик 1:05

Исследователи представили алгоритм для временной сегментации видео (temporal action segmentation), который решает проблему «ошибок контекста». Современные нейросети часто фокусируются только на визуальных признаках, из-за чего могут ошибочно классифицировать действия, не соответствующие общему смыслу видео (например, добавление горчицы в кофе).

🧠 Адаптация моделей: объединение генеративного и дискриминативного подходов 8:54

Существует два основных способа обучения восприятию: дискриминативный (bottom-up, например, классификаторы) и генеративный (top-down, например, Stable Diffusion). Дискриминативные модели лучше подгоняются под тренировочный набор, но генеративные часто лучше обобщают данные вне распределения (out-of-distribution).

📉 Эффективность обучения рекуррентных нейросетей 17:18

Работа посвящена вопросу: сколько данных нужно для обучения рекуррентных нейронных сетей (РНС)?

⚖️ Геометрия задач и Loki 39:30

Классификаторы часто делают ошибочное предположение, что все классы полностью независимы. Однако в реальности между ними есть связи (например, «кошка» и «собака» ближе друг к другу, чем «кошка» и «автобус»).

🛠 Исправление «зашумленных» данных (DataFix) 46:21

Системы часто сталкиваются с проблемой смещения признаков (feature shift) — например, когда данные из разных больниц или датчиков не стандартизированы.

💬 Цитаты

«Мы пытаемся решить проблему, когда нейросеть страдает от «ошибок вне контекста», концентрируясь только на визуальных признаках.»

Исследователь сегментации действий 01:19

«В онлайновом режиме адаптации можно улучшить производительность моделей на 20 пунктов, просто адаптируя их «на лету».»

Исследователь адаптации моделей 12:22
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Временная сегментация
Задача разделения непрерывного видео на отдельные смысловые сегменты действий.
Out-of-distribution (OOD)
Данные, которые существенно отличаются от тех, на которых обучалась модель.
Эквивариантность
Свойство модели предсказывать изменения данных при их трансформации (например, поворотах).
Импутация
Метод заполнения пропущенных или некорректных значений в наборах данных.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект NeurIPS Stable Diffusion DataFix ImageNet Machine Learning