Ишан Мисра о будущем AI: «Здравый смысл — это темная материя»

Machine Learning Street Talk 25 тыс. 1 ч 36 мин 3 мин 21.06.2021
Главное

Самообучающееся компьютерное зрение: почему «темная материя» данных — ключ к интеллекту 0:00

В современном машинном обучении доминирует подход, основанный на использовании огромных массивов размеченных человеком данных. Однако исследователь в области компьютерного зрения Ишан Мисра (Ishan Misра) утверждает, что этот путь ведет в тупик. По мнению Мисры, самообучающееся (self-supervised) обучение позволяет машинам самостоятельно выявлять структуру данных, избегая дорогостоящей и часто предвзятой ручной разметки. Этот подход постепенно закрывает разрыв между качеством представлений (representation learning) в задачах компьютерного зрения и в области обработки естественного языка (NLP).

🧠 Почему классическое обучение «жульничает» 6:30

Классическое контролируемое обучение (supervised learning) гость сравнивает с «жульничеством на экзамене», где модель заранее знает, какие вопросы будут заданы.

Самообучающееся обучение предлагает альтернативу: машина сама создает обучающие сигналы из структуры самих данных, предсказывая скрытые или будущие отношения.

🛠 Секретный ингредиент: аугментация данных 7:19

На текущем этапе развития дисциплины аугментация данных — это не просто хак для борьбы с переобучением, а ключевой обучающий сигнал.

🚀 Прорывные архитектуры: DINO, Barlow Twins и PAWS 12:31

В последние годы команда Facebook AI Research представила несколько фундаментальных работ в области самообучающегося обучения.

🌌 «Темная материя» интеллекта 15:49

Совместно с Яном Лекуном (Yann LeCun), Ишан Мисра развивает гипотезу о том, что здравый смысл (common sense) — это «темная материя» интеллекта.

Однако гость признает: текущие модели — лишь «первые шаги». Они учат семантику сходства (эти два изображения похожи), но до понимания глубоких абстракций, которыми оперирует человеческое мышление, предстоит пройти долгий путь, возможно, длиною в десятилетия.

💬 Цитаты

«Самообучающееся обучение — это способ избавить модели от человеческой предвзятости.»

Ишан Мисра 26:03

«Контролируемое обучение — это как жульничество на экзамене, где модель заранее знает вопросы.»

Ишан Мисра 06:42

«Мы пытаемся научить модели узнавать фундаментальные свойства изображений, которые не меняются при искажениях.»

Ишан Мисра 04:04
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Self-supervised learning
Метод обучения, при котором модель сама создает обучающие сигналы из структуры данных без участия человека.
Augmentation
Искусственное изменение данных (например, обрезка, поворот, цветовая коррекция) для обучения модели инвариантности.
Mode collapse
Проблема в нейросетях, когда модель перестает различать входные данные и выдает постоянный тривиальный результат.
Latent predictive models
Модели, использующие скрытые переменные для предсказания различных возможных состояний будущего в условиях неопределенности.
Energy-based models
Подход, при котором задача обучения сводится к минимизации энергии (функции) состояния системы.
📊 Цифры
🗓 Хронология
  1. 2016 Создание модели Shuffle and Learn.
  2. 2019 Появление momentum encoders и рост использования ResNet.
  3. 2021 Выпуск работ DINO, Barlow Twins и PAWS.
⚖️ Другая сторона
Искусственный интеллект Self-supervised learning Ishan Misra Computer vision Facebook AI Research Vision Transformers