Ян Лекун: «Самообучение — это темная материя интеллекта»

Yannic Kilcher 105 тыс. 58 мин 3 мин 11.03.2021
Главное

Самообучение: «Темная материя» интеллекта и будущее ИИ 0:00

Ян Лекун и Ишан Мишра из исследовательской лаборатории Facebook AI (FAIR) в своем блог-посте представили концепцию самообучения (Self-Supervised Learning) как ключевой способ достижения «здравого смысла» у ИИ. В отличие от классического обучения с учителем, которое требует колоссальных объемов размеченных данных, самообучение позволяет нейросетям извлекать знания непосредственно из самих данных, что критически важно для создания универсальных моделей. По мнению ведущего канала Янника Килчера, данный подход — это попытка синтезировать разрозненные идеи исследователей Meta в единую дорожную карту развития машинного обучения.

Почему классический подход зашел в тупик? 1:20

Современный ИИ, обучаемый методами обучения с учителем, демонстрирует высокую эффективность в узкоспециализированных задачах, но сталкивается с рядом ограничений.

Авторы статьи утверждают, что биологический интеллект обладает «здравым смыслом» — фоновыми знаниями о законах физики и структуры мира, которые мы приобретаем через постоянные наблюдения. Этот «здравый смысл» называют «темной материей» искусственного интеллекта.

Механика самообучения: предсказание скрытого 7:31

Самообучение — это не «обучение без учителя», а способ автоматической генерации меток (supervisory signals) из самих данных. Базовая формула выглядит так: мы скрываем часть данных и заставляем модель предсказать их на основе оставшейся «видимой» части.

Примеры реализации:

  1. NLP (текст): Модель типа BERT маскирует слово в предложении («Это — кот»), и задача ИИ — предсказать пропущенный элемент. Здесь пространство возможных ответов ограничено словарем, что позволяет модели выдавать вероятностное распределение и оценивать неуверенность.
  2. Видео: Предсказание будущих кадров на основе прошлых или заполнение пропущенных фрагментов видеоряда.

Идея состоит в том, что если модель научится предсказывать будущее состояние мира, она неминуемо «впитает» структуру этого мира, создав мощные репрезентации данных. Такие репрезентации позволяют адаптироваться к новым задачам с минимальным количеством примеров.

Проблема размерности и неопределенности 18:04

Перенос успехов из области текста в область компьютерного зрения сталкивается с фундаментальными препятствиями.

Энергетические модели и борьба с коллапсом 26:52

Ян Лекун предлагает рассматривать самообучение через призму энергетических моделей (Energy-Based Models, EBM), где ИИ оценивает «совместимость» объектов (например, кадра из прошлого и кадра из будущего). Низкая энергия означает высокую совместимость, высокая — несовместимость.

В компьютерном зрении популярны сиамские сети, где модель учится тому, что разные кропы (фрагменты) одного изображения должны иметь похожие репрезентации. Однако такие сети склонны к «коллапсу» — состоянию, при котором модель игнорирует входные данные и выдает идентичные ответы для всего.

Чтобы избежать коллапса, используются:

Путь вперед: латентные переменные 44:33

Авторы полагают, что будущим самообучения станут предиктивные модели с латентными переменными. Суть подхода в добавлении переменной $z$ (скрытой переменной), варьируя которую, модель может генерировать множество правдоподобных вариантов будущего.

Это решение позволяет:

В конце статьи Лекун упоминает модель SEER — огромную нейросеть, обученную на миллиарде изображений из Instagram. Несмотря на критику ведущего по поводу доступности таких мощностей, это демонстрирует готовность FAIR масштабировать методы самообучения на неразмеченные данные в глобальных масштабах.

💬 Цитаты

«Common sense is the dark matter of artificial intelligence.»

«Intelligence is the efficiency with which you transform new data into new skills.»

Франсуа Шоле (цит. Янником Килчером) 03:22
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Self-Supervised Learning
Метод обучения ИИ, при котором система создает метки (сигналы) для обучения самостоятельно, основываясь на скрытых или предсказуемых частях данных.
Energy-Based Model (EBM)
Архитектура, оценивающая совместимость входных данных через числовую величину — энергию; низкая энергия означает, что данные подходят друг другу.
Латентные переменные (Latent Variables)
Ненаблюдаемые переменные, которые позволяют модели варьировать свои предсказания и учитывать неопределенность мира.
Контрастивное обучение
Метод обучения, при котором модель притягивает репрезентации похожих объектов и отталкивает репрезентации различных.
Коллапс (Collapse)
Нежелательное явление в обучении, когда модель начинает выдавать одинаковый выход для всех входных данных.
📊 Цифры
🗓 Хронология
  1. 1996 Публикация работы по разреженному кодированию (sparse modeling).
  2. 2026-05 Дата публикации видеообзора статьи о самообучении.
⚖️ Другая сторона
Искусственный интеллект Self-Supervised Learning Yann LeCun Meta FAIR Energy-Based Models Computer Vision