История сверточных сетей: от забытых патентов до революции ImageNet

DeepLearning.AI 23,1 тыс. 27 мин 5 мин 04.04.2018
Главное

В рамках серии интервью «Heroes of Deep Learning» от DeepLearning.AI основатель проекта Эндрю Ын беседует с Яном Лекуном — одним из главных архитекторов современного искусственного интеллекта. В ходе беседы Лекун раскрывает историю становления сверточных нейронных сетей, вспоминает «зимы ИИ» и объясняет, почему открытость исследований в крупных корпорациях важнее защиты интеллектуальной собственности.

🧠 Истоки: от «Космической одиссеи» до споров философов 0:03

Путь Яна Лекуна в науку начался с детского увлечения вопросами возникновения интеллекта и биологической эволюции человека . Как вспоминает учёный, ключевое влияние на него оказал фильм «2001 год: Космическая одиссея», где были показаны разумные машины и космические путешествия . Однако настоящий научный интерес проснулся во время учёбы на втором курсе инженерного факультета, когда он случайно наткнулся на книгу о философских дебатах 1980-го года между лингвистом Ноамом Хомским и психологом Жаном Пиаже .

В этой дискуссии обсуждались природа и воспитание (nature vs nurture). На стороне Пиаже выступал Сеймур Пейперт из MIT, который упоминал модель перцептрона — одну из первых обучаемых машин . Ян Лекун утверждает, что до этого момента никогда не слышал о перцептронах, но идея машины, способной к обучению, мгновенно его захватила. Он начал искать литературу в университетских библиотеках и обнаружил, что активные исследования в этой области прекратились ещё в конце 60-х годов .

🧪 Рождение алгоритма обратного распространения ошибки 3:37

К моменту окончания инженерного образования Ян Лекун уже понимал, что ключевая нерешенная проблема в литературе 60-х — обучение нейронных сетей с несколькими слоями . В начале 80-х интерес к нейросетям сохраняли лишь небольшие группы физиков и психологов; для инженеров и компьютерных специалистов эта тема считалась «неприличной» .

Важные вехи в становлении теории по версии Лекуна:

🏗️ Эпоха Bell Labs и создание LeNet 7:35

В октябре 1988 года Ян Лекун присоединился к AT&T Bell Labs. По его словам, это было «золотое время» для исследований. Его руководитель Ларри Джекел перед выходом Лекуна на работу спросил, какой компьютер ему нужен. Ян попросил мощную рабочую станцию Sun 4, которая тогда была редкостью. Джекел заказал её, мотивируя это фразой: «В Bell Labs не становятся знаменитыми, экономя деньги» .

Основные достижения этого периода:

  1. Работа с данными: У команды был доступ к базе данных USPS (Почтовая служба США), содержащей 5 000 образцов рукописных цифр .
  2. Эволюция архитектуры: Первая версия сверточной сети была создана в течение трех месяцев. Из-за нехватки вычислительных мощностей в ней не было отдельных слоев пулинга (pooling) — субдискретизация происходила прямо во время свертки .
  3. LeNet-1: Вторая версия уже имела раздельные слои свертки и пулинга, став классической архитектурой .

Ян Лекун отмечает, что успех LeNet долгое время оставался локальным. В конце 80-х — начале 90-х не было интернета в современном понимании, не существовало Python или MATLAB. Лекуну и его коллеге Леону Ботту пришлось полтора года писать собственный симулятор нейросетей и интерпретатор языка Lisp, чтобы управлять вычислениями .

📉 Корпоративный раскол и «зима» нейросетей 14:14

Несмотря на технологический триумф — систему LeNet внедрили в банках для распознавания чеков — в 1995 году проект столкнулся с бюрократической катастрофой. Корпорация AT&T объявила о разделении на три компании: AT&T, Lucent Technologies и NCR .

По словам Лекуна, это привело к абсурдной ситуации:

Этот период (примерно с 1995 по 2002 годы) Лекун называет «темными временами», когда интерес к нейросетям в научном сообществе практически исчез . Сам Ян в это время переключился на проект DjVu — технологию сжатия отсканированных документов, которая позже использовалась для оцифровки архивов конференций NIPS .

🚀 Революция ImageNet 2012 года 19:55

Переломным моментом для всей индустрии стал воркшоп ImageNet на конференции ECCV во Флоренции в конце 2012 года . Команда Алекса Крижевского и Джеффри Хинтона победила в конкурсе с огромным отрывом, используя сверточные нейросети (AlexNet).

Ян Лекун вспоминает, что большинство молодых специалистов по компьютерному зрению на тот момент даже не знали, что такое сверточные сети . Когда Крижевский выступал с докладом, аудитория была потрясена. Лекун считает этот воркшоп «определяющим моментом», который изменил мнение всего сообщества компьютерного зрения .

🏛️ Философия FAIR: наука без секретов 21:26

Сегодня Ян Лекун совмещает работу профессора в Нью-Йоркском университете (NYU) и руководство лабораторией фундаментальных исследований ИИ в Facebook (FAIR). Он утверждает, что при создании FAIR поставил условие полной открытости исследований .

По мнению Лекуна, эффективная корпоративная лаборатория должна строиться на следующих принципах:

💡 Советы будущим исследователям 25:34

Для тех, кто хочет войти в сферу ИИ сегодня, Ян Лекун дает практический совет: «Сделайте себя полезными» .

Он рекомендует:

  1. Участвовать в проектах с открытым исходным кодом (Open Source) .
  2. Выбрать важную научную статью, реализовать описанный в ней алгоритм, если его кода нет в сети, и выложить реализацию в открытый доступ .
  3. Такой подход, по утверждению Лекуна, — лучший способ получить приглашение в престижную PhD-программу или оффер в компанию мечты .
💬 Цитаты

«В Bell Labs вы не станете знаменитыми, экономя деньги.»

Ларри Джекел (в пересказе Лекуна) 09:30

«Для инженеров и специалистов по информатике в начале 80-х было неприлично говорить о нейронных сетях.»

«Если вы хотите попасть в эту сферу — сделайте себя полезными через вклад в открытый код.»

👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Перцептрон
Математическая модель восприятия информации мозгом, одна из первых форм нейронных сетей.
Backpropagation
Алгоритм обратного распространения ошибки, используемый для обучения многослойных нейронных сетей.
ConvNet (Сверточная сеть)
Архитектура нейросетей, эффективно распознающая визуальные образы за счет иерархической структуры.
FAIR
Facebook AI Research — лаборатория фундаментальных исследований искусственного интеллекта компании Meta.
📊 Цифры
🗓 Хронология
  1. 1980 Лекун находит книгу о дебатах Хомского и Пиаже, открывая для себя нейросети.
  2. 1985 Встреча с Терри Сейновски и Джеффри Хинтоном; признание независимого открытия backprop.
  3. 1988 Начало работы в Bell Labs и создание первой версии LeNet.
  4. 1995 Разделение AT&T, приведшее к потере контроля над патентами на нейросети.
  5. 2012 Воркшоп ImageNet на ECCV во Флоренции — мировое признание сверточных сетей.
  6. 2013 Лекун возглавляет созданную лабораторию Facebook AI Research (FAIR).
⚖️ Другая сторона
Искусственный интеллект Ян Лекун LeNet Facebook AI Research DeepLearning.AI Convolutional Neural Networks