Илья Суцкевер о природе разума, триумфе глубокого обучения и этике AGI

Lex Fridman 854 тыс. 1 ч 37 мин 5 мин 08.05.2020
Главное

В глубоком и вдумчивом диалоге с Лексом Фридманом Илья Суцкевер, сооснователь и шеф-ученый OpenAI, размышляет о природе интеллекта, эволюции нейронных сетей и будущем, где границы между биологическим и цифровым разумом становятся все более прозрачными. Статья исследует путь от первых прорывов в глубоком обучении до философских вопросов ответственности перед лицом грядущего сверхинтеллекта.

🧠 Генезис революции: от AlexNet до глубокого обучения 2:23

История современного искусственного интеллекта (ИИ) во многом началась с убежденности в том, что масштаб имеет значение. Илья Суцкевер, один из авторов знаменитой статьи по архитектуре AlexNet , вспоминает, что в 2010–2011 годах ключевым стало соединение двух фактов. Первый — осознание возможности обучения глубоких сетей методом обратного распространения ошибки (backpropagation) «от начала до конца». Решающим моментом для Ильи стал 2010 год, когда Джеймс Мартенс изобрел оптимизатор Hessian-free, позволивший обучить 10-слойную сеть с нуля без предварительной подготовки .

На формирование интуиции Суцкевера повлияли следующие факторы:

По мнению гостя, успех глубокого обучения в это десятилетие объясняется не только алгоритмами, которые существовали десятилетиями, но и сочетанием трех факторов: огромных наборов данных, вычислительных мощностей (GPU) и «фанатичной убежденности» в том, что это сработает .

🧬 Мозг и искусственные нейроны: конвергенция систем 7:31

Размышляя о различиях между биологическими и искусственными нейронными сетями, Суцкевер отмечает как сильные, так и слабые стороны обеих систем. Хотя мозг использует спайки (импульсы), Илья выражает сомнение в том, что это критически важное архитектурное преимущество . Он полагает, что исследователи спайковых сетей зачастую просто пытаются имитировать стандартные глубокие сети через импульсы, что не дает качественного скачка.

Ключевые отличия и сходства, по мнению Суцкевера:

  1. Функция потерь: Концепция единой целевой функции — великая идея, позволяющая математически рассуждать о поведении системы . Собеседники сравнили это с биологической эволюцией и экономикой, где «функция потерь» является скорее эмерджентным свойством процесса, а не жестко заданной константой .
  2. Временная динамика: Ведущий отметил, что мозг работает в непрерывном времени, тогда как нейросети дискретны. Суцкевер признает прогресс рекуррентных сетей (RNN), но подчеркивает, что сегодня их вытеснили трансформеры .
  3. Единство принципов: Гость утверждает, что сегодня в машинном обучении существует высокая степень унификации. Идеи, улучшающие компьютерное зрение, быстро адаптируются для обработки естественного языка (NLP) и обучения с подкреплением (RL) .

Илья Суцкевер полагает, что однажды все задачи ИИ могут быть объединены в рамках единой архитектуры — «одного большого черного ящика», куда можно подавать любые данные, и он сам разберется, что с ними делать .

📝 Язык, смысл и GPT-2 56:44

Одной из самых обсуждаемых тем стал вопрос: понимают ли языковые модели смысл или просто ищут статистические закономерности. Суцкевер вступает в заочную дискуссию с Ноамом Хомским, утверждая, что семантика — это естественное следствие глубокого синтаксического анализа .

В качестве доказательства Илья приводит исследование OpenAI по «нейрону настроения» (sentiment neuron) . При увеличении размера LSTM-сети с 500 до 4000 ячеек, один из нейронов самопроизвольно начал отвечать за определение позитивного или негативного окраса текста. Это указывает на то, что модель «вынуждена» изучать семантику, когда исчерпывает возможности предсказания следующего слова на уровне чистого синтаксиса .

Особенности GPT-2 и трансформеров:

Гость согласен с тем, что современным моделям все еще не хватает «активного обучения» — способности самостоятельно выбирать, какие данные изучать, а какие отвергать, подобно людям .

🏛 Ответственность и «стадия взросления» ИИ 1:09:09

Обсуждая решение OpenAI о поэтапном выпуске GPT-2 из-за опасений по поводу дезинформации, Суцкевер подчеркивает, что область ИИ выходит из стадии «детства» в стадию «зрелости» .

Илья утверждает:

🌌 Путь к AGI и смыслу жизни 1:13:48

Для достижения сильного искусственного интеллекта (AGI), по мнению Суцкевера, потребуется глубокое обучение в сочетании с несколькими новыми идеями. Одной из них является самообучение в процессе игры (self-play). На примере AlphaZero и экспериментов OpenAI с агентами, играющими в прятки, Илья отмечает способность систем находить креативные решения, которые удивляют даже создателей .

Относительно будущего и контроля:

В завершение беседы, отвечая на вопрос о смысле жизни, Илья философски замечает, что мы существуем на маленькой планете, и это само по себе чудо . Его личный рецепт счастья кроется не в академических успехах и цитированиях, а в способности менять угол зрения на привычные вещи, будь то простая еда или разговор с человеком .

💬 Цитаты

«Нейронные сети — это поиск коротких программ. Если вы найдете кратчайшую программу, описывающую данные, вы сможете делать лучшие предсказания.»

Илья Суцкевер 46:20

«Я верю с высочайшей убежденностью, что можно спроектировать AGI так, чтобы у него было глубокое внутреннее стремление помогать людям процветать.»

Илья Суцкевер 1:29:06

«Счастье во многом зависит от того, как мы смотрим на вещи. Можно съесть простую еду и быть счастливым, а можно разочароваться, что она не была лучше.»

Илья Суцкевер 1:35:49
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
AlexNet
Архитектура сверточной нейронной сети, чей успех на конкурсе ImageNet в 2012 году запустил современную волну интереса к глубокому обучению.
Backpropagation
Метод обратного распространения ошибки, основной алгоритм обучения нейронных сетей.
AGI
Сильный искусственный интеллект, способный выполнять любую интеллектуальную задачу на уровне человека или выше.
Трансформер
Архитектура нейросетей, использующая механизм внимания, ставшая стандартом для обработки текстов.
📊 Цифры
🗓 Хронология
  1. 2010 Джеймс Мартенс изобрел Hessian-free оптимизатор, доказав возможность обучения глубоких сетей с нуля.
  2. 2012 Публикация статьи об AlexNet, ознаменовавшая прорыв в компьютерном зрении.
  3. 2019 Выпуск и обсуждение стратегии релиза языковой модели GPT-2.
⚖️ Другая сторона
Искусственный интеллект Ilya Sutskever OpenAI Deep Learning AGI GPT-2