Куок Ле о создании нейросетей и будущем NLP: от кота в Google до генеративных моделей

DeepLearning.AI 8,3 тыс. 40 мин 3 мин 13.10.2020
Главное

💡 Путь исследователя: Куок Ле о взлете глубокого обучения и будущем NLP 0:00

Исследователь Google Brain Куок Ле, прошедший путь от создания «игрушечных» чат-ботов в школе до разработки фундаментальных архитектур глубокого обучения, обсудил с Эндрю Ыном эволюцию нейронных сетей. В беседе затрагиваются ключевые моменты истории AI, включая легендарный проект «Google Cat», создание моделей Sequence-to-Sequence и перспективы генеративного ИИ.

🚀 От школьных чат-ботов до Google Brain 1:19

Карьера Куока Ле началась с увлечения искусственным интеллектом еще в старших классах школы во Вьетнаме. По словам исследователя, он пытался программировать простые системы на основе правил, имитирующие диалог, чтобы разыгрывать друзей. Несмотря на то что программы были несовершенными, этот опыт позволил ему осознать сложность создания по-настоящему «умного» ПО.

🐱 «Google Cat» и триумф обучения без учителя 8:04

Одним из самых знаковых достижений раннего периода Google Brain стал проект «Google Cat». Ле, будучи ведущим инженером, экспериментировал с автокодировщиками (auto-encoders), пытаясь обучить нейросеть восстанавливать входные изображения.

По мнению Ына, этот проект стал «иконой» обучения без учителя, хотя в те годы исследователи несколько переоценивали краткосрочную значимость этого подхода, недооценивая мощь обучения с учителем.

🗣️ Эволюция NLP: От Word2vec к Sequence-to-Sequence 12:10

Работа Ле над моделью Sequence-to-Sequence (Seq2Seq) кардинально изменила траекторию развития NLP. Идея родилась из попыток перевести векторные методы Томаша Миколова для слов на уровень целых предложений.

🤖 Чат-бот Meena и природа «понимания» 19:57

Проект Meena стал реализацией детской мечты Ле о создании чат-бота, способного сочинять оригинальные шутки. Использование архитектуры Transformer позволило модели лучше улавливать долгосрочные зависимости в диалогах, чем это делали LSTM.

🔮 Будущее NLP: Генерация и фактология 28:26

Отвечая на вопрос о будущем, Ле выделяет генеративные модели как наиболее перспективное направление.

  1. Генерация контента: Исследователь видит огромный потенциал в обучении моделей, которые могут создавать книги или помогать сценаристам писать более качественные сюжеты.
  2. Проблема фактологии: Главным вектором прогресса, по мнению Ле, должно стать повышение «фактической корректности» генераций. Бот должен обладать «здравым смыслом» и генерировать достоверные ответы, а не просто правдоподобно звучащий текст.

🎓 Советы для начинающих в AI 33:27

Ле предостерегает от поиска универсальных «мета-советов», подчеркивая, что путь каждого человека уникален. Однако он дает две ключевые рекомендации:

💬 Цитаты

«Многие из моих друзей в то время говорили мне, что создавать Google Brain — ужасная идея.»

«Если коровы идут в Гарвард, то лошади должны идти в Хейворд.»

«Наивность иногда может быть вам на пользу.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Auto-encoder (Автокодировщик)
Нейросеть, обучающаяся сжимать данные в компактное представление и восстанавливать их обратно.
Sequence-to-Sequence (Seq2Seq)
Архитектура нейросетей, которая преобразует одну последовательность данных в другую (например, предложение на одном языке в предложение на другом).
LSTM
Тип рекуррентной нейронной сети, способный «запоминать» длинные зависимости в данных.
Perplexity (Перплексия)
Метрика, используемая для оценки качества языковых моделей: чем ниже значение, тем лучше модель предсказывает текст.
📊 Цифры
🗓 Хронология
  1. 2007 Куок Ле поступил в программу PhD в Стэнфорд под руководством Эндрю Ына.
  2. 2011 Ле стал первым стажером в проекте Google Brain.
  3. 2016 Запуск проекта по созданию продвинутого чат-бота с использованием архитектуры Transformer.
⚖️ Другая сторона
Искусственный интеллект Quoc Le Google Brain Sequence-to-Sequence Deep Learning Transformer