Янник Кильхер: WebGPT, ожившие рисунки и новый журнал TMLR

Yannic Kilcher 23,1 тыс. 31 мин 2 мин 24.12.2021
Главное

Искусственный интеллект: от поиска в сети до оживления детских рисунков 2:36

В свежем выпуске еженедельного дайджеста Янник Кильхер обсуждает последние достижения в области машинного обучения: от интеграции языковых моделей с интернетом до новых стандартов публикации научных работ и инструментов для генеративного искусства.

🌐 WebGPT: GPT-3 учится пользоваться поисковиком 2:50

OpenAI представила WebGPT — версию модели GPT-3, способную самостоятельно искать информацию в сети для ответов на запросы.

Кильхер отмечает, что такой подход делает работу модели более объяснимой, так как она предоставляет ссылки на источники. Он также жестко раскритиковал датасет TruthfulQA, назвав его «скамом», так как, по его мнению, он предвзято составлен для провокации моделей на генерацию «конспирологического» бреда, в то время как отказ от ответа («I don't know») засчитывается как верный, но неинформативный.

🎨 Искусство и анимация: рисунки оживают 15:44

Meta AI Research представила проект, позволяющий оживлять детские рисунки. Процесс включает сегментацию изображения, регистрацию ключевых точек и последующую анимацию с помощью обученной нейросети.

В области генеративного искусства также вышли:

🔬 Новая площадка для науки: TMLR 18:18

Янник Кильхер и группа соавторов анонсировали создание нового журнала «Transactions on Machine Learning Research» (TMLR).

🛠 Кратко о других обновлениях 21:19

💬 Цитаты

«Если вы еще не пробовали Weights & Biases, пожалуйста, попробуйте, это полностью бесплатно.»

Янник Кильхер 02:09

«Датасет TruthfulQA — это скам, и сам факт того, что он называется «TruthfulQA» — это скам.»

Янник Кильхер 08:58
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Behavior cloning
Форма имитационного обучения, при которой модель учится воспроизводить действия эксперта.
Rejection sampling
Метод отбора лучших результатов из нескольких сгенерированных моделью вариантов.
Self-attention
Механизм внимания в нейросетях, позволяющий модели учитывать связи между всеми элементами входной последовательности.
Дистилляция данных
Процесс создания максимально информативных и сжатых наборов данных для эффективного обучения моделей.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект WebGPT OpenAI TMLR Hugging Face Gradio