Янник Килхер о новых возможностях GPT-3 и инфраструктуре Pathways

Yannic Kilcher 14,9 тыс. 18 мин 3 мин 30.03.2022
Главное

В новом выпуске еженедельного дайджеста ML News Янник Килхер (Yannic Kilcher) обсуждает ключевые технологические анонсы в области машинного обучения. В центре внимания — новые возможности редактирования текста с помощью GPT-3, инфраструктурные решения Google Pathways, успехи в генерации изображений на основе текстовых промптов и новые инструменты для анализа игровых багов.

✍️ GPT-3: от генерации к редактированию 2:53

OpenAI расширила функциональность своей языковой модели GPT-3, добавив специализированные инструменты для редактирования кода и текста. В дополнение к привычному режиму «завершения» (completion), теперь доступны режимы «вставки» (insert) и «редактирования» (edit).

Янник продемонстрировал возможности нового интерфейса, успешно применив его для работы с кодом:

По мнению ведущего, несмотря на то, что модель иногда может быть «переоценена» в маркетинговых материалах, инструменты редактирования значительно повышают продуктивность разработчиков. Доступ к API OpenAI теперь открыт для всех желающих, что снимает ограничения закрытого бета-тестирования.

🖼️ Генерация изображений: Make-A-Scene и residual quantization 6:22

В области генерации изображений по тексту (text-to-image) наметились два важных достижения.

Make-A-Scene от Meta 6:35

Исследователи Meta представили метод «Make-A-Scene», который использует человеческие приоритеты для улучшения качества генерации. В отличие от DALL-E или GLIDE, этот подход опирается на дополнительные вспомогательные данные:

Янник отметил создание полноценной иллюстрированной истории «Маленькая красная лодка» (The Little Red Boat), все визуальные элементы которой были созданы этой моделью. Прогресс в этой сфере ведущий назвал «потрясающим», подчеркнув, как быстро меняются технологии с момента выпуска его собственного музыкального видео.

Residual Quantization от Kakao Brain и POSTECH 14:45

Второй проект — «Auto-aggressive image generation using residual quantization» — использует технику остаточного квантования.

⚡ Google Pathways: инфраструктурный прорыв 7:53

После длительного ожидания Google опубликовала подробную техническую документацию по Pathways. По словам Килхера, Pathways — это не столько новая архитектура модели, сколько мощная инфраструктурная система для распределенных вычислений.

Янник описывает Pathways как «MapReduce для машинного обучения»:

Автор полагает, что это решение позволит Google значительно оптимизировать работу своих дата-центров, хотя и воздерживается от точных прогнозов о том, как это скажется на ценах для пользователей Google Cloud Platform.

🔍 Инструменты и исследования 10:46

💬 Цитаты

«Это своего рода MapReduce для машинного обучения.»

Янник Килхер 09:00

«Прогресс в этой области абсолютно ошеломляющий.»

Янник Килхер 07:53
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Residual Quantization
Метод квантования данных, при котором на каждом этапе сжатия сохраняется остаточная информация для повышения точности реконструкции.
Docstrings
Строки документации внутри кода, поясняющие назначение функций, классов или модулей.
Infiniband
Высокоскоростная технология передачи данных, часто используемая в суперкомпьютерах и дата-центрах.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект GPT-3 Google Pathways Make-A-Scene OpenAI MLOps