Брайан Катанзаро: как NVIDIA меняет будущее ИИ и графики

The TWIML AI Podcast 1,1 тыс. 52 мин 2 мин 05.08.2021
Главное

Будущее ИИ-инфраструктуры и графики: взгляд изнутри NVIDIA 0:01

В современном мире искусственного интеллекта мощь моделей напрямую зависит от эффективности инфраструктуры, на которой они обучаются. Брайан Катанзаро, вице-президент по прикладным исследованиям глубокого обучения в NVIDIA, в интервью подкасту TWIML AI подробно разобрал, как компания подходит к решению задач масштабирования больших языковых моделей (LLM) и внедрению ИИ в графические технологии реального времени.

🚀 Проект Megatron: эффективность на «скорости света» 7:41

Проект Megatron, развивающийся в течение последних нескольких лет, направлен на создание максимально эффективного фреймворка для обучения огромных трансформерных моделей. Главная цель команды NVIDIA — продемонстрировать возможности современных кластеров, таких как DGX SuperPOD, и показать, что при правильной настройке программного обеспечения и сетевой инфраструктуры (Mellanox InfiniBand), GPU становятся идеальным инструментом для масштабного обучения.

По словам Брайана Катанзаро, при обучении моделей в стиле GPT-3 на DGX SuperPOD удается поддерживать 52% от теоретической пиковой производительности тензорных ядер. В контексте высокопроизводительных вычислений (HPC) это считается выдающимся достижением.

Основные элементы обеспечения эффективности:

Брайан Катанзаро подчеркивает: для достижения таких результатов нельзя оптимизировать лишь один компонент — требуется работа «полного стека» (full stack), от алгоритмов до сетевого оборудования. Ускорение обучения на 20% для модели стоимостью в миллионы долларов обеспечивает прямую экономию бюджета в размере сотен тысяч долларов.

🎮 Революция в графике: DLSS как нейросетевая реконструкция 34:03

Параллельно с HPC-решениями NVIDIA активно внедряет ИИ в потребительские продукты, самым ярким примером чего стала технология DLSS (Deep Learning Super Sampling). Это метод реконструкции изображения в реальном времени, позволяющий отрисовывать кадры в низком разрешении, а затем достраивать их до высокого качества с помощью нейронной сети.

Как отмечает гость, DLSS — это не просто алгоритм апскейлинга, а глубокая интеграция в графический конвейер:

Брайан Катанзаро признает, что работа с частицами (пыль, искры, дождь) остается сложной задачей, так как иногда нейросеть может ошибочно принять их за артефакты сглаживания и «стереть». Однако развитие методов ИИ позволяет NVIDIA постоянно улучшать качество работы модели, не требуя полной переработки кода для каждой игры.

💬 Цитаты

«Если вы собираетесь потратить несколько миллионов долларов на обучение одной модели, то ускорение на 20% может сэкономить вам миллион прямо на старте.»

Брайан Катанзаро 11:23

«Мы считаем, что ускоренные вычисления — это оптимизация полного стека: от приложения и библиотек до GPU и межсетевых соединений.»

Брайан Катанзаро 22:47
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Тензорные ядра
Специализированные аппаратные блоки в GPU NVIDIA, предназначенные для ускорения математических операций с тензорами, ключевых для глубокого обучения.
cuDNN
Библиотека примитивов для глубоких нейронных сетей, разработанная NVIDIA для оптимизации операций на GPU.
Трансформеры
Архитектура нейронных сетей, которая является основой современных LLM (например, GPT-3).
Векторы движения
Данные из игрового движка, описывающие направление и скорость перемещения пикселей между кадрами.
📊 Цифры
🗓 Хронология
  1. 2008 Публикация первой работы Брайана Катанзаро по обучению моделей SVM на GPU на конференции ICML.
  2. 2011 Приход Брайана Катанзаро в исследовательскую группу NVIDIA.
  3. 2013 Совместное исследование со Стэнфордским университетом по переносу глубокого обучения с CPU-серверов на GPU.
  4. 2017 Появление первых тензорных ядер в архитектуре GPU NVIDIA.
⚖️ Другая сторона
Искусственный интеллект Nvidia Megatron DLSS Bryan Catanzaro