NVIDIA научила AI двигаться: 10 лет тренировок за 10 дней

Two Minute Papers 1,3 млн 8 мин 2 мин 19.07.2022
Главное

🎮 Десятилетие обучения за 10 дней: Как NVIDIA учит AI-персонажей двигаться 0:00

Исследователи NVIDIA представили новую технологию, позволяющую виртуальным персонажам осваивать сложные акробатические и боевые навыки, эквивалентные 10 годам непрерывных тренировок. Несмотря на внушительный временной масштаб, благодаря возможностям современных мощных компьютеров, на отработку этих навыков у системы уходит всего 10 дней реального времени. Разработка, представленная каналом Two Minute Papers, демонстрирует, как AI-агенты проходят путь от неуклюжих падений до профессионального владения движениями, открывая новые перспективы для создания реалистичных виртуальных миров.

📈 Эволюция виртуального бойца: от падений к мастерству 0:40

Процесс обучения начинается в симуляторе NVIDIA Isaac, который служит виртуальным спортзалом для AI-агентов. Первоначальный этап обучения выглядит комично: персонажи не обладают врожденными атлетическими способностями и совершают массу нелепых движений.

🧠 Технологические секреты успеха 3:09

Успех данной методики базируется на четырех ключевых технических решениях, которые делают систему гибкой и адаптивной.

  1. Работа с латентными пространствами: Латентное пространство — это область, где схожие типы данных группируются вместе. NVIDIA использует этот подход для переключения между известными типами движений, позволяя AI научиться плавно «сплетать» их между собой, даже если комбинации не были предусмотрены в исходных данных.
  2. Обучение навыку подъема: Агенты не только учатся падать, но и тренируются вставать. Это позволило исследователям тестировать устойчивость персонажей, подвергая их «случайным возмущениям» — например, бросая в них коробки в виртуальной среде. Агенты успешно справляются с такими испытаниями, восстанавливая равновесие.
  3. Точность управления: Система позволяет детально настраивать движения персонажа. Можно задать направление взгляда и движения независимо друг от друга, что дает возможность, например, с хирургической точностью наносить удары по объектам в виртуальном окружении.
  4. Состязательное обучение (GAN): Движения синтезируются с использованием нейронной сети-генератора и сети-дискриминатора. Дискриминатор следит за тем, чтобы сгенерированные движения были реалистичными и соответствовали набору данных. В процессе взаимного обучения система отбирает только те паттерны, которые выглядят максимально правдоподобно для человеческого глаза.

💡 Уроки стойкости и будущее технологий 5:44

Ведущий канала Two Minute Papers отмечает, что успех исследования — результат не только продвинутых алгоритмов, но и упорства команды NVIDIA. Если бы ученые остановились после первой недели тренировок, результат был бы крайне неудовлетворительным.

По словам ведущего, это служит отличным жизненным уроком и иллюстрацией «Третьего закона научных статей»: плохое исследование проваливается всегда, а хорошее — в 99% случаев. То, что мы видим на демонстрации — это лишь 1% проделанной работы, которая в будущем может быть демократизирована и внедрена в реальные проекты, доступные широкому кругу разработчиков.

💬 Цитаты

«Это 10 лет обучения, но в виртуальном мире. Однако реальный компьютер моделирует этот виртуальный мир, и он делает это гораздо быстрее.»

Автор канала Two Minute Papers 02:29

«Плохое исследование проваливается в 100% случаев, в то время как хорошее — только в 99% случаев.»

Автор канала Two Minute Papers 06:25
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Латентное пространство
Абстрактное многомерное пространство, где похожие типы данных располагаются близко друг к другу.
NVIDIA Isaac
Виртуальная платформа (симулятор) для тренировки и тестирования AI-роботов и персонажей.
Дискриминатор
Нейронная сеть, которая учится отличать сгенерированные данные от реальных, тем самым заставляя генератор улучшать качество работы.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект NVIDIA NVIDIA Isaac нейронные сети обучение с подкреплением виртуальная симуляция