Как стартап Spellbrush автоматизирует дизайн персонажей с помощью GAN и собственного железа

Y Combinator 7,7 тыс. 10 мин 4 мин 07.12.2020
Главное

На мероприятии YC Gaming Tech Talks сооснователь и CEO стартапа Спеллбраш (Spellbrush) Кори представил технологический стек компании, который позволяет автоматизировать создание игровых персонажей с помощью глубокого обучения. Основной фокус проекта направлен на решение проблемы масштабирования художественного контента в игровой индустрии, где затраты на графику могут составлять большую часть производственного бюджета.

🎨 Экономика игрового арта и вызовы масштабирования 0:02

Искусство — это сложный и ресурсозатратный процесс, особенно для небольших команд. По словам Кори, в современных AAA-проектах и крупных студийных пайплайнах бюджет на создание визуальных ативов часто достигает 50–70% от общих затрат на производство . Для Спеллбраш, где один из сооснователей является профессиональным художником, ключевым вопросом стал поиск способа масштабирования производства контента без необходимости раздувать штат до размеров гигантской студии .

Команда Спеллбраш пришла к идее внедрения ИИ в пайплайн подготовки ассетов. Чтобы продемонстрировать возможности технологии, Кори предложил сравнить три иллюстрации персонажей в стиле аниме. В то время как на создание двух работ у профессиональных иллюстраторов ушло от 2 до 15 часов, третья была полностью сгенерирована ИИ менее чем за две секунды .

Преимущества использования нейросетей в дизайне:

🧠 Технологический стек: GAN и управление «латентным шумом» 2:40

В основе инструментов Спеллбраш лежат генеративно-состязательные сети (GAN). Кори объяснил механику их работы через взаимодействие двух нейросетей :

  1. Генератор: Учится создавать изображения, стремясь сделать их неотличимыми от реальных работ.
  2. Дискриминатор: Учится отличать настоящий арт от подделок, созданных генератором.

Процесс обучения строится на миллионах итераций, в ходе которых обе сети обновляют свои веса с помощью метода обратного распространения ошибки (backpropagation) . Для создания разнообразия в систему вводится «шум», называемый латентным пространством .

По мнению CEO Спеллбраш, управление этим шумом дает разработчикам уникальные возможности:

📊 Проблема смещения данных и репрезентация 5:35

Для обучения нейросетей Спеллбраш использовал датасет из 10 миллионов изображений, собранных в открытом доступе . Основной упор был сделан на эстетику аниме из-за огромного объема доступных данных. Однако команда столкнулась с серьезным дисбалансом в обучающей выборке.

Распределение данных в интернете сильно искажено:

Команда Спеллбраш сознательно корректировала эти веса, чтобы ИИ мог генерировать качественных мужских персонажей и героев с разным цветом кожи чаще, чем это встречается в «сырых» данных из сети . Кроме того, компания ведет активные исследования в области автоматической анимации (инструменты для Live2D и Spine) и технологий сверхвысокого разрешения (super-resolution) для видео .

🖥️ Сделай сам: почему DIY-суперкомпьютер выгоднее AWS 7:32

Одной из самых практических частей доклада стал разбор затрат на инфраструктуру. Кори утверждает, что использование облачных сервисов для обучения тяжелых моделей экономически неэффективно для стартапа.

Сравнение затрат:

Технические характеристики офисного суперкомпьютера Спеллбраш:

Программная архитектура включает кастомный язык NetGen для быстрого описания архитектур GAN, который компилируется в низкоуровневые операции TensorFlow . Все задачи упаковываются в контейнеры Singularity и распределяются планировщиком Slurm.

🚀 Будущее: первая игра, полностью иллюстрированная ИИ 9:20

На момент выступления команда Спеллбраш состояла всего из пяти человек, но они уже работают над созданием «первой в мире игры, иллюстрированной ИИ» . Стартап активно нанимает специалистов, включая 2D-аниматоров, моушн-дизайнеров и VFX-художников для работы в реальном времени.

Кори резюмировал, что их цель — не заменить художников, а предоставить им инструменты, которые позволяют выполнять задачи, занимавшие раньше часы, за считанные секунды .

💬 Цитаты

«Иллюстраторы в Японии не любят рисовать мужских персонажей, потому что женские приносят больше лайков, но ИИ может рисовать то, что люди не хотят.»

«В крупных студиях бюджеты на арт составляют 50–70% от общей стоимости производства игры.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
GAN
Генеративно-состязательная сеть, состоящая из двух нейросетей (генератора и дискриминатора), соревнующихся друг с другом.
Латентное пространство
Математическое представление скрытых признаков данных, позволяющее управлять характеристиками генерируемого изображения через ввод шума.
Slurm
Система управления очередями задач на суперкомпьютерных кластерах.
NetGen
Собственный язык программирования Spellbrush для описания архитектур нейронных сетей.
📊 Цифры
🗓 Хронология
  1. 2018 Spellbrush (W18) проходит акселерацию в Y Combinator.
  2. 2020 Выступление на YC Gaming Tech Talks и анонс первой игры с ИИ-иллюстрациями.
⚖️ Другая сторона
Стартапы и бизнес Spellbrush Y Combinator GAN Waifu Labs TensorFlow