Уэс Рот: «ИИ-подруги становятся новой многомиллиардной индустрией»

Wes Roth 390 тыс. 20 мин 3 мин 21.04.2024
Главное

Индустрия ИИ-развлечений стремительно трансформируется: от простых чат-ботов до «ИИ-подруг», приносящих своим создателям пятизначные суммы ежемесячно, и нейросетей, генерирующих видео и музыку в реальном времени. В своем обзоре технологический аналитик Уэс Рот демонстрирует, как конвергенция различных ИИ-инструментов создает новый пласт медиаконтента, способного конкурировать с реальными людьми за внимание, доверие и даже эмоциональную привязанность аудитории.

💸 Экономика цифровых отношений: феномен «ИИ-подруг» 2:56

По мнению Уэса Рота, сектор «ИИ-подруг» превращается в бизнес с потенциальной капитализацией более $1 млрд. Несмотря на то что массовое внимание к теме возникло на волне хайпа вокруг ChatGPT, специализированные приложения для виртуальных знакомств существовали задолго до появления современных больших языковых моделей.

🗣️ Революция «говорящих лиц» в реальном времени: VASA-1 5:07

Одной из самых сложных задач для ИИ оставалась генерация естественной мимики, синхронизированной с речью. Однако разработка Microsoft Research Asia под названием VASA-1 совершила прорыв в этой области.

🎨 Генеративное искусство и визуальные миры: EndlessDreams 10:29

Технологии генерации видео переходят в фазу работы в реальном времени. В качестве примера Рот приводит проект EndlessDreams, созданный разработчиком Дэном Вудом на основе архитектуры Stable Diffusion.

🎵 ИИ-музыка и новая виральность 14:00

Сфера ИИ-музыки также демонстрирует «пугающее» качество. Рот приводит пример видеоклипа, созданного исключительно с помощью инструментов ИИ:

По словам ведущего, большинство слушателей уже не способны отличить ИИ-трек от профессиональной записи. Рот также обращает внимание на феномен виральных видео в социальных сетях: например, клипы, где персонаж игры (например, Minecraft) «бегает» по экрану, сопровождаемые переписками, которые превращены в цепляющие музыкальные композиции. Этот контент вызывает привыкание, и, как считает Рот, подобные методы «манипуляции» вниманием будут использоваться все активнее,.

💬 Цитаты

«Пока одни играют в видеоигры, он играет с ИИ-подругами.»

«ИИ-модели начинают выглядеть пугающе реально для меня, и всё становится довольно странным.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
VASA-1
Технология от Microsoft для создания говорящих лиц с естественной мимикой на основе одного фото и аудио.
Латентное пространство (latent space)
Математическое представление данных внутри нейросети, где скрыты ключевые характеристики объекта (например, эмоции или мимика).
EndlessDreams
Система генерации видео в реальном времени, управляемая голосом, на базе Stable Diffusion.
📊 Цифры
🗓 Хронология
  1. 2 декабря 2023 Первое упоминание Дэна Вуда в Twitter о работе с ИИ.
⚖️ Другая сторона
Искусственный интеллект EndlessDreams VASA-1 Wes Roth Suno AI