Основатель Suno: «Мы создаем не музыку, а музыкантов»

20VC (Harry Stebbings) 33,2 тыс. 1 ч 9 мин 10.01.2025
Главное

В новом выпуске подкаста 20VC его ведущий Гарри Стеббингс (Harry Stebbings) беседует с Майки Шульманом (Mikey Shulman), основателем и генеральным директором генеративной музыкальной нейросети Suno. В центре дискуссии — тектонические сдвиги в индустрии, вызванные искусственным интеллектом, переход от пассивного потребления контента к его активному созданию и неизбежная смена бизнес-моделей. Анализируя опыт развития платформы, участники приходят к выводу, что в будущем ключевым навыком художника станет не техническое мастерство, а человеческий вкус и кураторство.

🎧 От Enterprise-инструмента к «фабрике музыкантов»: история создания Suno 0:32

Ведущий подкаста 20VC Гарри Стеббингс признался, что стал настоящим фанатом Suno, создав за последние несколько дней более 25 песен и сразу оформив годовую подписку за $300. Однако проект не всегда задумывался как платформа для массового творчества. Майки Шульман рассказал, что изначально команда планировала создать инструмент корпоративного ИИ для анализа и осмысления аудиоданных.

Выходцы из сферы обработки естественного языка (NLP), основатели полагали, что генерация качественного звука окажется гораздо более сложной задачей. Они ожидали, что надолго застрянут на этапе аналитики, подобно тому как индустрия развивала текстовые модели во времена gpt-2. Однако генеративные возможности технологий начали расти гораздо быстрее прогнозов, что заставило команду мгновенно отказаться от первоначальной концепции.

Suno — это не просто сервис для генерации фоновой музыки, а способ переосмыслить роль человека. По словам Шульмана, цель компании — «создавать не музыку, а музыкантов», вовлекая пользователей в процесс редактирования, совместного использования и глубокого погружения в творчество.

📉 Законы масштабирования и субъективность музыкального вкуса 2:07

В технологической среде принято считать, что аудиосфера просто отстает от текстовых моделей на пару лет и все проблемы можно решить простым увеличением вычислительных мощностей. Майки Шульман категорически не согласен с этим тезисом. По его мнению, в отличие от текстовых моделей, где целью является поиск объективно правильных ответов (например, сдача тестов SAT), музыка абсолютно субъективна.

Следовательно, законы масштабирования (scaling laws) здесь не работают как панацея, и музыкальные ИИ-модели будут оставаться относительно небольшими. Вместо бездумного наращивания параметров разработчикам приходится искать иные методы настройки систем под человеческие предпочтения.

Как утверждает Шульман, главное технологическое преимущество Suno заключается не в уникальной архитектуре (компания использует стандартные трансформеры), а в инновационных методах репрезентации и токенизации аудиоданных.

🎮 Музыка как видеоигра: новая модель монетизации 3:11

[Image comparing traditional music streaming vs interactive music creation platforms]

Шульман проводит аналогию с игровой индустрией: никто не играет в видеоигры «на фоне», как это часто происходит с музыкой. Люди охотно тратят деньги на Fortnite, потому что это интерактивный, вовлекающий и социальный опыт. По мнению основателя Suno, если сделать создание музыки таким же интерактивным процессом, пользователи без проблем будут платить за него.

Инвестиционный тезис, разделяемый обоими собеседниками, гласит: текущая фаза, когда клиенты платят за доступ к более совершенным моделям, временна. Через 5 лет ценность сместится от сырых моделей к готовым продуктовым решениям. Шульман уверен, что после условной 4-й или 5-й версии разработчики перестанут выпускать «модели» как таковые — все последующие релизы станут исключительно обновлениями пользовательского продукта.

При этом бесконечное увеличение предложения не обесценит музыку. Как считает Шульман, средняя стоимость отдельного трека снизится, но общая ценность музыки для общества и ее объём внутри экономики колоссально вырастут.

⚖️ Юридические войны и «фиксированный пирог» музыкальной индустрии 17:23

В июне 2024 года Американская ассоциация звукозаписывающих компаний (RIAA) подала масштабный иск против Suno, обвинив стартап в незаконном использовании защищенного авторским правом контента для обучения моделей. Майки Шульман признает, что в обучающей выборке присутствуют произведения, защищенные копирайтом, однако, по его мнению, это является стандартной практикой для индустрии и не нарушает закон. Стоит отметить, что юристы мейджор-лейблов придерживаются прямо противоположной точки зрения, считая это прямым нарушением авторских прав.

Шульман с грустью отмечает высокую литигационность музыкального бизнеса. Ссылаясь на экономическое исследование Андрея Шлейфера из 1980-х годов, гость напомнил интересную корреляцию:

По словам основателя Suno, традиционные игроки страдают от «психологии фиксированного пирога» (fixed pie mentality), пытаясь агрессивно делить существующие доходы вместо того, чтобы вместе с ИИ-стартапами увеличить этот пирог до размеров игровой индустрии.

Майки подчеркивает, что команда Suno базируется в Кембридже (штат Массачусетс), а не в Кремниевой долине. Это помогает им избегать деструктивного менталитета «уничтожения традиционных рынков» (screw the incumbents) и сохранять глубокое уважение к музыкальной культуре.

🎤 Звёздные партнёрства и будущее «фанфиков» в поп-культуре 26:29

Несмотря на публичные судебные разбирательства, за закрытыми дверями подавляющее большинство профессиональных артистов признаются в любви к инструменту. В качестве примера успешного взаимодействия Шульман привел сотрудничество с легендарным продюсером Тимбалендом (Timbaland), который стал эдвайзером компании и получил долю в капитале (equity) вместо прямых выплат наличными. По мнению Майки, публичная поддержка от фигуры такого масштаба дает легитимность ИИ-музыке и служит «прикрытием» для молодых музыкантов, стесняющихся использовать новые технологии.

Обсуждая будущее дистрибуции, Шульман выразил желание создавать персональные модели для суперзвезд уровня Арианы Гранде (Ariana Grande). Из-за сложных контрактов артисты часто не владеют правами на собственную музыку, но они владеют своим именем и образом. Внутри Suno сейчас действует жесткий запрет на генерацию по именам реальных певцов.

Однако в будущем, как предполагает Шульман, артисты смогут сознательно передавать свои кастомизированные модели суперфанатам для создания музыкальных «фанфиков», что станет мощнейшим инструментом вовлечения. Это в корне изменит стриминговую модель распределения доходов, где авторы сейчас получают минимальные отчисления.

Причину кризиса современной поп-музыки Шульман видит в алгоритмах платформ вроде TikTok и Spotify. По его мнению, песни стали короче и однообразнее по структуре, мелодии и гармонии, так как авторы вынуждены подстраиваться под социальные сети.

📊 Экономика стартапа: почему Suno берёт деньги с первого дня 13:39

Вопреки классическим канонам Кремниевой долины — «сначала бесплатно масштабируйся, монетизацию прикрутишь потом» — Suno ввела платную подписку с первого дня своего существования, когда проект был еще ботом в Discord. Главной метрикой успешности пользователя команда считает достижение им пейволла (paywall) в первые же сутки. По мнению Майки, если человек уперся в лимит бесплатной генерации, значит, он получил ценный эмоциональный опыт. У компании же появляются данные для точечного анализа поведения платящих и неплатящих клиентов.

Финансовые показатели и затраты Suno выглядят следующим образом:

Инвестиционный тезис Шульмана: капитал — это оружие (capital as a weapon). Деньги нужны стартапу не для линейного роста, а для качественных технологических скачков. При этом он скептически высказался о некоторых «дружественных к фаундерам» практиках венчурных фондов.

По его утверждению, заявления инвесторов о том, что они «бронируют значительную часть фонда под будущие раунды компании», на практике часто оказываются лишь завуалированным способом защитить свое право на про-рата (pro-rata rights). В случае реальных проблем стартап этих денег все равно не увидит.

🛠️ Ошибки интерфейса: почему текстовый промпт — это тупик 36:26

Майки Шульман открыто признал свою стратегическую ошибку: он слишком долго удерживал продукт внутри мессенджера Discord, ориентируясь на феноменальный финансовый успех Midjourney. В ноябре команда запустила простейшее веб-приложение, и всего за 5 дней 90% всего трафика платформы добровольно перетекло из Discord на сайт. Это доказало критическую важность специализированного UI для работы со звуком.

Шульман выступил с резкой критикой текущего тренда на текстовые интерфейсы. По его мнению, феноменальный успех ChatGPT оказал «медвежью услугу» индустрии, заставив все AI-компании бездумно копировать пустое текстовое поле ввода, которое абсолютно не подходит для большинства других задач.

Гость предсказывает, что в течение ближайших 6–12 месяцев само слово «промпт» исчезнет из музыкального контекста, уступив место интуитивным инструментам взаимодействия со звуком. Шульман также не согласился с мнением других ИИ-предпринимателей о том, что квалификацию сотрудников в будущем нужно оценивать по качеству их промптов:

«Если для получения результата вам нужен сложный промпт и 1600 итераций — это провал моего продукта, а не вина кандидата».

🚀 Квантовые иллюзии и дефицит фокуса: уроки управления для CEO 6:28

Обсуждая смежные технологические сферы, Шульман затронул тему квантовых вычислений. Он считает их невероятно перспективными, но дал жесткий карьерный совет: сейчас не стоит идти работать в квантовые стартапы. Физические барьеры еще не преодолены, а венчурные инвесторы слишком близоруки и требуют быстрых возвратов. По его мнению, квантовые вычисления должны финансироваться государством, а не частными фондами.

Объясняя, почему лучшие инженеры машинного обучения получаются из физиков и экономистов, Майки разделил их преимущества:

Главной трудностью на посту CEO Шульман называет удержание фокуса. Имея 30 одинаково привлекательных путей развития, необходимо жестко выбирать не более трех. Именно поэтому Suno принципиально отказывается от предоставления API создателям генеративного видео, хотя запросы приходят постоянно. Майки убежден, что роль фоновой музыки обесценивает продукт, тогда как цель Suno — сделать музыку более ценной.

Определенные сложности накладывает и управление людьми. Шульман отметил, что масштабирование компании делает практику удаленной работы неэффективной из-за невозможности институционализировать человеческое суждение и вкус. На примере курса в MIT Sloan он продемонстрировал важность разделения эффектов:

🔮 Две утопии будущего: гиперперсонализированный наркотик против социальной сети 44:24

Размышляя о стремительных изменениях на рынке труда и в создании контента, Шульман высказал парадоксальную мысль: вера в «неизбежность ИИ» (AI is inevitable) вредна для обеих сторон. По его мнению, эта фраза служит щитом для ленивых традиционалистов и успокоительным для безответственных разработчиков. Будущее ИИ-музыки не предопределено, его нужно активно строить, иначе мир рискует свалиться в один из двух антиутопических сценариев, которые Шульман считает вполне реальными:

  1. Бесконтрольное пиратство и дипфейки: создание неотличимых копий известных артистов группами в юрисдикциях, игнорирующих законы, без выплаты цента авторам.
  2. Гиперперсонализированный изоляционизм: сценарий, при котором приложение считывает ваш пульс с Apple Watch, анализирует утренние переписки и генерирует бесконечный поток музыки лично под ваше сиюминутное настроение. Шульман считает такой подход «крайне антисоциальным наркотиком», который полностью уничтожает человеческую связь через искусство.

Вместо этого Suno стремится построить подобие социальной сети (по аналогии с Instagram), где кураторство и вкус станут новой формой авторства. Смещение фокуса уже заметно: 30 лет назад люди хотели быть рок-звездами и виртуозно играть на гитаре, 15 лет назад — диджеями, управляющими софтом, а сегодня ценятся создатели плейлистов.

Точно так же, как появление Instagram сделало индивидуальный снимок менее ценным, но кратно увеличило доходы индустрии мобильной фотографии и количество зарабатывающих авторов, ИИ-музыка позволит миллионам людей монетизировать свой вкус.

💬 Цитаты

«Мы не создаем музыку, мы создаем музыкантов.»

Майки Шульман 01:05

«Если для получения результата вам нужен сложный промпт и 1600 итераций — это провал моего продукта, а не вина кандидата.»

Майки Шульман 39:58
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Токенизация аудио
Процесс разбиения непрерывного звукового сигнала на отдельные дискретные элементы (токены) для их последующей обработки нейросетью.
Законы масштабирования (Scaling laws)
Эмпирические правила в ИИ, утверждающие, что качество работы модели растет пропорционально росту объема данных и вычислительной мощности.
Психология фиксированного пирога
Установка, при которой участники рынка воспринимают общий объем ресурсов как ограниченный и борются за долю, вместо попыток увеличить весь рынок.
📊 Цифры
🗓 Хронология
  1. Август 2023 года Запуск первой версии генеративного продукта Suno в качестве бота внутри мессенджера Discord.
  2. Ноябрь 2023 года Релиз веб-приложения Suno, приведший к миграции 90% пользовательской базы за 5 дней.
  3. Июнь 2024 года Американская ассоциация звукозаписывающих компаний (RIAA) подает масштабный судебный иск против Suno.
⚖️ Другая сторона
Искусственный интеллект Майки Шульман Гарри Стеббингс Suno Токенизация аудио Венчурные инвестиции