# Основатель Suno: «Мы создаем не музыку, а музыкантов»

Источник: https://www.youtube.com/watch?v=E0YL83U5VWk
Канал: 20VC (Harry Stebbings)
Опубликовано: 10.01.2025

---

В новом выпуске подкаста 20VC его ведущий Гарри Стеббингс (Harry Stebbings) беседует с Майки Шульманом (Mikey Shulman), основателем и генеральным директором генеративной музыкальной нейросети Suno. В центре дискуссии — тектонические сдвиги в индустрии, вызванные искусственным интеллектом, переход от пассивного потребления контента к его активному созданию и неизбежная смена бизнес-моделей. Анализируя опыт развития платформы, участники приходят к выводу, что в будущем ключевым навыком художника станет не техническое мастерство, а человеческий вкус и кураторство.

## 🎧 От Enterprise-инструмента к «фабрике музыкантов»: история создания Suno
[[JUMP:0:32]]

Ведущий подкаста 20VC Гарри Стеббингс признался, что стал настоящим фанатом Suno, создав за последние несколько дней более 25 песен и сразу оформив годовую подписку за $300. Однако проект не всегда задумывался как платформа для массового творчества. Майки Шульман рассказал, что изначально команда планировала создать инструмент корпоративного ИИ для анализа и осмысления аудиоданных. 

Выходцы из сферы обработки естественного языка (NLP), основатели полагали, что генерация качественного звука окажется гораздо более сложной задачей. Они ожидали, что надолго застрянут на этапе аналитики, подобно тому как индустрия развивала текстовые модели во времена gpt-2. Однако генеративные возможности технологий начали расти гораздо быстрее прогнозов, что заставило команду мгновенно отказаться от первоначальной концепции.

Suno — это не просто сервис для генерации фоновой музыки, а способ переосмыслить роль человека. По словам Шульмана, цель компании — «создавать не музыку, а музыкантов», вовлекая пользователей в процесс редактирования, совместного использования и глубокого погружения в творчество.

## 📉 Законы масштабирования и субъективность музыкального вкуса
[[JUMP:2:07]]

В технологической среде принято считать, что аудиосфера просто отстает от текстовых моделей на пару лет и все проблемы можно решить простым увеличением вычислительных мощностей. Майки Шульман категорически не согласен с этим тезисом. По его мнению, в отличие от текстовых моделей, где целью является поиск объективно правильных ответов (например, сдача тестов SAT), музыка абсолютно субъективна.

Следовательно, законы масштабирования (scaling laws) здесь не работают как панацея, и музыкальные ИИ-модели будут оставаться относительно небольшими. Вместо бездумного наращивания параметров разработчикам приходится искать иные методы настройки систем под человеческие предпочтения. 

Как утверждает Шульман, главное технологическое преимущество Suno заключается не в уникальной архитектуре (компания использует стандартные трансформеры), а в инновационных методах репрезентации и токенизации аудиоданных. 

## 🎮 Музыка как видеоигра: новая модель монетизации
[[JUMP:3:11]]

[Image comparing traditional music streaming vs interactive music creation platforms]

Шульман проводит аналогию с игровой индустрией: никто не играет в видеоигры «на фоне», как это часто происходит с музыкой. Люди охотно тратят деньги на Fortnite, потому что это интерактивный, вовлекающий и социальный опыт. По мнению основателя Suno, если сделать создание музыки таким же интерактивным процессом, пользователи без проблем будут платить за него.

Инвестиционный тезис, разделяемый обоими собеседниками, гласит: текущая фаза, когда клиенты платят за доступ к более совершенным моделям, временна. Через 5 лет ценность сместится от сырых моделей к готовым продуктовым решениям. Шульман уверен, что после условной 4-й или 5-й версии разработчики перестанут выпускать «модели» как таковые — все последующие релизы станут исключительно обновлениями пользовательского продукта. 

При этом бесконечное увеличение предложения не обесценит музыку. Как считает Шульман, средняя стоимость отдельного трека снизится, но общая ценность музыки для общества и ее объём внутри экономики колоссально вырастут.

## ⚖️ Юридические войны и «фиксированный пирог» музыкальной индустрии
[[JUMP:17:23]]

В июне 2024 года Американская ассоциация звукозаписывающих компаний (RIAA) подала масштабный иск против Suno, обвинив стартап в незаконном использовании защищенного авторским правом контента для обучения моделей. Майки Шульман признает, что в обучающей выборке присутствуют произведения, защищенные копирайтом, однако, по его мнению, это является стандартной практикой для индустрии и не нарушает закон. Стоит отметить, что юристы мейджор-лейблов придерживаются прямо противоположной точки зрения, считая это прямым нарушением авторских прав.

Шульман с грустью отмечает высокую литигационность музыкального бизнеса. Ссылаясь на экономическое исследование Андрея Шлейфера из 1980-х годов, гость напомнил интересную корреляцию:

* Чем больше в стране инженеров — тем быстрее растет экономика.
* Чем больше юристов — тем рост медленнее.

По словам основателя Suno, традиционные игроки страдают от «психологии фиксированного пирога» (fixed pie mentality), пытаясь агрессивно делить существующие доходы вместо того, чтобы вместе с ИИ-стартапами увеличить этот пирог до размеров игровой индустрии. 

Майки подчеркивает, что команда Suno базируется в Кембридже (штат Массачусетс), а не в Кремниевой долине. Это помогает им избегать деструктивного менталитета «уничтожения традиционных рынков» (screw the incumbents) и сохранять глубокое уважение к музыкальной культуре.

## 🎤 Звёздные партнёрства и будущее «фанфиков» в поп-культуре
[[JUMP:26:29]]

Несмотря на публичные судебные разбирательства, за закрытыми дверями подавляющее большинство профессиональных артистов признаются в любви к инструменту. В качестве примера успешного взаимодействия Шульман привел сотрудничество с легендарным продюсером Тимбалендом (Timbaland), который стал эдвайзером компании и получил долю в капитале (equity) вместо прямых выплат наличными. По мнению Майки, публичная поддержка от фигуры такого масштаба дает легитимность ИИ-музыке и служит «прикрытием» для молодых музыкантов, стесняющихся использовать новые технологии.

Обсуждая будущее дистрибуции, Шульман выразил желание создавать персональные модели для суперзвезд уровня Арианы Гранде (Ariana Grande). Из-за сложных контрактов артисты часто не владеют правами на собственную музыку, но они владеют своим именем и образом. Внутри Suno сейчас действует жесткий запрет на генерацию по именам реальных певцов. 

Однако в будущем, как предполагает Шульман, артисты смогут сознательно передавать свои кастомизированные модели суперфанатам для создания музыкальных «фанфиков», что станет мощнейшим инструментом вовлечения. Это в корне изменит стриминговую модель распределения доходов, где авторы сейчас получают минимальные отчисления.

Причину кризиса современной поп-музыки Шульман видит в алгоритмах платформ вроде TikTok и Spotify. По его мнению, песни стали короче и однообразнее по структуре, мелодии и гармонии, так как авторы вынуждены подстраиваться под социальные сети.

## 📊 Экономика стартапа: почему Suno берёт деньги с первого дня
[[JUMP:13:39]]

Вопреки классическим канонам Кремниевой долины — «сначала бесплатно масштабируйся, монетизацию прикрутишь потом» — Suno ввела платную подписку с первого дня своего существования, когда проект был еще ботом в Discord. Главной метрикой успешности пользователя команда считает достижение им пейволла (paywall) в первые же сутки. По мнению Майки, если человек уперся в лимит бесплатной генерации, значит, он получил ценный эмоциональный опыт. У компании же появляются данные для точечного анализа поведения платящих и неплатящих клиентов.

Финансовые показатели и затраты Suno выглядят следующим образом:

* Общий объем привлеченных инвестиций: более $125 млн.
* Главная статья расходов: аренда и покупка GPU-мощностей, которая в несколько раз превышает затраты на заработную плату (payroll).
* Особенности команды: штат исследователей машинного обучения не будет расти линейно, так как научные изыскания (research) дают сублинейную отдачу от масштаба.

Инвестиционный тезис Шульмана: капитал — это оружие (capital as a weapon). Деньги нужны стартапу не для линейного роста, а для качественных технологических скачков. При этом он скептически высказался о некоторых «дружественных к фаундерам» практиках венчурных фондов. 

По его утверждению, заявления инвесторов о том, что они «бронируют значительную часть фонда под будущие раунды компании», на практике часто оказываются лишь завуалированным способом защитить свое право на про-рата (pro-rata rights). В случае реальных проблем стартап этих денег все равно не увидит.

## 🛠️ Ошибки интерфейса: почему текстовый промпт — это тупик
[[JUMP:36:26]]



Майки Шульман открыто признал свою стратегическую ошибку: он слишком долго удерживал продукт внутри мессенджера Discord, ориентируясь на феноменальный финансовый успех Midjourney. В ноябре команда запустила простейшее веб-приложение, и всего за 5 дней 90% всего трафика платформы добровольно перетекло из Discord на сайт. Это доказало критическую важность специализированного UI для работы со звуком.

Шульман выступил с резкой критикой текущего тренда на текстовые интерфейсы. По его мнению, феноменальный успех ChatGPT оказал «медвежью услугу» индустрии, заставив все AI-компании бездумно копировать пустое текстовое поле ввода, которое абсолютно не подходит для большинства других задач. 

Гость предсказывает, что в течение ближайших 6–12 месяцев само слово «промпт» исчезнет из музыкального контекста, уступив место интуитивным инструментам взаимодействия со звуком. Шульман также не согласился с мнением других ИИ-предпринимателей о том, что квалификацию сотрудников в будущем нужно оценивать по качеству их промптов:

> «Если для получения результата вам нужен сложный промпт и 1600 итераций — это провал моего продукта, а не вина кандидата».

## 🚀 Квантовые иллюзии и дефицит фокуса: уроки управления для CEO
[[JUMP:6:28]]

Обсуждая смежные технологические сферы, Шульман затронул тему квантовых вычислений. Он считает их невероятно перспективными, но дал жесткий карьерный совет: сейчас не стоит идти работать в квантовые стартапы. Физические барьеры еще не преодолены, а венчурные инвесторы слишком близоруки и требуют быстрых возвратов. По его мнению, квантовые вычисления должны финансироваться государством, а не частными фондами.

Объясняя, почему лучшие инженеры машинного обучения получаются из физиков и экономистов, Майки разделил их преимущества:

* Экономисты привыкли работать в условиях дефицита данных и сильны в холистическом мышлении с опорой на первые принципы (first principles reasoning).
* Экспериментальные физики виртуозно умеют быстро проводить огромное количество высококачественных тестов, что критично для ИИ, являющегося эмпирической дисциплиной.

Главной трудностью на посту CEO Шульман называет удержание фокуса. Имея 30 одинаково привлекательных путей развития, необходимо жестко выбирать не более трех. Именно поэтому Suno принципиально отказывается от предоставления API создателям генеративного видео, хотя запросы приходят постоянно. Майки убежден, что роль фоновой музыки обесценивает продукт, тогда как цель Suno — сделать музыку более ценной.

Определенные сложности накладывает и управление людьми. Шульман отметил, что масштабирование компании делает практику удаленной работы неэффективной из-за невозможности институционализировать человеческое суждение и вкус. На примере курса в MIT Sloan он продемонстрировал важность разделения эффектов:

* Первый порядок: ChatGPT дает каждому человеку в мире компетентного репетитора, что удивительно для образования.
* Второй порядок: Студенты могут легко взламывать домашние задания, а значит, преподавателям нужно полностью менять систему обучения, подстраивая ее под реальный мир.

## 🔮 Две утопии будущего: гиперперсонализированный наркотик против социальной сети
[[JUMP:44:24]]

Размышляя о стремительных изменениях на рынке труда и в создании контента, Шульман высказал парадоксальную мысль: вера в «неизбежность ИИ» (AI is inevitable) вредна для обеих сторон. По его мнению, эта фраза служит щитом для ленивых традиционалистов и успокоительным для безответственных разработчиков. Будущее ИИ-музыки не предопределено, его нужно активно строить, иначе мир рискует свалиться в один из двух антиутопических сценариев, которые Шульман считает вполне реальными:

1.  **Бесконтрольное пиратство и дипфейки:** создание неотличимых копий известных артистов группами в юрисдикциях, игнорирующих законы, без выплаты цента авторам.
2.  **Гиперперсонализированный изоляционизм:** сценарий, при котором приложение считывает ваш пульс с Apple Watch, анализирует утренние переписки и генерирует бесконечный поток музыки лично под ваше сиюминутное настроение. Шульман считает такой подход «крайне антисоциальным наркотиком», который полностью уничтожает человеческую связь через искусство.

Вместо этого Suno стремится построить подобие социальной сети (по аналогии с Instagram), где кураторство и вкус станут новой формой авторства. Смещение фокуса уже заметно: 30 лет назад люди хотели быть рок-звездами и виртуозно играть на гитаре, 15 лет назад — диджеями, управляющими софтом, а сегодня ценятся создатели плейлистов. 

Точно так же, как появление Instagram сделало индивидуальный снимок менее ценным, но кратно увеличило доходы индустрии мобильной фотографии и количество зарабатывающих авторов, ИИ-музыка позволит миллионам людей монетизировать свой вкус.