Эдвард Балассанян: «Музыка — это наполовину математика, и ИИ в ней уже достиг уровня профи»

Eye on AI 527 50 мин 4 мин 20.05.2024
Главное

Музыкальная индустрия долгое время оставалась «последним бастионом», сопротивлявшимся полной интеграции искусственного интеллекта из-за сложности структуры звука и жесткого лицензирования. Эдвард Балассанян, основатель платформы Aimii (AI Music Initiative), в беседе с Крейгом Смитом доказывает, что технология наконец достигла «продюсерского уровня» и готова превратить музыку из статичного продукта в динамичный облачный сервис.

🎸 Музыка как сервис: новая бизнес-модель индустрии 2:45

Эдвард Балассанян пришел в музыкальный сектор из сферы системного программирования, проработав пять лет в Microsoft и основав несколько технологических инкубаторов . Его ключевая идея заключается в том, что современная музыкальная индустрия застряла в устаревшей модели «оплаты за каждое прослушивание» (pay-per-listen), которая жестко охраняется правообладателями .

Балассанян утверждает:

По мнению гостя, такой подход освобождает бизнес от необходимости платить организациям по защите авторских прав (PRO) за «количество потенциальных ушей» в ресторане или гостинице, заменяя это фиксированной ежемесячной подпиской на сервис .

🛠 Технологический подход: от «монолитов» к скриптам 7:38

Балассанян критикует популярный сейчас метод обучения «монолитных» моделей — больших нейронных сетей, обученных на массиве готовых аудиофайлов . Он сравнивает это с попыткой шеф-повара воссоздать суп, просто попробовав его на вкус, без знания рецепта и ингредиентов .

Техническая архитектура Aimii принципиально отличается:

Такой метод, как утверждает разработчик, на порядки эффективнее с точки зрения использования ресурсов CPU и позволяет сохранять нюансы звучания отдельных инструментов (например, отличие пяти скрипок от четырех виолончелей), которые обычно «замыливаются» в монолитных трансформерах .

🤖 Борьба с «музыкальным спамом» и требования рынка 27:50

Обсуждая текущее состояние рынка, Балассанян затронул проблему кризиса перепроизводства контента. В 2023 году Spotify и другие стриминги начали массово удалять ИИ-треки из-за «спама» — огромного количества низкокачественной музыки, которую никто не слушал .

Ключевые тезисы дискуссии о качестве:

  1. Точность против хаоса: Главная проблема LLM-моделей в музыке — отсутствие контроля (галлюцинации). Aimii предлагает «высокоточную» (high-precision) музыку, где пользователь может задать структуру трека с точностью до такта .
  2. Эстетический порог: Слушатели гораздо менее терпимы к фальшивой ноте или сбою ритма, чем к плохому фото или видео .
  3. Маркировка контента: По мнению Эдварда, хорошую ИИ-музыку уже сейчас невозможно отличить от созданной человеком, однако плохой ИИ-контент выдает себя низким качеством продакшена .

Отдельно подчеркивается правовой аспект: компания принципиально отказывается от использования популярных моделей с непрозрачными наборами данных . Все модели Aimii обучаются «с нуля» на этически чистых и лицензионно прозрачных данных, чтобы клиенты могли использовать результат в коммерческих целях без юридических рисков .

🎹 Практическая демонстрация: создание трека в реальном времени 28:57

В ходе интервью Эдвард продемонстрировал интерфейс платформы Aimii Pro. В отличие от простых генераторов, работающих по принципу «черного ящика», здесь реализован диалоговый интерфейс .

Процесс создания трека включает:

Балассанян пояснил, что они работают с командой из более чем 200 артистов, которые выступают в роли «аудиторского комитета», проверяя, насколько алгоритмы соответствуют стандартам жанров .

🚀 Будущее и этика: заменят ли роботы композиторов? 38:41

Отвечая на вопрос о будущем, Эдвард Балассанян выразил уверенность, что ИИ станет катализатором, а не убийцей творчества.

Прогнозы и этические ограничения:

Подводя итог, гость отметил, что музыка — это уникальное сочетание искусства, математики и науки . Роль ИИ здесь — взять на себя рутинную, «формульную» часть работы (например, соблюдение структуры трека для Spotify), оставляя человеку самое важное: создание уникальных мелодий, смыслов и эмоциональных акцентов.

💬 Цитаты

«В музыке, если вы сбились с тональности или ритма, это невозможно слушать. Толерантность людей к плохой музыке гораздо ниже, чем к плохим фото.»

Эдвард Балассанян 40:11

«Наш ИИ создает не саму музыку, он создает рецепты. А затем наш язык программирования исполняет этот рецепт в реальном времени.»

Эдвард Балассанян 14:31
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AmyScript
Собственный язык программирования компании Aimii на базе TypeScript для управления генерацией музыки.
PRO (Performing Rights Organizations)
Организации по защите прав исполнителей, собирающие роялти за публичное воспроизведение музыки.
Hero samples
Уникальные аудиозаписи (например, человеческий вокал с его несовершенствами), вокруг которых ИИ может строить композицию.
📊 Цифры
🗓 Хронология
  1. 2020 Основание компании Aimii (AI Music Initiative).
  2. 2023 Всплеск ИИ-спама на стриминговых платформах и ужесточение политики Spotify.
  3. Март 2024 Официальный запуск Aimii Music Services на конференции South by Southwest (SXSW).
⚖️ Другая сторона
Искусственный интеллект Edward Balassanian Aimii generative music AmyScript Oracle Cloud Infrastructure