Мати Станишевски: «Мы выплатили $10 млн пользователям за их голоса»

a16z (Andreessen Horowitz) 13,8 тыс. 31 мин 3 мин 04.11.2025
Главное

Будущее интерфейсов — за голосом, и компания ElevenLabs находится на переднем крае этой революции, превращаясь из узкоспециализированного стартапа в платформу для создания аудиоконтента любого уровня сложности. В рамках конференции a16z сооснователь и CEO ElevenLabs Мати Станишевски (Mati Staniszewski) рассказал о пути компании, уникальных методах найма талантов и о том, как за три года превратить исследовательскую лабораторию в глобального игрока с оборотом, позволяющим выплачивать миллионы долларов авторам голосов.

🚀 Децентрализованная структура и скорость разработки 2:11

Одной из главных отличительных черт ElevenLabs является феноменальная скорость вывода продуктов на рынок. По словам Мати Станишевски, компания придерживается структуры из множества малых автономных команд . Сегодня в штате около 20 продуктовых групп, в каждой из которых работает от 5 до 10 человек. Эти подразделения обладают полной независимостью, что иногда приводит к дублированию функций, но кратно повышает чувство собственности (ownership) и ответственности за результат .

Баланс между фундаментальными исследованиями (R&D) и разработкой продуктов строится на жестких временных рамках:

🌍 Глобальный найм и «нетрадиционные» таланты 6:45

ElevenLabs зародилась в Европе (между Варшавой и Лондоном) и изначально строилась как полностью удаленная компания. Мати Станишевски отмечает, что культурный код Польши, где иностранные фильмы десятилетиями озвучивались одним монотонным голосом, стал мощным стимулом для создания технологии, способной передавать эмоции и интонации .

В вопросах найма компания сознательно игнорирует традиционные методы:

🎙️ Voice Marketplace: $10 млн выплат сообществу 15:02

Ключевым инструментом масштабирования ElevenLabs стал «Магазин голосов» (Voice Marketplace). Создатели могут загружать свои голосовые модели и получать вознаграждение каждый раз, когда их используют другие пользователи .

Инвестиционный тезис и метрики маркетплейса:

Мати привел пример с глубоким испанским голосом, который не был популярен в Испании, но стал хитом в англоязычных странах именно из-за своей специфической окраски .

🎸 Юридические барьеры и работа с лейблами 16:22

Переход от чисто голосовых моделей к созданию музыки и звуковых эффектов потребовал сложной юридической работы. По мнению гостя, взаимодействие с музыкальной индустрией — это всегда поиск компромисса между «прорывной технологией» и защитой прав артистов .

🏢 Трансформация в Enterprise-платформу 21:07

Первоначально ElevenLabs воспринималась как бренд для креаторов, но сейчас компания активно заходит в корпоративный сектор. Мати признал, что их первая попытка заставить инженеров заниматься продажами провалилась . Сейчас команда продаж сбалансирована (80% — сейлзы, 20% — инженеры).

Основные направления работы с крупным бизнесом:

  1. Сложная оркестрация: Создание полноценных ИИ-агентов, которые объединяют распознавание речи (STT), языковые модели (LLM) и синтез голоса (TTS) .
  2. Инфраструктура: Интеграция с телефонией (Twilio, SIP trunking) и обеспечение безопасности данных для таких сфер, как здравоохранение .
  3. Безопасность: Мати подчеркнул, что стабильность работы («пять девяток» — 99.999% аптайма) является критическим требованием для Enterprise-клиентов, хоть это и сложно реализуемо в текущем ИИ-ландшафте .

В компании принято жесткое разделение продуктов на стадии pre-PMF (до нахождения рыночной ниши) и post-PMF . Командам на ранней стадии дается 6 месяцев: если продукт не «взлетел», его безжалостно закрывают .

💬 Цитаты

«Мы не хотим становиться очередным набором инструментов для редактирования. Давайте решать проблемы на уровне исследований.»

Мати Станишевски 05:28

«До 30 сотрудников мы были полностью удаленными, потому что искали лучшие таланты там, где они есть.»

Мати Станишевски 09:00
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
TTS (Text-to-Speech)
Технология синтеза речи из печатного текста.
LLM (Large Language Model)
Большая языковая модель, обеспечивающая интеллект ИИ-агента.
STT (Speech-to-Text)
Технология распознавания живой речи и её перевода в текст.
PLG (Product-Led Growth)
Стратегия развития бизнеса, при которой основным драйвером роста является сам продукт.
📊 Цифры
🗓 Хронология
  1. 2021 Основание ElevenLabs Мати Станишевским и Петром Дабковским.
  2. 2023 Запуск первых масштабных Enterprise-кейсов, включая Hypocratic в сфере здравоохранения.
  3. Середина 2023 Отказ от титулов и должностей внутри компании.
  4. 2024 Запуск лицензированной музыкальной модели после 18 месяцев переговоров.
⚖️ Другая сторона
Стартапы и бизнес ElevenLabs Mati Staniszewski ИИ-агенты Voice Marketplace синтез речи