Будущее интерфейсов — за голосом, и компания ElevenLabs находится на переднем крае этой революции, превращаясь из узкоспециализированного стартапа в платформу для создания аудиоконтента любого уровня сложности. В рамках конференции a16z сооснователь и CEO ElevenLabs Мати Станишевски (Mati Staniszewski) рассказал о пути компании, уникальных методах найма талантов и о том, как за три года превратить исследовательскую лабораторию в глобального игрока с оборотом, позволяющим выплачивать миллионы долларов авторам голосов.
🚀 Децентрализованная структура и скорость разработки 2:11
Одной из главных отличительных черт ElevenLabs является феноменальная скорость вывода продуктов на рынок. По словам Мати Станишевски, компания придерживается структуры из множества малых автономных команд . Сегодня в штате около 20 продуктовых групп, в каждой из которых работает от 5 до 10 человек. Эти подразделения обладают полной независимостью, что иногда приводит к дублированию функций, но кратно повышает чувство собственности (ownership) и ответственности за результат .
Баланс между фундаментальными исследованиями (R&D) и разработкой продуктов строится на жестких временных рамках:
- Если исследовательская задача не может быть решена в течение трех месяцев, продуктовая команда получает карт-бланш на использование любых обходных путей или сторонних моделей, чтобы закрыть потребность пользователей .
- Компания долгое время сопротивлялась внедрению простых «ползунков» скорости речи, пытаясь решить это на уровне нейросети, но в итоге прагматизм победил: продукт должен быть удобным здесь и сейчас .
🌍 Глобальный найм и «нетрадиционные» таланты 6:45
ElevenLabs зародилась в Европе (между Варшавой и Лондоном) и изначально строилась как полностью удаленная компания. Мати Станишевски отмечает, что культурный код Польши, где иностранные фильмы десятилетиями озвучивались одним монотонным голосом, стал мощным стимулом для создания технологии, способной передавать эмоции и интонации .
В вопросах найма компания сознательно игнорирует традиционные методы:
- Отказ от LinkedIn: Вместо просмотра резюме ElevenLabs ищет авторов успешных open-source проектов .
- Реальные кейсы: Одним из ведущих исследователей данных стал человек, который разработал впечатляющую модель преобразования текста в речь, работая при этом оператором в колл-центре .
- Плоская структура: Год назад компания официально отменила титулы. Внутри нет «вице-президентов по продажам», есть только «команда выхода на рынок» (Go-to-Market team). Статус в иерархии определяется не стажем, а вкладом в конкретные проекты .
🎙️ Voice Marketplace: $10 млн выплат сообществу 15:02
Ключевым инструментом масштабирования ElevenLabs стал «Магазин голосов» (Voice Marketplace). Создатели могут загружать свои голосовые модели и получать вознаграждение каждый раз, когда их используют другие пользователи .
Инвестиционный тезис и метрики маркетплейса:
- Выплаты: На текущий момент компания выплатила сообществу уже более $10 млн .
- Библиотека: В маркетплейсе доступно почти 10 000 уникальных голосов .
- Глобальность: Технология позволяет «клонировать» голос на 30+ (в новых версиях — до 70) языков, сохраняя уникальные характеристики тембра .
Мати привел пример с глубоким испанским голосом, который не был популярен в Испании, но стал хитом в англоязычных странах именно из-за своей специфической окраски .
🎸 Юридические барьеры и работа с лейблами 16:22
Переход от чисто голосовых моделей к созданию музыки и звуковых эффектов потребовал сложной юридической работы. По мнению гостя, взаимодействие с музыкальной индустрией — это всегда поиск компромисса между «прорывной технологией» и защитой прав артистов .
- 18 месяцев переговоров: Именно столько времени потребовалось, чтобы заключить лицензионные соглашения с крупными лейблами (например, Merlin и Cobalt) для обучения музыкальных моделей ElevenLabs .
- Метод экспертов: Для таких «неизвестных территорий» компания нанимает узкопрофильных консультантов — например, музыкальных юристов, которые знают всех игроков рынка и помогают говорить с ними на одном языке .
🏢 Трансформация в Enterprise-платформу 21:07
Первоначально ElevenLabs воспринималась как бренд для креаторов, но сейчас компания активно заходит в корпоративный сектор. Мати признал, что их первая попытка заставить инженеров заниматься продажами провалилась . Сейчас команда продаж сбалансирована (80% — сейлзы, 20% — инженеры).
Основные направления работы с крупным бизнесом:
- Сложная оркестрация: Создание полноценных ИИ-агентов, которые объединяют распознавание речи (STT), языковые модели (LLM) и синтез голоса (TTS) .
- Инфраструктура: Интеграция с телефонией (Twilio, SIP trunking) и обеспечение безопасности данных для таких сфер, как здравоохранение .
- Безопасность: Мати подчеркнул, что стабильность работы («пять девяток» — 99.999% аптайма) является критическим требованием для Enterprise-клиентов, хоть это и сложно реализуемо в текущем ИИ-ландшафте .
В компании принято жесткое разделение продуктов на стадии pre-PMF (до нахождения рыночной ниши) и post-PMF . Командам на ранней стадии дается 6 месяцев: если продукт не «взлетел», его безжалостно закрывают .