# Гаурав Мисра о секретах разработки в Captions и Snap

Источник: https://www.youtube.com/watch?v=PDobJV8wh1g
Канал: Lenny's Podcast
Опубликовано: 27.03.2025

---

В новом выпуске Lenny's Podcast ведущий Ленни Рачитски беседует с Гауравом Мисрой, сооснователем и CEO успешного ИИ-стартапа Captions и бывшим руководителем команды дизайн-инжиниринга в Snap. В центре дискуссии — уникальная философия продуктовой разработки в эпоху искусственного интеллекта, уроки построения легендарных потребительских приложений и будущее генеративного видеоконтента. Спикер подробно описывает, как современная команда может двигаться с невероятной скоростью, игнорируя традиционные рамки корпоративного планирования.

## 🚀 Скорость как стратегия: Еженедельный релиз и управление техническим долгом
[[JUMP:13:26]]

В компании Captions внедрена радикальная инженерная цель: каждый разработчик должен выпускать один рыночный продукт или функцию каждую неделю. Под «рыночным продуктом» Гаурав Мисра понимает фичу, ради которой пользователь готов скачать приложение или оформить подписку. Базовые вещи, такие как выравнивание текста или стандартные настройки интерфейса, не могут быть рыночными функциями — они ожидаемы по умолчанию. 

Для достижения такой скорости команда использует метод жесткого урезания функциональности (ruthless scope cutting). Процесс выглядит следующим образом:

* Дизайнер создает концепт со множеством полезных деталей.
* Команда последовательно убирает элементы, задавая вопрос: «Будет ли продукт полезен без этого?».
* Урезание продолжается до тех пор, пока дальнейшее сокращение не сделает функцию бессмысленной. Полученный минимальный остаток становится задачей на одну неделю.

В качестве примера Мисра приводит гипотетическую функцию добавления изображения в видео. Вместо создания сложного интерфейса с удалением фона, регулировкой насыщенности и облачной библиотекой, команда в рамках недельного спринта оставляет только базовый выбор файла из галереи устройства. По мнению предпринимателя, если базовая механика бесполезна, то и надстройки над ней не имеют смысла. Если же функция востребована, пользователи сами укажут на недостатки. Как отмечает спикер, жалобы клиентов — это главный признак соответствия продукта рынку (product-market fit), подтверждающий, что людям не все равно.

Такой подход неотделим от осознанного накопления технического долга. Гаурав Мисра формулирует важный тезис: главная задача стартапа — брать на себя технический долг, поскольку именно это дает преимущество в скорости перед крупными корпорациями. Крупные игроки либо выплачивают долг сразу, либо тратят ресурсы на исправление ошибок прошлого. Стартап же может сознательно перекладывать решение инфраструктурных проблем на «будущих инженеров». Мисра сравнивает это с финансовым плечом: технический долг создает леверидж для создания сложных продуктов маленькой командой. 

Однако здесь существует жесткий лимит — «взлетная полоса технического долга» (technical debt runway). Если долга слишком много, команда начинает тратить 80–90% времени на выплату процентов (исправление багов и сбоев), переходя в режим выживания. Для минимизации рутины инженеры Captions активно используют ИИ-инструменты Cursor и Devin. Последний выполняет роль автономного ИИ-агента за 500 долларов в месяц, исправляя баги прямо через Slack.

## 🗺️ Две дорожные карты: Публичная и Секретная
[[JUMP:26:53]]

Традиционный подход к планированию подразумевает единый роадмап, однако в Captions его разделяют на две независимые части.

Публичная дорожная карта строится на основе открытого фидбека пользователей (запросы на удаление фона, отмену действий, увеличение длины видео). По мнению Мисры, этот список не может стать ключевым фактором победы над конкурентами, так как аналогичные запросы получают абсолютно все игроки на рынке.

Секретная дорожная карта включает функции, о которых пользователи никогда не просили и ценность которых они могут не понимать до первого знакомства. Гаурав Мисра считает, что именно такие идеи способны революционизировать паттерны поведения людей. Идеи для секретного роадмапа рождаются на ежеквартальных общекомпанейских мозговых штурмах, где на равных участвуют инженеры, рекрутеры и маркетологи. Команда голосует за лучшие предложения, после чего продуктовый отдел оценивает их техническую реализуемость.

Ярким примером продукта из секретной карты стала функция ИИ-зрительного контакта (Eye Contact). Она автоматически корректирует направление взгляда спикера на камеру, даже если тот читает текст с телесуфлера. Функция создавалась в партнерстве с Nvidia. Демонстрационный ролик фичи стал настолько вирусным, что до сих пор собирает миллионы просмотров по всему миру и породил множество копий у конкурентов.

## 👻 Секреты управления продуктом в Snap: Эпоха без продакт-менеджеров
[[JUMP:35:08]]

Гаурав Мисра поделился уникальным инсайдом о внутренней кухне компании Snap, которая, по его словам, остается последней успешной социальной сетью, запущенной за последние 15 лет (если не считать TikTok, который Мисра относит скорее к контентным платформам).

Спикер указывает на парадокс сильного продукт-маркет фита: иногда взрывной органический рост компании может маскировать ошибочные решения, из-за чего команда делает неверные выводы о правильности своей стратегии. Защитой от конкурентов для Snap всегда служили непрерывные инновации.

Организационная структура Snap в период активного роста была крайне специфичной:

* Центральную роль играла команда дизайна, состоявшая всего из 10–12 человек даже тогда, когда штат компании разросся до 5–6 тысяч сотрудников.
* Долгое время в компании полностью отсутствовали продакт-менеджеры (PM) — они появились только с началом этапа монетизации.
* Дизайнеры в Snap совмещали свою непосредственную работу с обязанностями PM: они формировали дорожные карты, писали документацию и координировали запуски.

Такая модель требовала от специалистов колоссальной самоотдачи и лидерских качеств, что компенсировалось экстремально высокими зарплатами и ежеквартальными бонусами. Главным преимуществом схемы была возможность генерального директора Эвана Шпигеля сохранять полный гранулярный контроль над пользовательским интерфейсом приложения. Любое изменение UI требовало одобрения Шпигеля, который держал в голове контекст всего продукта. 

Как отмечает Мисра, Эван Шпигель обладал непревзойденным пониманием своей аудитории и часто принимал контринтуитивные решения, которые оборачивались триумфом. Например, позиционирование Snap как «камеры» изначально вызывало смех, но именно запуск приложения сразу в режиме съемки помог компании выстоять против Instagram, который не мог скопировать эту механику без падения собственных метрик.

## 🧪 Внутренняя виральность и прототипирование: Рождение Design Engineering
[[JUMP:43:36]]

По мере масштабирования Snap столкнулся с классической проблемой роста: любой новый продукт превращался в проект на 6–12 месяцев с привлечением сотен инженеров. Ошибка в выборе вектора стоила слишком дорого. Чтобы сохранить способность к инновациям, Гаурав Мисра в последние два года работы в Snap перешел в команду дизайна и основал направление дизайн-инжиниринга (design engineering).

Задача гибридных специалистов (дизайнеров-программистов) заключалась в быстром прототипировании идей внутри основного приложения Snapchat. Эти ранние версии тестировались на ограниченных выборках — например, в Австралии или в нескольких американских школах. Только после получения реальных поведенческих данных компания принимала решение о выделении 500 инженеров на полноценную разработку.

Параллельно команда совершила неожиданное открытие в области корпоративного управления. Вместо того чтобы тратить силы на долгое согласование проектов со стейкхолдерами, дизайн-инженеры научились создавать «внутреннюю виральность». Они выпускали прототип фичи, делились сборкой внутри компании, и проект лавинообразно распространялся от инженеров к вице-президентам и самому Эвану Шпигелю. Это рождало мгновенный внутренний консенсус и высокий приоритет для запуска.

## 🎯 Мышление на стыке функций: Почему PM должен быть маркетологом
[[JUMP:51:42]]

Размышляя о ролях в современной команде, Гаурав Мисра признает, что решение не нанимать PM в Snap могло быть аномалией, и компания преуспела вопреки этому факту. Тем не менее спикер настаивает на размытии жестких границ между профессиями. Его текущий тезис: продакт-менеджеры обязаны глубоко разбираться в маркетинге.

Мисра предлагает рассматривать маркетинг как прямое расширение интерфейса продукта:

* Поисковый маркетинг в Google — это просто кнопка перехода в ваш продукт, размещенная на сторонней площадке.
* Реклама в Facebook — аналогичная кнопка, запускающая пользовательский путь еще до этапа онбординга.
* Метрики должны отслеживаться как единая непрерывная воронка от клика по объявлению до целевого действия внутри приложения.

В подтверждение этой мысли Ленни Рачитски напоминает об опыте Брайана Чески в Airbnb, который переименовал всех продакт-менеджеров в менеджеров по продуктовому маркетингу (PMM), чтобы заставить их отвечать за дистрибуцию и признание продукта, а не только за его написание. Также собеседники упомянули твит Патрика Коллисона о пользовательских исследованиях: они нужны не для того, чтобы напрямую диктовать список фич, а для калибровки ментальной модели лидера, на основе которой он принимает финальные решения.

В Snap эта ментальная модель опиралась на строгие ценностные ограничения. Миссия компании заключалась в обеспечении безопасного приватного обмена контентом. Именно поэтому Snap сознательно отказался от алгоритмической ленты коротких видео в стиле TikTok на ранних этапах. Внутри Snap существовал продукт «Our Stories», который демонстрировал феноменальную воронку вовлечения (например, вирусные истории студенческой любви). Однако из-за нежелания использовать алгоритмы ранжирования компании приходилось вручную модерировать каждый ролик силами специальной команды для защиты от буллинга. Продукт признали немасштабируемым и закрыли, несмотря на отличные метрики. По словам Мисры, сейчас ландшафт изменился: традиционный шеринг между друзьями уступил место новой эре, где виральность полностью определяется алгоритмами платформ (TikTok, YouTube Shorts, Reels).

## 👁️ Будущее ИИ-видео: От стоковых роликов к персонализированному контенту
[[JUMP:1:02:09]]

Человечество стремительно приближается к моменту, когда медиаконтенту (видео, фото, аудио) будет невозможно доверять, считает Гаурав Мисра. Мы можем вернуться в реалии XIX века, когда любые факты доказывались исключительно физическими уликами или свидетельскими показаниями. Создание полностью неотличимого от реальности ИИ-видео, по оценке спикера, станет возможным в течение пары лет.

При этом Мисра разделяет текущие технологии генерации видео на два направления:

1.  Аватары на базе нейрорендеринга (neural rendering). Эта технология развивалась изолированно от современных диффузионных моделей и трансформеров; она требует индивидуального обучения на видео конкретного человека и плохо поддается генерализации.
2.  Большие генеративные модели. На текущий момент они создают преимущественно немое видео (сток или B-roll), выступающее лишь фоном для истории.

Компания Captions фокусируется исключительно на создании больших генеративных моделей для говорящих видео (talking videos), где ключевую роль играет диалог или монолог. Это сложная, еще не решенная исследователями задача, но Мисра убежден в ее полной реализуемости. 

С точки зрения безопасности CEO Captions делит весь видеоконтент на «документацию» (семейные архивы, репортажи с мест катастроф), где применение ИИ несет исключительно вред и должно блокироваться разработчиками на уровне дизайна продукта, и «сторителлинг» (кино, реклама, развлекательные блоги), где ИИ открывает колоссальные позитивные возможности для творчества. В качестве примера прорыва в сфере больших диффузионных моделей Мисра называет недавний релиз OmniHuman от ByteDance, способный генерировать высокоэкспрессивную человеческую речь на основе одного фото.

## 📉 Маркетинг как главный канал дистрибуции ИИ и уроки «Уголка неудач»
[[JUMP:1:10:25]]

Несмотря на технологический бум, реальная адаптация инноваций широкой аудиторией происходит медленно. Спикер приводит забавный пример своих родителей, живущих в Индии: они единственные в районе знают про ChatGPT и используют его для написания писем сообществу, вызывая искреннее изумление соседей своим внезапно улучшившимся слогом.

Для преодоления этого разрыва Captions активно тестирует ИИ-видео в перформанс-маркетинге. Год назад пользователи негативно реагировали на рекламу с ИИ, оставляя гневные комментарии о «фальшивке». Однако с улучшением моделей негатив исчез, а эффективность ИИ-креативов превзошла традиционные съемки с актерами. ИИ позволяет мгновенно генерировать 30–40 вариаций ролика, находить победителя и автоматически локализовать его на десятки языков с сохранением высокой конверсии. В перспективе пяти лет Мисра не исключает появления полностью ИИ-генеративных социальных сетей (наподобие персонализированного TikTok), где весь контент и виртуальные персонажи будут создаваться алгоритмом под вкусы конкретного пользователя.

В традиционной рубрике «Уголок неудач» Гаурав Мисра рассказал, как компания потеряла полтора года на старте. Первая версия приложения Captions, которая просто накладывала субтитры на видео, была написана им за одни выходные. Продукт моментально взлетел на вершины App Store, генерируя по 600 видео в день без каких-либо маркетинговых усилий. Посчитав этот успех слишком легким и закономерным, основатели решили, что им нужно строить масштабную социальную сеть для старшеклассников, и забросили утилиту.

Спустя полтора года Мисра зашел в свой личный аккаунт разработчика, куда поступали платежи от Captions, и обнаружил там 500 000 долларов чистой выручки. Продукт рос сам по себе, пока в поддержке висело 2000 неотвеченных тикетов. Осознав ошибку, основатели экстренно свернули соцсеть и вернулись к развитию Captions, что вызвало невероятный «вертикальный» рост графиков доходов, превративший прошлые показатели в плоскую линию.

## ⚡ Молниеносный раунд и выводы
[[JUMP:1:20:22]]

В финальной части беседы Гаурав Мисра ответил на серию коротких вопросов:

* Книги: Спикер принципиально не читает деловую литературу, предпочитая развивать навыки восприятия информации через аудио и видеоконтент, которые считает форматом будущего.
* Сериалы: С удовольствием смотрит проекты «Бункер» (Silo) и «Разделение» (Severance).
* Любимые инструменты: Выделил сервисы Linear и Superhuman за их превосходный дизайн и удобство в ежедневной работе.
* Жизненное кредо: «Самый простой способ стать лучшим — быть первым».

В завершение Мисра пригласил продуктовых специалистов и инженеров присоединяться к небольшой и динамичной команде Captions, подчеркнув, что готовность выпускать по одной рыночной фиче каждую неделю является лучшим фильтром при найме.