# Горав Мисра: как создавать ИИ-продукты и управлять техдолгом

Источник: https://www.youtube.com/watch?v=PDobJV8wh1g
Канал: Lenny's Podcast
Опубликовано: 27.03.2025

---

Как выжить и победить в эпоху искусственного интеллекта, когда технологии позволяют создавать продукты за считанные дни, но завоевать внимание пользователей становится всё труднее? В новом выпуске подкаста Ленни сооснователь и CEO компании Captions Горав Мисра делится уникальными методиками управления продуктом, основанными на его опыте работы в Snap и феноменальном успехе собственного стартапа. Собеседники разбирают, почему современным ИИ-командам необходимо еженедельно выпускать готовые фичи, осознанно накапливать технический долг и разделять дорожную карту на две независимые части.

## ⚡ Скорость против перфекционизма: еженедельный релиз рыночного продукта
[[JUMP:0:14]]

В современной индустрии разработки программного обеспечения, особенно в сфере искусственного интеллекта, технологический барьер для создания инструментов практически исчез. Однако, по мнению Горава Мисры, главным вызовом для стартапов стало привлечение и удержание внимания пользователей. Чтобы оставаться в лидерах, стартап Captions, привлекший более $100 млн инвестиций и набравший 10 млн пользователей, внедрил жесткое инженерное правило: каждый разработчик обязан еженедельно выпускать на рынок одну готовую фичу или продукт.

Под «рыночным продуктом» (marketable product) в компании понимают функционал, ради которого пользователь готов скачать приложение или оформить платную подписку. Мисра считает, что базовые элементы (например, выравнивание текста по ширине в текстовом редакторе) не могут быть рыночными фичами, так как они очевидны и есть у всех конкурентов. Пользователи готовы прощать продукту отсутствие стандартных функций, если он предлагает уникальные возможности, которых нет больше нигде.

Для соблюдения недельного темпа разработки в Captions применяется метод радикального урезания скоупа (scope cutting). Процесс выглядит следующим образом:

* Команда берет первоначальный дизайн фичи и последовательно убирает из него каждый элемент, занимающий время на разработку.
* Урезание продолжается до тех пор, пока продукт не окажется на грани полной бесполезности.
* Оставшийся критический минимум становится задачей на одну неделю.

В качестве примера Мисра приводит гипотетическую фичу добавления изображений в видео. Вместо создания сложного интерфейса с удалением фона, регулировкой цветовой насыщенности, интеграцией с облачными дисками и библиотеками, команда предлагает оставить только нативный выбор картинки из галереи смартфона без какого-либо дополнительного UI. По словам гостя, если этот базовый функционал не приносит пользы, то и все надстройки над ним окажутся бесполезными. Если же фича находит отклик, пользователи сами начинают активно жаловаться на нехватку конкретных инструментов (например, удаления фона), что дает команде четкий вектор работы на следующую неделю. Жалобы клиентов, как отмечают собеседники, служат ключевым индикатором соответствия продукта рынку (product-market fit).

## 🏗️ Стратегический техдолг как конкурентное преимущество
[[JUMP:20:23]]

Горав Мисра формулирует нестандартный подход к управлению кодовой базой: по его мнению, прямая обязанность стартапа — осознанно накапливать технический долг. Крупные корпорации не могут позволить себе такую роскошь и обычно выплачивают техдолг сразу, либо тратят огромные ресурсы на исправление ошибок прошлых лет, что сильно замедляет их маневренность.

Для оценки целесообразности компромиссов в качестве кода в Captions используют концепцию «будущего инженера». Если проблему, возникающую из-за быстрого и неидеального написания кода, может решить условный 50-й или 100-й нанятый сотрудник в будущем, стартап делегирует эту задачу ему. Мисра иронично добавляет, что в случае краха компании этот инженер никогда не будет нанят, а значит, проблема аннулируется сама собой. При этом гость сравнивает технический долг с финансовым плечом, позволяющим маленькой команде создавать продукты, превосходящие ее реальные ресурсы.

Тем не менее, в этой стратегии существует жесткий баланс. По словам Мисры, каждый элемент техдолга требует выплаты «процентов»:

* Быстрое и неидеальное решение забирает в среднем 1–2% ежедневного времени команды на исправление багов, перезапуски и устранение крашей.
* При чрезмерном объеме долга стартап начинает тратить до 80–90% ресурсов исключительно на выплату «процентов».
* В этот момент компания переходит в опасный режим «поддержания жизнедеятельности» (keeping the lights on), лишаясь возможности создавать новое.

Чтобы не исчерпать этот «взлетный потенциал техдолга» (technical debt runway), Captions выделяет весь четвертый квартал (Q4) каждого года под инфраструктурные задачи. В этот период команда полностью прекращает гонку за фичами и занимается исключительно рефакторингом и выплатой накопившихся инженерных долгов. Ускорять процессы разработчикам помогают современные ИИ-инструменты: команда активно использует ИИ-редактор Cursor, а также тестирует автономного ИИ-агента Devin, доступного через Slack за $500 в месяц. По мнению Мисры, крупные компании не могут оперативно внедрять подобные ИИ-инструменты, так как им требуется пройти через согласование десятков юристов.

## 🗺️ Две дорожные карты: почему публичный родмап не поможет победить
[[JUMP:26:53]]

Обычно продуктовые компании ведут единый план развития, однако в Captions структуру планирования разделили на две независимые дорожные карты:

1.  Публичный родмап (Public roadmap): Формируется на основе отзывов пользователей (запросы на удаление фона, отмену действий undo/redo, увеличение длительности видео). По мнению Мисры, этот список не может стать фактором победы над конкурентами, поскольку пользователи просят об одном и том же все компании на рынке, и у всех конкурентов родмапы идентичны.
2.  Секретный родмап (Secret roadmap): Содержит прорывные идеи, о которых пользователи никогда не просили. Опираясь на глубокую экспертизу, команда создает функции, кардинально меняющие паттерны поведения людей. По утверждению Мисры, именно секретный родмап приносит стартапу самые крупные и важные победы.

Ярким примером фичи из секретного родмапа стала функция Eye Contact («Зрительный контакт»), автоматически корректирующая направление взгляда спикера на камеру, даже если он читает текст с телесуфлера. Captions создавала эту технологию совместно с Nvidia. Гость вспоминает, что изначально инженеры Nvidia даже не понимали, зачем нужно это решение, но стартап разглядел уникальный кейс для создателей контента. Запуск фичи сопровождался рекламным роликом в соцсетях, который стал вирусным на множестве языков и до сих пор собирает миллионы просмотров, несмотря на то, что технологию впоследствии скопировали практически все конкуренты.

Идеи для секретного родмапа аккумулируются в ходе ежеквартальных внутрикорпоративных брейнштормов. В них участвуют абсолютно все сотрудники стартапа, включая команды рекрутинга и маркетинга. Происходит общее голосование, ранжирование идей, после чего продуктовый отдел оценивает техническую реализуемость предложений.

## 👻 Уроки Snap: дизайн-кратия, отсутствие PM и внутренняя виральность
[[JUMP:35:08]]

До основания Captions Горав Мисра руководил командой дизайн-инженерии в Snap. Он отмечает, что Snap — одна из немногих социальных сетей, созданных после 2011 года, которой удалось закрепиться на рынке (наряду с TikTok).

По мнению Мисры, ключевым фактором устойчивости Snap против жесткого давления со стороны Facebook стал фундаментальный продуктовый выбор: приложение Snapchat всегда открывалось сразу на экран камеры. Это позволяло пользователям мгновенно фиксировать забавные моменты из жизни друзей. Instagram не мог скопировать это решение напрямую, так как подобное изменение привело бы к падению его ключевых метрик.

Внутренняя структура Snap в период активного роста была уникальной для индустрии:

* Центральным звеном компании являлась крошечная команда дизайна, состоявшая всего из 10–12 человек (даже когда общий штат вырос до 5–6 тысяч сотрудников).
* В компании долгое время полностью отсутствовали менеджеры по продукту (PM) — они появились значительно позже, вместе со стартом монетизации.
* Дизайнеры в Snap обладали компетенциями PM: они не только создавали интерфейсы, но и самостоятельно писали документацию, определяли графики релизов и координировали команды. За колоссальную нагрузку они получали сверхвысокие зарплаты и квартальные бонусы.
* CEO компании Эван Шпигель обладал абсолютным контролем над UI. Любое изменение интерфейса требовало его личного одобрения.

Чтобы сохранить способность к инновациям по мере масштабирования штата, Мисра создал в Snap подразделение дизайн-инженерии (Design Engineering). Команда состояла из специалистов, способных одновременно проектировать UX и самостоятельно писать код. Они создавали рабочие прототипы фич, встраивали их в основное приложение Snapchat и тестировали на ограниченных выборках (например, в нескольких школах или в масштабах Австралии). Это позволяло собирать реальные данные до инвестирования сотен инженеров в полноценную продакшн-разработку.

Кроме того, прототипы помогали решать проблему синхронизации в огромной организации за счет «внутренней виральности». Горав рассказывает, что собранные прототипы просто распространялись среди сотрудников стартапа. Сборки мгновенно становились вирусными внутри офиса, доходя от инженеров до вице-президентов и самого Эвана Шпигеля. Это создавало органическое выравнивание (alignment) в компании: вся команда загоралась идеей и требовала ее скорейшего полноценного релиза.

## 🛑 Забытый предшественник TikTok и жесткие рамки миссии
[[JUMP:56:46]]

По словам Мисры, четкое понимание своей миссии помогало руководству Snap безжалостно отсекать любые хайповые, но идеологически чуждые функции. Главной целью платформы было обеспечение безопасного и приватного обмена контентом без риска развития буллинга. Именно поэтому в Snap осознанно запретили возможность репоста чужих историй своим подписчикам без явного согласия автора (в отличие от Instagram Stories).

Эта же консервативная философия помешала Snap стать первооткрывателем формата коротких вертикальных видео с алгоритмической лентой. Гость раскрывает историческую деталь: у Snap существовал внутренний проект Our Stories («Наши истории»), запущенный задолго до появления TikTok. Функция позволяла публиковать контент в общие гео-подборки (например, истории студенческих кампусов), и некоторые сюжеты (вроде историй любви в реальном времени) генерировали сумасшедшую вовлеченность.

Однако руководство компании принципиально выступало против алгоритмического ранжирования пользовательского контента. Чтобы исключить проявления токсичности, каждый ролик в Our Stories просматривала вручную специальная команда кураторов. Такой подход оказался абсолютно не масштабируемым. Несмотря на высокие показатели удержания, проект свернули, уступив нишу будущему китайскому конкуренту.

## 🎬 Будущее генеративного видео и дивный новый маркетинг
[[JUMP:1:02:25]]

Обсуждая перспективы развития генеративного ИИ, Мисра прогнозирует, что до создания абсолютно фотореалистичного видео, неотличимого от реальности человеческим глазом, индустрии остается около двух лет. Качественный прорыв приведет мир в состояние, аналогичное XIX веку, когда аудио-, видео- и фотоматериалы не смогут служить доказательством, а верификация фактов вернется к принципу «слово против слова» или поиску физических улик.

В Captions разделяют генерацию видео на два направления:

* Документалистика (фиксация реальности, личные архивы, репортажи СМИ) — в этой сфере применение ИИ несет исключительно деструктивный характер, и компания намеренно усложняет использование своих инструментов для подделки реальности.
* Сторителлинг (кино, реклама, развлекательный контент) — здесь ИИ дает мощный позитивный импульс, позволяя авторам преодолевать нехватку навыков или бюджетов.

В то время как большинство ИИ-стартапов сфокусированы на генерации беззвучных B-roll футажей (фоновых планов), Captions сосредоточена на самой сложной задаче — разговорных видео (монологах и диалогах аватар-персонажей). Мисра объясняет, что стандартные технологии «нейронного рендеринга» (neural rendering), используемые большинством конкурентов, не связаны с текущей революцией трансформеров и диффузионных моделей и требуют долгого индивидуального обучения на видео конкретного человека. Captions же делает ставку на большие генеративные диффузионные модели. В качестве примера технологического прорыва гость приводит недавний релиз модели OmniHuman от ByteDance (материнская компания TikTok), способной по одной фотографии генерировать высокоэкспрессивное говорящее видео (например, анимированную брокколи, произносящую речь).

Финальным фронтиром внедрения ИИ-видео Мисра называет маркетинговые каналы. Еще год назад ИИ-персонажи в таргетированной рекламе вызывали отторжение и массу гневных комментариев от пользователей, замечавших фальшь. Однако сейчас качество генерации достигло точки, когда негатив исчез, а эффективность ИИ-креативов превысила показатели живых актеров. Главное коммерческое преимущество ИИ — масштабируемость: маркетологи могут мгновенно генерировать по 30–40 вариантов объявлений и беспрепятственно локализовать успешные креативы на десятки языков с помощью ИИ-перевода без потери эффективности.

Мисра делится антиутопическим прогнозом: в течение ближайших пяти лет могут появиться социальные сети (по типу TikTok), где абсолютно весь контент и персонажи будут генерироваться ИИ «на лету» под персональные вкусы конкретного зрителя. Ленни соглашается, отмечая, что уже сейчас пользователи зачастую не знают, кто из авторов в ленте рекомендаций реален, а кто автогенерирован.

## 🧭 Успех вопреки отвлечениям и блиц-опрос
[[JUMP:1:14:42]]

В традиционной рубрике «уголок неудач» Горав Мисра рассказал поучительную историю о потере фокуса на старте Captions. Первая базовая версия приложения, добавляющая автоматические субтитры к видео, была написана Мисрой буквально за два дня на выходных. После релиза в понедельник инструмент моментально и без какого-либо маркетинга взлетел на верхние строчки App Store, обрабатывая по 600 видео в день.

Такой мгновенный успех показался основателям аномальным и незаслуженным. Решив, что «всё слишком просто», команда забросила Captions и потратила почти полтора года на попытки построить сложные социальные сети для старшеклассников. Спустя 18 месяцев Мисра зашел в личный кабинет разработчика, где всё это время бесхозно лежало первое приложение. К своему изумлению, он обнаружил на счету $500,000. Выручка росла по экспоненте сама по себе, при этом в панели техподдержки висело более 2000 неотвеченных тикетов от пользователей, скопившихся за полтора года. Команда экстренно свернула побочные проекты и вернулась к развитию Captions, что вызвало взрывной вертикальный рост финансовых показателей.

В завершение встречи Горав Мисра ответил на серию коротких вопросов Ленни:

* **Книги**: Гость принципиально не читает деловую литературу. По его убеждению, формат чтения устаревает, поэтому он осознанно развивает в себе навыки восприятия информации через аудио и видео (а книги на заднем плане его домашнего офиса принадлежат жене).
* **Кино и сериалы**: Мисра выделил научно-фантастические шоу «Укрытие» (Silo) и «Разделение» (Severance). Ленни признался, что читал трилогию книг Silo, и его раздражает, что сериал отклоняется от канона.
* **Сервисы**: Любимыми продуктами ежедневного использования гость назвал таск-менеджер Linear и почтовый клиент Superhuman за их эталонный дизайн. Ленни воспользовался моментом и прорекламировал свой новый годовой бандл для подписчиков стоимостью $200, дающий бесплатный доступ к Notion, Perplexity, Superhuman, Linear и Granola.
* **Жизненное кредо**: «Самый простой способ стать лучшим — быть первым».

В настоящее время Captions сохраняет структуру компактного раннего стартапа и активно нанимает первых продуктовых менеджеров, дизайнеров и инженеров. Главным критерием отбора Мисра называет готовность специалиста к экстремальному темпу еженедельных релизов готовых рыночных фич.