Майкл Бабино, сооснователь компании Second Measure, в беседе с партнером Y Combinator Кевином Хейлом рассказывает о том, как превратить необработанные данные о транзакциях по банковским картам в мощный инструмент для инвесторов и корпораций. В центре дискуссии — путь от разработки видеоигр до создания аналитической платформы, которая помогает оценивать реальное состояние бизнеса и поведение потребителей задолго до официальных квартальных отчетов.
💳 От видеоигр к хедж-фондам: рождение идеи 0:00
Майкл Бабино и его соосновательница Лиллиан попали в набор YC Summer 2015 с идеей использовать данные кредитных карт для помощи инвесторам в принятии решений. До этого оба работали в Electronic Arts и других игровых стартапах, не имея прямого отношения к финансам.
Поворотным моментом стал звонок друга Майкла, работавшего в хедж-фонде с активами в $30 млрд. Друг просил помочь загрузить 2 терабайта данных с жесткого диска в Excel. Для инженера из Кремниевой долины это прозвучало абсурдно, но выяснилось, что даже гигантские фонды часто не имеют штатных разработчиков, ограничиваясь IT-специалистом и группой аналитиков.
Ключевые предпосылки для бизнеса:
- Инвесторы ищут «информационное преимущество» (information edge).
- Они используют косвенные индикаторы, такие как Google Trends или посещаемость сайтов (comScore), чтобы предсказать продажи до публикации квартальных отчетов.
- Существует огромный разрыв между наличием сырых данных и способностью их анализировать без команды программистов.
📊 Геймдизайн как модель бизнес-аналитики 4:35
Майкл Бабино объясняет, что опыт работы в таких компаниях, как Zynga, оказался критически важен. В онлайн-играх всё строится на метриках: если уровень слишком сложный, игроки уходят; если слишком легкий — им скучно.
В игровой индустрии сложился стандартный цикл:
- Инструментарий приложения фиксирует каждое событие (игрок прошел уровень, игрок погиб).
- Данные проходят через конвейер обработки и попадают в базу для запросов.
- Геймдизайнеры (не умеющие писать код) задают вопросы о поведении игроков.
Майкл утверждает, что вместо того чтобы постоянно выгружать отчеты вручную, эффективнее построить инструмент, который позволит конечному пользователю самому отвечать на свои вопросы. По его мнению, этот же паттерн идеально ложится на инвестиционную сферу: аналитики знают, какие вопросы задавать, им просто нужен инструмент для доступа к данным.
🧪 Проблема «грязных» данных и фиаско опросов 9:08
Главной технической сложностью стала работа с транзакционными данными. По словам Майкла, это «грязный» набор данных с массой неструктурированных проблем. Традиционно инвесторы полагались на рыночные опросы, чтобы понять, например, как скандал с отравлениями в Chipotle повлиял на выручку.
Проблемы старого подхода (опросов):
- Скорость: сбор данных занимает недели или месяцы.
- Стоимость: десятки или сотни тысяч долларов.
- Выборка: крошечные группы (например, 100 человек), которые могут быть нерепрезентативны.
Second Measure предложила альтернативу: прямое наблюдение за покупками миллионов реальных потребителей в США в режиме реального времени. Это позволяет мгновенно увидеть падение или рост выручки без ожидания ответов респондентов.
🚀 Продажи через «взлом» системы Y Combinator 11:32
Первыми клиентами стартапа стали венчурные капиталисты (VC). Майкл признается, что они немного «схитрили», используя статус участников YC. Поскольку инвесторы всегда хотят пообщаться с фаундерами до Demo Day, команда Second Measure использовала эти встречи для продажи продукта.
Процесс выглядел так: инвестор звал команду, чтобы оценить их как объект для вложений, а Майкл предлагал им купить доступ к платформе для проведения аудита других компаний. В итоге большинство крупных фондов Bay Area стали их платными клиентами.
Сильные стороны продукта для VC:
- Diligence (проверка): подтверждение цифр, которые стартап рисует на слайдах.
- Конкурентный анализ: сравнение, например, Bird и Lime. VC может увидеть не только рост одной компании, но и её долю рынка относительно конкурентов.
- Юнит-экономика: отслеживание трат клиентов (LTV) и удержания (retention) по когортам.
🎙️ Инсайты из блога: Stitch Fix, Peloton и Amazon 18:05
Second Measure создала собственную редакционную команду из дата-сайентистов и журналистов, чтобы публиковать рыночные исследования. Это стало мощным маркетинговым инструментом.
Интересные находки компании:
- Stitch Fix: аналитики предполагали, что сервис отнимает выручку у универмагов. Данные показали обратное: клиенты Stitch Fix стали тратить на одежду больше в целом, не снижая расходы в обычных магазинах.
- Peloton vs. SoulCycle: данные транзакций подтвердили, что Peloton обошел SoulCycle по количеству активных платящих участников в месяц. SoulCycle публично отрицала это, но не смогла оспорить конкретные цифры.
- Amazon Prime: компания всё больше превращается в подписной бизнес. Даже если пользователи перестают платить за Prime, они всё равно тратят на Amazon больше, чем до подписки.
🧠 Найм «Ученых с большой буквы» 29:02
Команда Second Measure выросла до 60 человек, треть из которых имеют степень PhD. Среди сотрудников — специалисты по статистической генетике, когнитивной нейробиологии и даже теории струн.
Майкл Бабино выделяет ключевые принципы найма:
- Приоритет фундаментальных знаний: научить Python или R можно быстро, но научить математике и статистике — нет.
- Поиск «драконов»: в данных всегда есть аномалии. Хороший специалист не верит в идеальность данных, а ищет искажения, которые могут разрушить выводы.
- Первые принципы: способность декомпозировать неструктурированную проблему и решать её по частям, когда нет готовых инструкций.
🛠️ Ад технической нормализации 36:16
Майкл подробно описывает, почему данные кредитных карт так сложно анализировать. В выписке вместо «Starbucks» может быть написано «SBUX» или «MW San Carlos» (Men's Wearhouse).
Масштаб проблемы:
- В базе данных более 50 миллиардов транзакций.
- Существует 1 миллиард уникальных текстовых описаний транзакций.
- Только у сети Macy's встречается около 3 миллионов вариантов написания в чеках.
Ошибки возникают на уровне людей, настраивающих POS-терминалы (например, во франшизах McDonald's), или из-за технических сбоев при передаче символов (замена апострофа на звездочку или пробел). Second Measure строит сложные системы «разрешения сущностей» (entity resolution), чтобы сопоставить все эти варианты с конкретными брендами.
🏢 От инвесторов к корпоративным гигантам 43:44
Изначально компания фокусировалась только на инвесторах, следуя совету YC о предельной концентрации. Однако книга Клейтона Кристенсена «Competing Against Luck» и теория «Jobs to be Done» заставили их пересмотреть подход. Майкл понял, что работа, которую выполняет их продукт — понимание эффективности компании — нужна не только фондам, но и самим корпорациям для конкурентной разведки.
Новый этап развития:
- Раунд Series A: привлечено финансирование от Bessemer Venture Partners, Goldman Sachs и Citigroup.
- Альтернативные данные: Goldman Sachs активно инвестирует в это направление (спутниковые снимки, геопозиция, данные карт), и Second Measure стала их стратегическим партнером в сегменте транзакций.
- Масштабируемость: компания отслеживает около 5000 брендов и планирует расширять этот список.
Майкл подчеркивает, что даже если данные станут общедоступными (commodity), преимущество получит тот, кто умеет задавать более креативные и глубокие вопросы.