На конференции Startup Grind Global 2021 сооснователь компании Snowflake Бенуа Дажевиль (Benoit Dageville) и технологический журналист Стив Хэмм обсудили путь одного из самых успешных технологических стартапов современности. История Snowflake — это классический пример того, как глубокая техническая экспертиза, помноженная на точное видение рыночных трендов, способна перевернуть индустрию управления данными. В ходе беседы спикеры подробно разобрали ключевые этапы эволюции компании: от зарождения идеи в кремниевой квартире до крупнейшего софтверного IPO в истории и амбициозной концепции глобального «облака данных».
🏠 Истоки: Рождение в данных и зарождение Snowflake 0:06
Бенуа Дажевиль часто шутит, что он «родился в данных». Свою докторскую диссертацию (PhD) во Франции в Университете Париж VI он посвятил архитектуре параллельных систем баз данных. В 1996 году, переехав в США, он присоединился к корпорации Oracle, которая на тот момент находилась в самом центре революции систем управления базами данных. Именно там Дажевиль познакомился со своим будущим бизнес-партнёром Тьерри Крюанесом. Вместе они проработали много лет в качестве ведущих архитекторов, стремясь сделать продукты Oracle лучшими на рынке.
Переломный момент наступил в 2012 году. Как вспоминает Бенуа Дажевиль, они с Тьерри осознали, что Oracle полностью упускает две важнейшие технологические революции:
- Революцию больших данных (Big Data), вызванную лавинообразным ростом машинно-генерируемой информации.
- Революцию облачных вычислений (Cloud Computing).
Поняв, что внутри жесткой корпоративной структуры Oracle создать принципиально новую систему невозможно, в августе 2012 года инженеры приняли смелое решение покинуть компанию, чтобы основать Snowflake.
⚡ Переломные моменты: Отказ от Hadoop и архитектурная революция 2:32
На начальном этапе основатели Snowflake не стремились построить масштабный бизнес ради самого бизнеса — их главной страстью было создание выдающегося продукта. В 2012 году на рынке больших данных доминировала технология Hadoop. Однако, по словам Дажевиля, они с Тьерри изначально не верили в жизнеспособность Hadoop из-за его колоссальной сложности, низкой скорости работы и отсутствия полноценной поддержки транзакций, критически важной для систем работы с бизнес-данными.
В то же время менялся и сам рынок. Если раньше аналитические системы и хранилища данных были элитарным инструментом, доступным исключительно топ-менеджменту крупных корпораций, то к 2012 году возникла острая потребность в демократизации данных — доступ к аналитике потребовался рядовым сотрудникам на всех уровнях организаций. Традиционные архитектуры баз данных превратились в «узкое горлышко», не справляясь с одновременными запросами множества пользователей к петабайтным массивам информации.
Важным фактором успеха на старте стало привлечение венчурного инвестора Майка Спайсера (Mike Spicer). По признанию Дажевиля, Спайсер не просто влил в проект первые деньги, но и дал основателям необходимую уверенность в своих силах. Более того, Майк Спайсер взял на себя роль первого генерального директора (CEO) Snowflake. Это позволило техническим сооснователям полностью сфокусироваться на решении сложнейших архитектурных задач, не отвлекаясь на операционное управление бизнесом.
До конца 2012 года Только что уволившиеся архитекторы провели в маленькой квартире Дажевиля в Сан-Матео на Эль-Камино-Реал, проектируя будущую систему. Они выделили три фундаментальных преимущества, которые облако может дать аналитике по сравнению с локальной ИТ-инфраструктурой (on-premise):
- Неограниченный доступ к ресурсам хранения и вычислений, позволяющий раз и навсегда решить проблему масштабирования.
- Предоставление решения в формате полноценного облачного сервиса (SaaS), где пользователю нужно лишь запускать запросы, полностью забыв об администрировании инфраструктуры.
- Истинная эластичность. В понимании Snowflake, эластичность — это не просто автоматическое добавление серверов в кластер, а изоляция различных рабочих нагрузок (workloads) вокруг единого массива данных.
Основатели Snowflake совершили революционный шаг, полностью разделив хранение данных (storage) и вычисления (compute). Благодаря этому разные департаменты компании или разные задачи больше не конкурируют за вычислительные мощности. В Snowflake новые ресурсы под конкретную задачу можно развернуть за считанные секунды.
Ещё одним ключевым архитектурным решением стала нативная поддержка полуструктурированных данных (например, веб-логов в формате JSON) на петабайтном масштабе. Система объединила в себе скорость классического дата-варехауса и гибкость инструментов Big Data. По мнению Стива Хэмма, дополнительным триггером взрывного роста стала инновационная модель оплаты: клиенты платят только за фактически использованные ресурсы. Бенуа Дажевиль отмечает «магию эластичности»: благодаря параллелизму можно увеличить вычислительную мощность в 10 раз, выполнить запрос в 10 раз быстрее и сразу отключить ресурсы, заплатив в итоге ровно ту же сумму, что и за медленную работу на одном сервере.
🛑 Ошибки и недооценённые вызовы на старте 12:08
Бенуа Дажевиль считает, что компания не совершала критических ошибок, которые могли бы погубить бизнес, однако ранний этап принёс множество тяжелых уроков. Главный вызов заключался в недооценке сложности поддержки глобального облачного сервиса, который должен работать в режиме 24/7. Создание SaaS-продукта принципиально отличается от разработки традиционного софта «из коробки» (on-premise).
Основателям пришлось на ходу учиться следующим вещам:
- Тотальной автоматизации всех процессов. В системе не должно быть ручного труда инженеров для исправления сбоев или проведения обновлений — всё обязано происходить незаметно в онлайне.
- Перестройке процессов релиз-менеджмента и обеспечения качества (QA), адаптированных под непрерывный цикл обновлений.
Вторым серьезным вызовом стало формирование команды на раннем этапе. Бенуа Хотя иронизирует над своим «фальшивым французским акцентом», он признаёт, что двум иностранным инженерам без опыта предпринимательства было невероятно трудно продавать свое видение потенциальным сотрудникам. По его мнению, если вы не можете убедить людей присоединиться к вашей идее, возможно, сама идея недостаточно хороша, поэтому умение увлекать за собой команду — это критически важный навык для фаундера.
💡 Главные уроки: Вектор на облако и абсолютный фокус на клиенте 14:06
Одним из самых смелых и судьбоносных решений Snowflake был категорический отказ от разработки локальной (on-premise) версии платформы. На ранних этапах многие крупные корпорации требовали развертывания системы на собственных серверах и предлагали за это огромные деньги. Однако сооснователи проявили жесткость. По словам Дажевиля, облако было их «Полярной звездой», и они ни разу не пошли на компромисс, четко понимая преимущества своей целевой модели.
На основе своего многолетнего опыта Бенуа Дажевиль сформулировал три главных урока для предпринимателей:
- Глубокий фокус на клиенте. Продукт должен кардинально менять и улучшать жизнь тех, кто им пользуется. Дажевиль и Хэмм подчеркивают, что Snowflake сохраняет этот фокус даже тогда, когда это кажется коммерчески невыгодным в краткосрочной перспективе. Например, когда инженеры Snowflake оптимизируют код, запросы клиентов начинают выполняться быстрее, и они временно тратят меньше денег (так как модель предусматривает оплату за секунды потребления ресурсов). Однако в долгосрочной перспективе довольные клиенты начинают переносить в Snowflake ещё больше задач, что оборачивается выигрышем для обеих сторон (win-win).
- Запредельный уровень личных обязательств. Создание стартапа Дажевиль сравнивает с воспитанием детей: нельзя просто запустить проект и отойти в сторону. Это долгосрочное вовлечение, требующее колоссальной доли оптимизма, поскольку фаундеру неизбежно придется сталкиваться с разочарованиями и кризисами.
- Бескомпромиссный подход к найму. Snowflake никогда бы не состоялась силами только двух человек. Самое главное — окружить себя людьми, которые разделяют ваши ценности и страсть к продукту, и никогда не снижать планку при подборе команды.
Бенуа Дажевиль полностью согласился с замечанием Стива Хэмма о том, что Snowflake принципиально не хочет повторять путь корпорации Oracle, которая, по мнению ИТ-сообщества, со временем сместила фокус с интересов клиентов на максимизацию прибыли за счёт жесткого лицензирования. Для Snowflake как для сервисной компании клиентоцентричность остается вопросом выживания.
🌐 Текущий этап: Масштабирование в эпоху Data Cloud и сетевые эффекты 14:33
Успешно реализовав первоначальное видение эффективного облачного хранилища данных, Snowflake перешла к гораздо более масштабной концепции — постронию Глобального Облака Данных (Data Cloud). Бенуа Дажевиль называет Snowflake «четвертым облачным провайдером». При этом компания не строит собственную физическую инфраструктуру (как Amazon, Microsoft или Google), а разворачивает свои логические регионы поверх существующих гиперскейлеров. На момент проведения интервью экосистема Snowflake включала 22 взаимосвязанных региона по всему миру, функционирующих как единая глобальная система. Это позволяет клиентам бесшовно перемещать данные между разными географическими зонами и разными облачными провайдерами (AWS, Azure, GCP).
Современный этап развития платформы характеризуется выходом далеко за рамки классической аналитики. Snowflake активно осваивает новые смежные вертикали:
- Data Engineering — обработка, оркестрация и трансформация потоков данных непосредственно внутри платформы.
- Data Science — запуск сложных моделей машинного обучения с использованием нативной поддержки языка Java и расширенных возможностей программирования данных.
- Разработка приложений (Applications) — создание тиражируемых программных продуктов сторонними стартапами прямо поверх Облака Данных.
Особое место в концепции Data Cloud занимает Collaboration (взаимодействие) и Data Sharing (обмен данными). Бенуа Дажевиль сравнивает технологию обмена данными в Snowflake с Google Docs. Провайдеру данных достаточно отправить ссылку, чтобы потребитель мгновенно получил доступ к живому, актуальному и безопасному массиву информации в своем аккаунте. При этом данные физически не копируются и не перемещаются, а вычислительные нагрузки стороннего пользователя полностью изолированы и не расходуют ресурсы владельца информации. Любые изменения, вносимые поставщиком, клиент видит в режиме реального времени.
На базе этой технологии развернут Snowflake Data Marketplace (маркетплейс данных). Компании могут монетизировать свои информационные активы или бесплатно делиться ими. В качестве примеров успешной кооперации Дажевиль привел:
- Компанию Star Schema, которая бесплатно дистрибутировала актуальные мировые данные о COVID-19, позволяя тысячам клиентов Snowflake мгновенно обогащать свою внутреннюю аналитику.
- Медицинский стартап Compile, агрегирующий сложнейшие данные из аптек и клиник для последующего безопасного шеринга с контрагентами.
- Платформу Heap, собирающую поведенческие клики с сайтов и передающую эти логи клиентам напрямую через маркетплейс для сквозного анализа.
По мнению Дажевиля, устранение информационных силосов (изолированных баз данных) способно породить мощнейший сетевой эффект, превращая Облако Данных во «Всемирную паутину для данных» (World Wide Web of Data). Это открывает грандиозные перспективы для науки, медицины и глобальных цепочек поставок.
Для поддержки предпринимателей, строящих свои продукты на базе Data Cloud, Snowflake развернула масштабную инфраструктуру поддержки:
- Программа Snowflake for Startups: предоставляет бесплатные кредиты на облако, архитектурные консультации и возможности совместного маркетинга.
- Венчурный фонд Snowflake Ventures: инвестирует в технологические компании на стадии роста, помогающие развивать общую экосистему данных.
- Конкурс Snowflake Startup Challenge: глобальное соревнование для ранних стартапов с главным призом в размере $250 000 на развитие проекта.
В завершение беседы Стив Хэмм упомянул совместно написанную с генеральным директором Фрэнком Слутманом книгу «Rise of the Data Cloud» («Восхождение Облака Данных»), которая служит практическим гидом по применению описываемых технологий в различных отраслях бизнеса.