От IoT к облаку: как Timescale переосмыслила PostgreSQL для эпохи ИИ

Startup Grind 563 29 мин 4 мин 15.06.2023
Главное

В условиях стремительного развития облачных технологий и искусственного интеллекта (ИИ) управление данными становится фундаментом для инноваций. В рамках дискуссии на Startup Grind Майк Фридман, сооснователь и технический директор (CTO) компании Timescale, а также профессор компьютерных наук Принстонского университета, встретился с Френсис Швип из Two Sigma Ventures. Они обсудили трансформацию Timescale из разработчика базы данных в облачную платформу, роль временных рядов в обучении ИИ и ключевые принципы построения продукта, способного конкурировать с технологическими гигантами.

🚀 Timescale: от специализированной базы данных к облачной платформе 1:34

Майк Фридман описывает эволюцию Timescale как переход от «компании, производящей базы данных с облачным дополнением» к «облачной компании с продуктом в виде базы данных» . Основная миссия проекта — «зарядить» PostgreSQL (одну из самых надежных систем с 30-летней историей) возможностями для работы с огромными масштабами современных данных .

Первоначально фокус был направлен на временные ряды (Time Series) и событийные данные, однако Фридман отмечает, что сегодня практически любая база данных объемом в сотни гигабайт состоит из событий:

По мнению Фридмана, база данных — это критически важный узел инфраструктуры, на котором строится современное ПО. Френсис Швип добавляет удачную метафору: если обычная база данных делает «фотоснимок» бизнеса, то временные ряды позволяют смотреть «кинофильм» о том, как меняются процессы во времени .

🧠 Роль исторических данных в эпоху ИИ и LLM 4:41

Обсуждая текущий бум искусственного интеллекта, Майк Фридман выделяет два аспекта: использование Timescale клиентами для ИИ-приложений и внедрение ИИ внутри самой компании.

Ключевой тезис Фридмана в этом разделе: создание новых инструментов против адаптации старых . По его мнению, во время появления новых доменов индустрия часто создает «безумное» количество кастомной инфраструктуры, но со временем большинство задач возвращается к проверенным технологиям.

Особое внимание уделяется векторным базам данных:

🛠 История создания: пивот от IoT к инфраструктуре 9:13

Компания Timescale не планировала создавать базу данных изначально. В 2015 году Майк и его сооснователь Эй-Джей работали над IoT-платформой (интернет вещей) . Они обнаружили, что на рынке нет инструмента, который бы:

  1. Был достаточно надежным для операционной деятельности (а не только для исследований).
  2. Поддерживал SQL.
  3. Позволял объединять метрики с бизнес-контекстом (метаданными) .

Когда разработчики решили переархитектурировать PostgreSQL для своих нужд и выложили результат в open source, интерес сообщества за первый месяц превысил интерес к их IoT-платформе за предыдущие полтора года . Это стало моментом истины для изменения курса компании.

☁️ Бизнес-модель: Open Source и облачная стратегия 11:23

Фридман считает, что в последние 20 лет инфраструктурное ПО обязано быть открытым (open source), чтобы завоевать доверие разработчиков . Однако выбор бизнес-модели для Timescale был специфичным.

Основные модели open source бизнеса по версии Фридмана:

  1. Платная поддержка.
  2. Open Core: часть кода открыта, продвинутые функции (Enterprise) — закрыты.
  3. Managed Service (Облако): управление инфраструктурой за клиента .

Timescale выбрала путь облачного сервиса. Это позволяет компании контролировать пользовательский опыт (UX) и избавлять разработчиков от операционной рутины — бэкапов, обеспечения высокой доступности (HA) и масштабирования .

Для защиты от «гиперскейлеров» (Amazon AWS, Google Cloud, Azure), которые могут перепродавать чужой open source, Timescale ввела специальную лицензию (Timescale License) . Она позволяет любому человеку использовать код бесплатно и даже в коммерческих целях, но запрещает предлагать Timescale «как услугу» (as-a-service). Это позволило компании держать весь код на GitHub открытым, не разделяя его на части в рамках команды разработки .

🏢 Культура и структура команды 18:27

Переход к модели «только облако» (Cloud-only) радикально изменил структуру организации. Майк Фридман выделяет следующие изменения:

💡 Советы фаундерам: о фокусе и смелости 20:41

Глядя назад, Фридман считает главным принципом «Сужение фокуса» (Narrow the focus). Один из его главных уроков — не пытаться делать одновременно и On-premise ПО, и Облачный сервис с самого начала.

Советы Майка Фридмана начинающим предпринимателям:

В завершение Майк анонсировал новые разработки в области эластичности инфраструктуры, которые призваны стереть грань между бессерверными (serverless) и выделенными решениями, помогая разработчикам избежать переплат при скачках нагрузки .

💬 Цитаты

«Требуется не менее 10 лет, чтобы построить надежную базу данных. Главное качество базы — вы не должны о ней думать, она должна просто работать.»

Майк Фридман 07:33

«Суперсила стартапа — в способности сузить фокус. Ваша цель не в том, чтобы выиграть весь рынок, а в том, чтобы завоевать небольшую часть, но иметь страстных пользователей.»

Майк Фридман 22:10
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Time Series (Временные ряды)
Тип данных, представляющий собой последовательность измерений, упорядоченных по времени.
Vector Database
Специализированная база данных для хранения объектов в виде векторов, что критично для поиска сходств в ИИ-моделях.
PLG (Product-Led Go-to-Market)
Стратегия развития, при которой сам продукт является основным драйвером привлечения и удержания клиентов.
📊 Цифры
🗓 Хронология
  1. 2015 Начало работы Майка и Эй-Джея над IoT-платформой.
  2. 2017 Выход TimescaleDB в open source и резкий рост интереса разработчиков (согласно контексту транскрипта о 'первом месяце').
  3. 2023 Активное внедрение векторных функций и адаптация под нужды LLM-приложений.
⚖️ Другая сторона
Стартапы и бизнес Timescale PostgreSQL Mike Freedman Cloud Computing Vector Database