Baseten: Как превратить ML-модель в полноценное приложение за несколько часов

Greylock 1,2 тыс. 27 мин 5 мин 26.04.2022
Главное

Венчурный фонд Greylock объявил об инвестициях в размере 20 миллионов долларов (Seed и Series A) в стартап Baseten — платформу, которая позволяет командам специалистов по машинному обучению (ML) самостоятельно создавать полноценные бизнес-приложения. В рамках выпуска подкаста «Gray Matter» генеральный партнер Greylock Сара Гуо обсудила с сооснователем и генеральным директором Baseten Тухином Шриваставой (Tuhin Srivastava), почему современный рынок ИИ-инструментов сфокусирован на исследованиях, а не на реальной ценности для бизнеса.

🚀 Переход от ML-моделей к бизнес-результатам 0:02

Сегодня создание сквозных продуктов на базе машинного обучения остается сложной задачей для бизнеса . Baseten предлагает решение, которое делает этот процесс быстрым и бесшовным, предоставляя serverless-инфраструктуру для создания масштабируемых приложений, интегрированных в рабочие процессы . По словам Тухина Шриваставы, платформа сокращает время окупаемости (time to value) усилий в области ML: команды могут внедрять свои модели в приложения производственного уровня за часы, а не за месяцы .

В рамках одной платформы специалисты по Data Science и ML могут:

Сара Гуо отмечает, что ландшафт инструментов для ML крайне перегружен стартапами, однако Baseten нашел свободную нишу («белое пятно») . В то время как большинство компаний сосредоточены на архитектуре моделей или установлении новых рекордов производительности (benchmarks), сфера применения этих инноваций к реальным бизнес-проблемам остается катастрофически недообслуживаемой .

Инвестиционный тезис Greylock заключается в том, что подавляющее большинство компаний находятся на ранней стадии пути к прикладному использованию ML . Часто бизнес откладывает внедрение ИИ, считая это «вторым шагом» своей стратегии — тем, что можно позволить себе только после найма огромной команды дорогостоящих специалистов . Baseten же стремится сделать ML продуктовой, а не исследовательской функцией .

🛠 Личный опыт: почему Data-сайентистам приходится становиться Full-stack инженерами 4:36

Идея Baseten выросла из личного опыта основателей (Тухина Шриваставы, Фила Башараба и Амира Абу-Эль-Нейла) . Тухин и Фил знакомы с 12 лет, а с Амиром они встретились в 2012 году, будучи первыми сотрудниками маркетплейса Gumroad .

В Gumroad Тухин столкнулся с проблемой мошенничества: объем фрода на платформе одно время превышал объем реальных транзакций . Имея академический опыт в ML, он быстро создал модель для обнаружения фрода. Однако возникла преграда: чтобы модель приносила пользу, ее нужно было интегрировать в продукт. У Тухина не было навыков разработки ПО, и CTO сказал, что свободных инженерных ресурсов нет .

В итоге Тухину пришлось самостоятельно:

Этот процесс занял несколько месяцев. По мнению Тухина, это неэффективно: для каждой новой ML-модели требовалось эквивалентное количество инженерных ресурсов . Аналогичную ситуацию Амир наблюдал в компании Clover Health, где врачи были вынуждены искать результаты работы сложных моделей в огромных таблицах, потому что не было удобного интерфейса . В результате многие перспективные ML-проекты закрывались из-за отсутствия видимого ROI и сложности внедрения .

👥 Кто и как использует Baseten сегодня 9:39

Сара Гуо подчеркивает, что требовать от кандидата наук (PhD) из Стэнфорда одновременно изучать React и DevOps — это нерациональное использование талантов . Baseten ориентируется на так называемые «hustler-команды» — специалистов, у которых есть опыт создания моделей, но нет мощной инфраструктурной поддержки .

Среди текущих пользователей платформы:

Тухин отмечает «магический момент», когда пользователи начинают самостоятельно осваивать концепции платформы — вьюхи (Views) и рабочие процессы (Worklets) — и приходить с запросами на улучшение конкретных бизнес-логик, а не просто жаловаться на инфраструктуру .

🏗 Три столпа платформы и путь через итерации 13:58

Разработка Baseten длилась более двух лет . Команда прошла через множество итераций, несколько раз полностью переписывая бэкенд и пересматривая абстракции . Тухин признает, что изначально они ошиблись с целевой аудиторией, ориентируясь на крупный энтерпрайз и не уделяя должного внимания удобству использования (usability) .

Сейчас продукт состоит из трех ключевых компонентов, которые Тухин называет «мини-компаниями внутри одной»:

  1. Движок развертывания моделей (Model Deployment): позволяет развернуть модель в один клик. В библиотеке уже более 30 современных моделей, включая Wave2Vec и интеграцию с GPT-3 .
  2. Конструктор рабочих процессов (Worklet Builder): создание API-эндпоинтов, где модель окружается бизнес-логикой (например, запись результатов предсказания напрямую в Salesforce) .
  3. Конструктор интерфейсов (Views): drag-and-drop редактор для создания UI, с которым будут взаимодействовать конечные пользователи или аналитики .

Платформа запущена в статусе публичной беты . Это решение принято, чтобы пригласить пользователей к сотворчеству, при этом сохранив пространство для маневра в доработке абстракций . Конечная цель — создание экосистемы шаблонов. Например, компания с проблемой модерации контента сможет на 90% решить свою задачу, используя готовый шаблон Baseten, включающий модель, логику очередей и интерфейс для ревьюера .

🌍 Удаленная работа и миссия компании 19:59

За последний год Baseten значительно расширил штат, достигнув отметки в 20 человек . Хотя Тухин изначально был противником удаленного формата, пандемия изменила его взгляды. Теперь это распределенная команда с сотрудниками в Сан-Франциско, Лос-Анджелесе, Сиэтле, Нью-Йорке, Бостоне и даже в Армении .

Тухин называет Baseten «миссионерской компанией» . Если стартап добьется успеха, в ближайшее десятилетие стоимость внедрения ML значительно снизится, циклы итераций ускорятся, а сотрудничество между разными ролями в команде станет более эффективным . Это приведет к тому, что все больше бизнесов будут видеть реальную отдачу от инвестиций в машинное обучение и увеличивать свои вложения в эту сферу.

💬 Цитаты

«Мы даем возможность командам внедрять свои модели машинного обучения в приложения производственного уровня за часы, а не за месяцы.»

Тухин Шривастава 00:43

«Сфера применения инноваций к реальным бизнес-проблемам сегодня массово недообслуживается всей индустрией.»

«Я быстро понял, что должен стать full-stack инженером, чтобы моя модель начала приносить хоть какую-то пользу.»

Тухин Шривастава 05:56
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Serverless
Модель облачных вычислений, при которой разработчик не занимается управлением серверами, а только пишет код.
Worklet
В контексте Baseten — блок бизнес-логики или API-эндпоинт, окружающий ML-модель.
Time to Value
Период времени с момента начала работы над проектом до момента получения первой реальной пользы или прибыли.
Underwriting
Процесс оценки рисков, в данном случае — финансовых активов с помощью ИИ.
📊 Цифры
🗓 Хронология
  1. 2012 Тухин Шривастава и Амир Абу-Эль-Нейл начали работать в Gumroad.
  2. 2018 Предыдущая компания Тухина и Фила (Good Shape) была поглощена.
  3. 2024 Запуск альфа-версии Baseten (ориентировочно за год до записи).
  4. Июнь 2026 Объявление о раундах Seed и Series A и переход в стадию публичной беты.
⚖️ Другая сторона
Стартапы и бизнес Baseten Greylock Machine Learning Tuhin Srivastava Sarah Guo