Тин Гейл о Baseten: «Инференс становится экосистемой инструментов»

Greylock 408 23 мин 3 мин 20.05.2026
Главное

Инфраструктура для эры агентов: как Baseten обеспечивает работу современных моделей

Видео под названием «Инфраструктура для AI-агентов с Baseten» от канала Greylock представляет глубокий анализ текущего состояния рынка AI-инфраструктуры. В беседе принимают участие ведущий канала и Тин Гейл (Tien Anh Nguyen), сооснователь и CEO компании Baseten. Основная тема дискуссии — переход компаний от использования готовых API к созданию собственной «интеллектуальной собственности» через дообучение моделей, а также вызовы, с которыми сталкиваются разработчики в условиях дефицита вычислительных мощностей и стремительного развития агентных технологий.

🏢 Baseten: инфраструктура для «собственного интеллекта» 0:27

Тин Гейл определяет Baseten как компанию, специализирующуюся на инфраструктуре для инференса (запуска моделей) производственного уровня, ориентированную на быстрорастущие компании. По мнению Гейла, мир движется не к двум-трем глобальным моделям, а к экосистеме, где компании обладают собственным «интеллектом».

Концепция перехода от «арендованного» интеллекта к «собственному» подразумевает, что компании перестают просто вызывать внешние API и начинают:

Гейл отмечает, что клиенты Baseten, такие как Cursor, Intercom, Decagon и OpenEvidence, активно занимаются дообучением собственных моделей.

📉 Кривая адаптации AI в бизнесе 3:00

Адаптация AI в бизнесе происходит по-разному в зависимости от зрелости компании:

  1. Стартапы: Начинают с готовых закрытых моделей для быстрого прототипирования, затем постепенно переходят к оптимизации и гибридным решениям.
  2. Стратегические компании: После достижения определенного масштаба начинают комбинировать закрытые, открытые и собственные модели для создания уникальных рабочих процессов.
  3. Enterprise: Пока этот сегмент находится на ранней стадии внедрения, фокусируясь в основном на прикладном уровне, а не на инфраструктуре.

Гейл считает, что сектор здравоохранения и финансов показывает наиболее быстрые темпы внедрения из-за предельно ясной окупаемости (ROI), несмотря на историческое технологическое отставание этих отраслей.

🧠 Посттренинг и новые инструменты 6:01

По словам Гейла, резкий рост интереса к дообучению моделей (fine-tuning) обусловлен тремя факторами:

В ноябре 2025 года Baseten приобрела компанию Parsed для развития направления непрерывного обучения (continual learning). Гейл подчеркивает, что компания не является исследовательской лабораторией, а фокусируется на клиентах, но проводит прикладные исследования для решения реальных бизнес-задач.

🤖 Эра долгосрочных агентов 10:34

В рамках дискуссии об агентных рабочих процессах (agentic workflows) Гейл отмечает, что сама природа инференса меняется. Если раньше это был прямой путь «ввод — вывод», то сейчас модели должны «размышлять», использовать инструменты и выполнять сложные многоэтапные задачи.

Инфраструктура для таких агентов требует:

⚡️ Дефицит мощностей и стратегия Baseten 19:18

Один из самых острых вопросов — дефицит вычислительных мощностей. Гейл называет ситуацию «в 10 раз более жесткой», чем принято думать в публичном поле. Крупнейшие компании мира выкупают практически всё доступное оборудование, что делает долгосрочное планирование практически невозможным.

Стратегия Baseten в таких условиях — максимальная распределенность. Компания работает с 15–20 облачными провайдерами и 80–100 регионами по всему миру. Это решение, принятое на ранних этапах развития, позволяет:

По словам Гейла, успех в такой быстро меняющейся среде требует от компании предельной близости к клиенту: инженеры Baseten регулярно общаются с пользователями, что позволяет оперативно адаптировать платформу к их нуждам.

💬 Цитаты

«Никто не хочет идти на компромисс по качеству. Вы заплатите 500% наценку за 10% лучшее качество для своих клиентов.»

Тин Гейл 0:00

«Инференс превращается из узкого решения в набор инструментов для решения более широкой проблемы.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Инференс
Процесс использования обученной нейронной сети для получения предсказаний или результатов на основе входных данных.
Дообучение (Fine-tuning)
Процесс дополнительной тренировки уже готовой модели на специфическом наборе данных для повышения точности в узкой задаче.
SLA (Service Level Agreement)
Соглашение об уровне обслуживания, гарантирующее определенные параметры работы сервиса, например, скорость ответа.
VPC
Виртуальное частное облако, изолированная сеть в облачной инфраструктуре.
📊 Цифры
🗓 Хронология
  1. 2022 Baseten начала эксперименты с дообучением через продукт Blueprint.
  2. Ноябрь 2025 Baseten приобрела компанию Parsed для развития исследований в области обучения.
⚖️ Другая сторона
Стартапы и бизнес Baseten Tien Anh Nguyen Greylock инференс AI-агенты