Анкур Гоял (Braintrust): «Evals — это единственный способ создать работающий ИИ»

Greylock 856 27 мин 3 мин 24.02.2026
Главное

Будущее ИИ-разработки: почему оценка моделей (evals) становится критическим ядром продукта 0:00

В индустрии искусственного интеллекта происходит фундаментальный сдвиг: фокус смещается с простых экспериментов с промптами на построение надежных, предсказуемых систем. Анкур Гоял, основатель и CEO компании Braintrust, в беседе с представителем Greylock объясняет, почему именно систематическая оценка (evals) является единственным способом создать работающий ИИ-продукт, а не просто «игрушку». В этом материале мы разберем философию продуктового развития Braintrust, культуру «одержимости клиентом» и то, как компания планирует упрощать разработку ИИ, делегируя часть задач самим нейросетям.

🧩 Evals как фундамент инженерного подхода 3:17

Анкур Гоял утверждает, что при разработке ИИ-продуктов создание эвалов (evals) должно стоять в центре процесса. Поскольку поведение больших языковых моделей (LLM) зачастую непредсказуемо, разработчик не может контролировать сам процесс «мышления» модели, но может контролировать ожидания от результата.

Основные тезисы подхода Braintrust к эвалам:

🛡️ Braintrust vs. DataDog: в чем разница? 14:15

Хотя Braintrust часто сравнивают с DataDog для ИИ-нагрузок, Анкур Гоял считает это сравнение отчасти близоруким.

🤝 Культура «одержимости клиентом» 8:11

Успех Braintrust во многом объясняется фокусом на узкую группу компаний с высокими требованиями (например, Stripe, Instacart, AirTable).

📈 Масштабирование и взгляд в будущее 21:53

Масштабирование команды в Braintrust происходит без сложной иерархии. Гоял отмечает, что отказ от индивидуальных встреч («one-on-ones») в пользу более динамичных процессов помог компании сохранять гибкость при быстром росте.

Что касается будущего, Анкур Гоял выделяет следующие тренды:

  1. Упрощение: ИИ-продукты будут становиться всё более простыми и доступными для массового использования.
  2. Self-improvement: С выходом новых поколений моделей, ИИ начинает эффективно анализировать собственную работу.
  3. Автоматизация внутри Braintrust: Платформа уже внедрила функцию Loop, которая автоматически улучшает промпты и ищет интересные кейсы в логах. В будущем это может привести к тому, что некоторые текущие функции продукта станут избыточными и будут удалены.
💬 Цитаты

«Если вы строите ИИ-продукт, нет смысла делать что-либо, кроме эвалов.»

Анкур Гоял 03:17

«ИИ — это во многом определение того, «что», а не «как».»

Анкур Гоял 04:56

«Агенты — это цикл for с инструментами.»

Анкур Гоял 16:16
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Evals (Оценка)
Процесс тестирования и верификации ответов, выдаваемых ИИ-моделью, для обеспечения стабильного качества.
LLM (Большие языковые модели)
Тип ИИ, обученный на огромных массивах текста для генерации контента и решения когнитивных задач.
Агент (AI Agent)
ИИ-система, способная автономно использовать инструменты для выполнения последовательности действий.
Product-Market Fit
Состояние, при котором продукт успешно удовлетворяет потребности значительного рыночного сегмента.
📊 Цифры
🗓 Хронология
  1. Ранее Анкур Гоял основал компанию Impira, которая была позже поглощена Figma.
  2. Октябрь – Январь Команда Braintrust работала над созданием первой версии системы перед отправкой первым клиентам.
⚖️ Другая сторона
Искусственный интеллект Braintrust Ankur Goyal Greylock AI engineering