# Эра ИИ-агентов: как Decagon, Resolve AI и Windsurf меняют бизнес

Источник: https://www.youtube.com/watch?v=Y3T-Th3IpfY
Канал: Greylock
Опубликовано: 03.06.2025

---

Венчурный фонд Greylock провел панельную дискуссию с участием руководителей трех ведущих стартапов в сфере искусственного интеллекта, посвященную практическому внедрению ИИ-агентов в корпоративном секторе. В обсуждении приняли участие основатели компаний Декагон (Decagon), Резолв АИ (Resolve AI) и Виндсерф (Windsurf), которые поделились опытом трансформации клиентского сервиса, DevOps и разработки программного обеспечения. Главным сюжетом встречи стал переход от простых ассистентов (копилотов) к автономным агентным системам, способным самостоятельно решать комплексные бизнес-задачи без постоянного контроля со стороны человека.

## 🤖 Эра ИИ-агентов: кто создаёт будущее автономных систем
[[JUMP:0:05]]

Партнер фонда Greylock Карин Райли (Karin Riley), специализирующаяся на ИИ-приложениях и инфраструктуре для сегмента B2B, открыла дискуссию, представив руководителей технологических компаний, находящихся на передовой внедрения автономных агентов. Каждый из приглашенных спикеров развивает агентные технологии в своей уникальной нише. 

Джесси (Jesse), сооснователь и генеральный директор компании Декагон (Decagon), создает ИИ-агентов для автоматизации клиентской поддержки через чаты, электронную почту и голосовые каналы. Варун (Verun), сооснователь Виндсерф (Windsurf) (ранее известной как Kodium и Exafunction), разрабатывает передовой редактор кода, призванный сократить время на создание ИТ-приложений на 99%. Спирос (Spiros), основатель Резолв АИ (Resolve AI), фокусируется на автоматизации сложных задач системной инженерии и DevOps, выходящих за рамки простого написания кода.

По словам Спироса, ключевая проблема крупных ИТ-систем заключается в огромных затратах времени инженеров на поддержание надежности инфраструктуры. Инвестиционный тезис Greylock в данном контексте очевиден: поддержка ИИ-агентов на ранних стадиях позволит радикально перестроить корпоративную архитектуру и клиентские операции, обеспечивая экспоненциальный рост эффективности бизнеса.

## 🔄 Эволюция интерфейсов: от второго пилота к автономному сотруднику
[[JUMP:4:37]]

Переход от привычных ИИ-помощников к полноценным агентам меняет саму структуру работы технологических команд. Как отмечает Спирос из Резолв АИ, популярные ИИ-копилоты способны ускорить работу отдельного программиста, но они бессильны, когда требуется повысить продуктивность всей команды в 10 раз. По его мнению, «копилот не станет держать дежурный пейджер вместо вас». Именно поэтому индустрии необходимы автономные системы, способные глубоко анализировать архитектуру — от исходного кода до баз данных — и самостоятельно расследовать инциденты еще до того, как они перерастут в критическую проблему.

Варун из Виндсерф подтверждает этот тренд, описывая эволюцию технологий разработки: от простейшего автодополнения строк до полноценного вызова функций и масштабного изменения кодовой базы непосредственно агентом. Разработчики больше не спрашивают ИИ, как решить задачу, они поручают ему сделать это напрямую в репозитории. По данным спикера, если год назад инструменты автоматизации брали на себя около 40% рутинного кода, то сегодня внутри самой компании Виндсерф агентная система генерирует уже от 80% до 90% всего программного обеспечения.

## 🛠️ Дилемма стартапа: создавать собственное решение или покупать готовое?
[[JUMP:7:42]]

Вопрос разработки собственных агентных решений внутри корпораций (Build vs Buy) упирается в определение ключевых компетенций бизнеса. Джесси (Декагон) сформулировал четкое правило: создавать ИИ-агентное приложение с нуля имеет смысл только в том случае, если оно формирует уникальное конкурентное преимущество и является ядром вашего продукта. В остальных ситуациях, например в клиентском сервисе, внутренняя разработка нерациональна. По его оценке, компании быстро осознают масштаб скрытых затрат: необходимость создания систем защиты, мониторинга, оповещений и удобных интерфейсов для нетехнических команд.

Спирос поддерживает эту позицию, подчеркивая, что создание простейшего ИИ-демо — задача легкая, но вывод приложения на уровень промышленной эксплуатации требует колоссальных ресурсов. Для сравнения он привел пример: сложнейшую платформу распределенного трейсинга в его прошлом стартапе создали всего 10 инженеров, в то время как команда Резолв АИ уже насчитывает более 40 специалистов самого разного профиля, от ИИ до UX.

Однако Варун поделился неожиданным внутренним кейсом Виндсерф, демонстрирующим демократизацию разработки. Перед официальным запуском они предоставили продукт всем сотрудникам, включая нетехнических специалистов. В результате вице-президент по партнерствам стал главным активным пользователем инструмента, полностью заменив покупной дорогостоящий софт для генерации коммерческих предложений собственными микро-приложениями, созданными с помощью ИИ.

## ⚙️ Кастомизация без кода: концепция AOPS и новые протоколы
[[JUMP:12:01]]

Гибкая настройка ИИ-агентов под уникальные бизнес-процессы клиентов остается главным вызовом для разработчиков. Джесси объяснил, что традиционные чат-боты строились на жестких деревьях решений, которые быстро упирались в потолок качества, а их обновление требовало участия программистов. Чтобы решить эту проблему, Декагон внедрил концепцию AOPS (Agent Operating Procedures — Агентские операционные процедуры). Это фреймворк, позволяющий руководителям клиентского сервиса без навыков программирования мгновенно обучать ИИ-агента с помощью обычных регламентов на естественном языке, сохраняя при этом контроль инженеров над базовым кодом системы.

Со своей стороны, Виндсерф сталкивается с еще более масштабной кастомизацией при работе с гигантами уровня JPMC, где десятки тысяч разработчиков используют платформу на кодовых базах объемом более 100 миллионов строк. По мнению Варуна, ручное документирование правил (создание файлов Readme) неэффективно, так как они устаревают за пару месяцев. 

Перспективным решением спикеры считают открытый протокол контекста моделей MCP (Model Context Protocol), позволяющий безопасно подключать агентов к внутренним системам данных корпораций, хотя вопросы безопасности и разграничения прав доступа все еще остаются открытыми.

## 📊 Оценка эффективности: как измерить ROI ИИ-агентов
[[JUMP:17:43]]

Методология оценки возврата инвестиций (ROI) от внедрения ИИ-агентов существенно различается в зависимости от сферы применения. В DevOps, как отмечает Спирос, клиенты часто склонны сравнивать ИИ с недостижимым идеалом, который не под силу даже человеку. Тем не менее, ценность системы измеряется снижением уровня стресса инженеров и избавлением от изнурительных ночных дежурств.

В сфере разработки ПО Варун рекомендует отказываться от метрик вроде «уровня принятия подсказок» (acceptance rate), так как их легко фальсифицировать, генерируя банальные закрывающие скобки. Вместо этого Виндсерф измеряет долю ИИ-генерируемого кода в финальных коммитах. Проводить классические трехмесячные A/B-тесты продуктивности крупные компании зачастую не успевают: к моменту завершения теста сам ИИ-продукт становится существенно лучше, что требует запуска нового цикла исследований.

Проще всего ROI поддается расчету в клиентском сервисе Декагон. Джесси выделил два ключевых измеряемых параметра:

* Процент заявок, полностью закрытых ИИ-агентом без участия человека.
* Уровень удовлетворенности конечных клиентов (CSAT).

При этом ИИ не обязан сразу идеально решать 100% задач: если агент берет на себя хотя бы 25% самых массовых запросов первого уровня (Tier 1), перенаправляя сложные случаи людям, это уже приносит бизнесу огромную экономию.

## 🤝 Человек в контуре: баланс ответственности и автономности
[[JUMP:21:48]]

Распределение задач между человеком и ИИ строится по принципу спектра сложности и критичности. Согласно логике Джесси, задачи первого уровня (Tier 1) полностью делегируются агентам, тогда как кейсы, требующие сложной аналитики, или высокорисковые операции (например, разбор мошенничества в регулируемых отраслях) передаются штатным сотрудникам.

В системной инженерии сбор симптомов с сотен дашбордов и выполнение тысяч поисковых запросов во время аварии — это идеальная работа для ИИ-агента. Однако, по мнению Спироса, современное состояние ИИ-агентов напоминает беспилотные автомобили: они могут быть безопаснее человека, но общество еще не готово полностью отпустить контроль. Руководитель Резолв АИ предлагает использовать следующий подход:

* Агент выполняет всю подготовительную аналитическую работу.
* Система берет на себя только обратимые изменения ИТ-инфраструктуры.
* Если требуется совершить необратимое действие, система обязана запросить явное одобрение человека.

## 🐝 Рой агентов: реальность или маркетинговый миф?
[[JUMP:24:38]]

Популярная концепция взаимодействия множества независимых ИИ-агентов (так называемые «рои» или swarms) вызывает серьезный скепсис у практиков рынка. Варун прямо заявил, что Windsurf проводил подобные эксперименты, но они не увенчались успехом. Ссылаясь на «горький урок» (bitter lesson) компьютерных наук и свой опыт разработки автономного транспорта, он отметил, что индустрия неизбежно движется от множества мелких специализированных моделей к единым сквозным массивным архитектурам (end-to-end), подобно переходу Tesla к подходу «пиксели на входе — крутящий момент на выходе». По его мнению, эффективнее развивать одну сильную модель, чем координировать множество слабых.

Джесси согласился с коллегой, добавив, что на текущий момент не видел ни одного успешного промышленного кейса работы «роя агентов». В будущем взаимодействие ИИ-агентов потребуется лишь для связи между изолированными корпоративными ИТ-системами. Спирос дополнил, что архитектурно их продукт состоит из внутренних компонентов (один понимает код, другой — телеметрию), но для пользователя это всегда единый интерфейс. Главным препятствием для кросс-агентского взаимодействия он назвал отсутствие единого языка и онтологии для описания ИТ-систем.

## 🌅 Снимая ограничения: технологический потолок ближнего горизонта
[[JUMP:28:00]]

Несмотря на текущие ограничения, разработчики видят четкие пути преодоления технологических барьеров в ближайшие годы. Для Декагон главным вызовом остаются открытые задачи третьего уровня (Tier 3), требующие глубокого логического рассуждения при отсутствии четкой документации — например, диагностика сложного аппаратного сбоя по косвенным признакам индикаторов.

Варун считает, что в обозримом будущем ИИ научится полноценно понимать изначальный замысел создания приложений и специфический контекст конкретного бизнеса, что позволит генерировать масштабные ИТ-системы на основе простого изменения спецификаций. По мнению Спироса, агенты пока пасуют перед принципиально новыми, уникальными проблемами, где у них нет накопленного опыта или примеров для обучения. В таких ситуациях человек, способный рассуждать на основе фундаментальных принципов (first principles), пока остается незаменимым, но преодоление этого барьера ИИ-моделями — лишь вопрос времени.

## 🛡️ Регулирование, комплаенс и безопасность: вопросы из зала
[[JUMP:31:17]]

В финальной части дискуссии спикеры ответили на вопросы аудитории о барьерах для проникновения ИИ-технологий в жестко регулируемые секторы экономики. Отвечая на вопрос о проникновении ИИ в здравоохранение и финтех, Джесси выразил уверенность, что задержка во внедрении вызвана исключительно комплаенсом и нормативными требованиями, а не отставанием технологий. По его прогнозу, финансовый сектор адаптирует ИИ-агентов значительно быстрее, чем медицина или страхование.

Коснувшись темы разделения ответственности за безопасность (Shared Responsibility Model), Джесси подчеркнул, что перед полноценным запуском крупные клиенты проводят обязательное тестирование в «песочницах» и привлекают специализированные команды для кибератак на ИИ (red team). На юридическом уровне ответственность за ошибки ИИ-агентов регулируется стандартными правилами для корпоративного ПО (SaaS), фиксирующими лимит ответственности поставщика на уровне однократной стоимости контракта.