# Как Genspark создал масштабируемого суперагента с выручкой 50 миллионов долларов

Источник: https://www.youtube.com/watch?v=Q24UKZSG8aQ
Канал: DeepLearning.AI
Опубликовано: 04.12.2025

---

На конференции AI Dev 25 в Нью-Йорке сооснователь и технический директор стартапа Genspark Кей Чжу (Kay Zhu) представил масштабное обновление платформы — экосистему суперагентов ИИ, которая позволила компании совершить беспрецедентный финансовый рывок. В ходе презентации разработчики и активные пользователи продемонстрировали, как отказ от жестко запрограммированных сценариев в пользу автономного планирования трансформирует привычные рабочие процессы в сфере недвижимости и создания контента. Главная технологическая интрига выступления крылась в деталях архитектуры мультиагентных систем, оптимизации контекстного окна и радикальном снижении затрат на API frontier-моделей.

## 📈 Взрывной рост и миссия Genspark
[[JUMP:0:07]]

Компания Genspark была основана в ноябре 2023 года. За два года своего существования стартап привлек два раунда финансирования на общую сумму 160 миллионов долларов. В апреле 2025 года разработчики выпустили пакет решений Super Agent Suite, который спровоцировал лавинообразный интерес со стороны рынка. Всего за пять месяцев после этого релиза компания преодолела отметку в 50 миллионов долларов регулярного годового дохода (ARR), о чем официально объявила в сентябре.

На текущий момент глобальная аудитория платформы превышает 10 миллионов пользователей. Венчурный фонд Bessemer Venture Partners (BVP) включил Genspark в число «сверхновых звезд ИИ» (AI Supernova). Кроме того, стартап официально вошел в клуб потребителей триллионов токенов OpenAI (OpenAI Trillion Token Club), что было отмечено в рамках презентации Сэма Альтмана на DevDay.

По словам Кея Чжу, глобальная миссия Genspark заключается в том, чтобы обеспечить трехдневную рабочую неделю для более чем 1 миллиарда работников умственного труда по всему миру. Руководитель стартапа объясняет это стремлением перенести опыт так называемого «вайб-кодинга» (vibe coding) — когда разработчики пишут код на высоких скоростях мысли с помощью таких инструментов, как Cursor или Claude — в повседневную жизнь обычных офисных сотрудников. Кей Чжу называет эту концепцию «вайб-воркингом» (vibe working).

За последние шесть месяцев компания выпускала примерно по одной новой функции каждую неделю. Первоначально экосистема состояла из привычных офисных ИИ-инструментов:

* AI Slides (генерация презентаций);
* AI Spreadsheets (умные таблицы);
* AI Documents (текстовые документы);
* AI Browser, AI Drive и AI Podcast.

Однако в последнее время Genspark сместил фокус в сторону создания полноценных виртуальных сотрудников, запустив такие продукты, как AI Developer, AI Designer и Clip Genius (интеллектуальный видеоредактор). Цель — предоставить пользователям агентов, способных выполнять ежедневную рутинную работу без необходимости писать код.

## 💼 Практические кейсы: революция в недвижимости и поиске инвесторов
[[JUMP:4:12]]

Для демонстрации реальных возможностей платформы на сцену был приглашен Джонатан (Jonathan), специалист с десятилетним опытом работы в сфере прямых инвестиций в недвижимость (Real Estate Private Equity). По оценке Джонатана, индустрия недвижимости традиционно отстает в плане внедрения технологий. Он утверждает, что при попытках использовать стандартные большие языковые модели — ChatGPT, Claude или Gemini — для анализа сложных финансовых таблиц он регулярно сталкивался с обилием ошибок, из-за чего инструменты приносили больше проблем, чем реальной пользы.

Ситуация изменилась около 9–10 месяцев назад, когда Джонатан начал внедрять Genspark. В качестве первого живого примера на сцене была продемонстрирована работа функций Mixture of Agents (смесь агентов) и автоматического построения промптов (Autoprompt). При вводе базового запроса на генерацию изображения система самостоятельно развернула его в подробное текстовое описание, проанализировала задачу и выдала сразу четыре различных варианта визуализации от разных ИИ-моделей в одном интерфейсе.

Второй кейс коснулся анализа портфеля жилой недвижимости. Джонатан загрузил в систему два отчета о сдаче в аренду (rent rolls), содержащих сырые массивы данных. Ему требовалось выяснить, сколько арендаторов продлили договоры, какого прироста в цене удалось достичь и каковы параметры новых договоров в случае выезда старых жильцов. По расчетам инвестора, у его аналитиков на подобную задачу ушло бы от одного до двух часов. Суперагент Genspark выполнил математические вычисления за секунды, после чего за 10 минут сформировал готовую презентацию для инвесторов. При этом личное время участия человека ограничилось 60 секундами на написание запроса.

Кей Чжу раскрыл техническую подоплеку этого процесса:

1.  Суперагент монтирует загруженные Excel-файлы в изолированную программную среду (песочницу).
2.  Запускается скрипт на Python с использованием библиотеки Pandas для первичного ознакомления со структурой данных.
3.  Затем генерируется комплексная программа для целевого анализа.

Во время демонстрации первый запуск кода завершился системной ошибкой, однако, как подчеркнул Кей Чжу, агент сумел автономно перехватить ошибку, скорректировать код и со второй попытки выдать верный результат. После этого суперагент делегировал задачу создания слайдов специализированному субагенту.

Третий сценарий Джонатана был связан с поиском капитала для инвестиций в Бирмингеме, штат Алабама. Команда не имела локальных контактов, поэтому суперагенту поручили проанализировать 25 последних регуляторных документов из базы SEC (Комиссии по ценным бумагам и биржам США / Edgar filings). Система отфильтровала фонды, семейные офисы и институциональных инвесторов, собиравших средства под аналогичные проекты, и выдала структурированный отчет с именами руководителей, контактами и точными суммами. Выяснилось, что за последний год в данном регионе активность проявили всего два игрока, привлекшие в общей сложности 227 миллионов долларов. Джонатан отметил, что его команда масштабировала этот подход на 15 крупных агломераций США, полностью автоматизировав сбор данных для холодного поиска партнеров.

## 🎙️ Пересборка подкастов и веб-разработка «без кода»
[[JUMP:15:05]]

Вторым приглашенным пользователем стал Дэвид (David) — преподаватель, предприниматель и создатель аудиоконтента на платформах X Spaces и LinkedIn. Еженедельно он записывает от 10 до 15 подкастов, посвященных обучению новичков основам криптовалют и биткоина. Главная сложность его работы заключается в удержании внимания аудитории: по его мнению, современные слушатели обладают клиповым мышлением, и заставить их слушать исходную 90-минутную запись практически невозможно.

Для решения этой проблемы Дэвид задействовал инструмент AI Pods от Genspark. Суперагент принимает на вход полный текстовый транскрипт полуторачасового эфира и сжимает его до четырех минут. На выходе получается полностью синтезированный аудиоподкаст, где сгенерированные мужской и женский голоса ведут живой диалог, шутят и обсуждают ключевые тезисы оригинального выступления.

Следующим шагом стала публикация материала через инструмент AI Developer. Дэвид, по собственному признанию, никогда в жизни не писал код и не знает синтаксиса Python, однако сформулировал задачу на естественном языке: создать веб-страницу под собственным кастомным доменом, разместить на ней плеер с четырехминутным ИИ-подкастом и структурированное текстовое саммари транскрипта.

Инструмент разработки Genspark развернул удаленную версию облачной среды проектирования (cloud code), создал полноценный функциональный веб-сайт и самостоятельно провел несколько итераций визуального улучшения интерфейса без какого-либо участия программистов. По заявлению Дэвида, это радикально упростило дистрибуцию контента для его корпоративных клиентов.

## 🛠️ Архитектура Super Agent: отказ от жестких сценариев
[[JUMP:21:15]]

Переходя к глубокому техническому разбору платформы, Кей Чжу сформулировал главный инженерный принцип Genspark: «меньше контроля, больше инструментов». Разработчики убеждены, что ИИ-агентам нужно делегировать свободу планирования, избегая жесткого программирования сценариев и цепочек операций (workflows). 

В подтверждение этого тезиса Кей Чжу раскрыл радикальный шаг компании: в апреле 2025 года они полностью закрыли свой старый и успешный ИИ-поисковик на базе архитектуры RAG (Retrieval-Augmented Generation), которым пользовались 5 миллионов человек, чтобы полностью переключить ресурсы на проект суперагента. Причиной послужило то, что фиксированные сценарии неизбежно ломаются на пограничных и нестандартных пользовательских запросах (edge cases). 

Агентный движок Genspark устроен иначе:

* В его основе лежит цикл `while`, внутри которого происходят вызовы большой языковой модели.
* Это позволяет системе осуществлять адаптивное планирование (adaptive planning) прямо на лету, динамически меняя состав задач и отмечая выполненные пункты.
* Такой подход обеспечивает высокую отказоустойчивость: если в традиционном линейном сценарии ошибки накапливаются и ведут к аварийному завершению, то суперагент способен анализировать логи сбоев и исправлять собственные действия в следующем цикле.

В индустрии существует философское течение ИИ-фундаментализма, сторонники которого считают, что языковой модели достаточно предоставить виртуальный доступ к клавиатуре, мыши и экрану компьютера, чтобы она решила любую задачу. По заявлению Кея Чжу, команда Genspark не разделяет это мнение. Они предоставляют агенту виртуальный компьютер с максимальным количеством предустановленных критически важных утилит, библиотек и подробной документации к ним. Модель способна читать инструкции к незнакомому софту и самостоятельно создавать новые программные инструменты под конкретную задачу. Это порождает экспоненциальное число комбинаций навыков и расширяет функциональные возможности системы.

## 🧠 Техническая изнанка: MoA, кэширование промптов и управление контекстом
[[JUMP:24:09]]

Архитектура агентного движка Genspark разделена на два ключевых контура: оркестрацию и самообучение. Контур оркестрации координирует работу смеси агентов, утилит и верифицированных наборов данных. Однако критически важным элементом системы, по мнению технического директора, выступает модуль оценки (evaluation / grader). Специальный ИИ-оценщик проверяет качество каждого промежуточного и финального артефакта, созданного агентом. На основе этих оценок система принимает решение о запуске второго круга генерации, а также собирает коллективную обратную связь для обучения с подкреплением (Reinforcement Learning) и автоматического улучшения книги промптов (prompt playbook).

### Архитектура Mixture of Agents (MoA)
[[JUMP:25:27]]

Для решения сложных аналитических задач Genspark не полагается на какую-то одну проприетарную коммерческую модель. Вместо этого применяется двухслойная схема:

* **Первый слой:** Сложный вопрос пользователя параллельно отправляется во все ведущие frontier-модели рынка, где каждая запускает свои процессы рассуждения.
* **Второй слой (Агрегатор):** Специализированный модуль считывает ответы всех моделей, анализирует логику их рассуждений, сопоставляет выводы и формирует единый синтетический результат. По данным компании, такой подход позволяет радикально снизить уровень галлюцинаций ИИ.

### Оптимизация кэширования и контекстного окна
[[JUMP:26:08]]

Разработчики ИИ часто недооценивают потенциал кэширования промптов (prompt caching). При изменении инструкций пользователем многие системы полностью перестраивают и перетасовывают историю диалога в зависимости от релевантности. В Genspark внедрили архитектуру контекста, работающую исключительно на добавление (append-only context design). Системный промпт и префиксы истории всегда остаются статичными и неизменными в памяти. Это гарантирует стабильное удержание коэффициента попадания в кэш (prompt caching hit rate) на уровне выше 80%. В зависимости от используемой базовой модели, такое инженерное решение позволяет экономить от 5 до 10 раз на оплате API-трафика и существенно снижает задержку до выдачи первого токена (latency).

Когда объем комплексной задачи начинает превышать лимиты контекстного окна моделей, в Genspark активируются два защитных механизма:

1.  **Контекстное уплотнение (Context compacting):** Когда окно заполняется на 70–80%, система автоматически инициирует процедуру, похожую на сборку мусора (garbage collection) в языках программирования. Специальный алгоритм сжимает всю историю, выделяя только ключевые факты и выводы, и освобождает пространство для дальнейшей работы.
2.  **Изоляция контекста (Context isolation):** Суперагент физически изолирует тяжелые задачи, делегируя их независимым субагентам. Если один субагент анализирует огромную таблицу, а второй верстает презентацию, их внутренние рабочие контексты не засоряют основное контекстное окно суперагента. Платформа поддерживает параллельный запуск множества таких процессов. При этом, ради сохранения технической простоты и исключения сбоев рассинхронизации, инженеры намеренно сохраняют линейную структуру контекста для всей мультиагентной системы, избегая хаотичного ветвления мыслей.

## ❓ Вопросы и ответы: корпоративный сектор и точность данных
[[JUMP:29:11]]

В финальной части презентации представитель фармацевтического гиганта Pfizer, занимающийся внедрением ИИ в производстве, поделился своим опытом использования платформы. Он отметил преимущество Genspark перед стандартным интерфейсом ChatGPT: если спросить ChatGPT о подготовке питч-дека, модель начинает задавать бесконечные встречные вопросы о цветах, стилях и форматировании, утомляя пользователя. Genspark же сразу берет задачу в работу и выдает готовый результат. На его вопрос о структуре выручки в 50 миллионов долларов Кей Чжу пояснил, что помимо индивидуальных подписок, у компании развернуты полноценные тарифные планы для enterprise-клиентов с возможностью пакетной закупки рабочих мест для команд. Также было анонсировано масштабное обновление платформы, намеченное на 20 ноября, где будут представлены новые функции совместной работы внутри команд и координации контекста.

Отвечая на вопрос об использовании готовых библиотек или фреймворков для реализации концепции «LLM как судья» (LLM as a judge), технический директор Genspark заявил, что компания полностью отказалась от сторонних абстракций. По его мнению, существующие на рынке фреймворки слишком абстрактны и скрывают критически важные детали реализации. Самостоятельное написание всей инфраструктуры (scaffolding) позволило инженерам стартапа получить тотальный контроль над мельчайшими процессами — вплоть до предотвращения инвалидации кэша промптов из-за непредвиденного поведения кода.

В заключение Кей Чжу ответил на вопрос о методах верификации данных на примере расчетов в недвижимости. Для обеспечения точности в корпоративном сегменте вокруг агентов выстроена многослойная система автоматической проверки. В частности, при работе с вычислениями в электронных таблицах агент обязан провести повторную независимую проверку — пересчитать итоговые финансовые показатели альтернативным математическим путем, чтобы исключить логические ошибки первичного прохода.