Wes Roth: «Массивная волна ИИ-агентов вот-вот накроет рынок»

На пороге новой технологической волны концепция одиночных ИИ-чат-ботов уступает место «роям» и «деревням» автономных агентов, способных к коллективному решению сложных задач. В своем новом обзоре технологический аналитик и автор канала Wes Roth исследует последние достижения в области «агентских роев» (agentic swarms), представляя проекты Agent Village, GenSpark и Lindy, которые переводят ИИ из режима консультанта в режим исполнителя реальных дел — от бронирования ресторанов по телефону до массового персонализированного маркетинга.

🏘️ Agent Village: стриминг коллективного разума 0:38

Одной из самых интригующих новинок Уэс Рот называет проект «Agent Village» (Агентская деревня) от AI Digest . Концепция представляет собой групповой чат, в котором четыре ИИ-агента, работающие на разных моделях (включая Claude 3.7 Sonnet, GPT-4o и модели семейства O1), сотрудничают в режиме реального времени для достижения амбициозной цели .

В текущем эксперименте перед «деревней» поставлена задача: выбрать благотворительную организацию и собрать для неё как можно больше пожертвований . Особенности проекта включают:

Публичность: работа агентов транслируется в прямом эфире, подобно стримам на Twitch, позволяя пользователям наблюдать за процессом и взаимодействовать с ними .
Специализация моделей: каждая модель берет на себя разные роли. Например, Claude 3.7 Sonnet специализируется на написании фандрайзинговых историй и призывов к действию, в то время как GPT-4o занимается исследованием рынка .
Использование инструментов: агенты способны взаимодействовать с интерфейсом компьютера, создавать документы в Google Docs и делиться ими друг с другом .

Рот отмечает забавный момент: GPT-4o в какой-то момент «саботировала» работу, перестав использовать компьютер, в то время как другие модели пытались проходить проверки CAPTCHA («подтвердите, что вы человек»), что выглядит иронично для ИИ . Автор прогнозирует, что подобные системы станут крайне популярными, когда в процесс вмешаются известные «джейлбрейкеры» (взломщики промптов), такие как Pliny the Prompter, что может привести к непредсказуемым результатам .

⚡ GenSpark: суперагент для повседневных задач 6:42

Стартап GenSpark, по словам автора, недавно привлек $100 млн инвестиций от фондов из США и Сингапура, чтобы составить конкуренцию Google . Проект уже имеет более 2 млн активных пользователей в месяц и стремится к оценке, сопоставимой с Perplexity (около $9 млрд) .

Ключевой продукт компании — «Super Agent» — демонстрирует возможности, выходящие за рамки простого поиска информации. Эрик, представитель GenSpark, в демонстрационном ролике показал выполнение комплексных поручений :

Планирование и бронирование: ИИ не просто составляет маршрут по Сан-Диего, но и совершает реальный телефонный звонок в ресторан через интеграцию с 11 Labs для бронирования столика .
Голосовая коммуникация: в записи звонка агент успешно общается с менеджером ресторана по имени Jillian, обсуждая диетические ограничения (аллергия на моллюсков) и предпочтения по местам (столик у окна) .
Генерация контента: суперагент способен самостоятельно создать видеорецепт или даже эпизод в стиле мультсериала South Park, посвященный актуальным новостям (например, скандалу в Signal), проходя путь от написания сценария до озвучки и монтажа .

Рот считает, что возможность ИИ совершать сотни звонков одновременно (например, для поиска дефицитного чипа Nvidia 5090) станет революционным удобством для пользователей .

🐝 Lindy 2.5: мощь «агентских роев» в бизнесе 11:24

Третьим важным обновлением стал анонс версии Lindy 2.5, ключевой особенностью которой стали «агентские рои» (Agentic Swarms) . Фло, представитель Lindy, объясняет, что рой позволяет автоматизировать списки задач любого масштаба за счет параллельного запуска множества агентов .

В статье выделены три основных бизнес-кейса использования Lindy:

Подготовка к встречам: ИИ-рой каждое утро анализирует календарь пользователя. Для каждого участника встречи создается отдельный агент, который собирает досье, находит профили в LinkedIn и присылает сводный отчет на почту .
Конкурентный анализ: система ежемесячно мониторит список компаний-конкурентов, собирая данные о численности сотрудников, объемах трафика и последних новостях .
Массовые продажи (Outreach): на примере списка основателей «компаний-единорогов» Lindy демонстрирует, как рой за секунды создает сотни персонализированных электронных писем. Каждый агент исследует конкретного человека в сети, чтобы сделать письмо максимально релевантным .

По утверждению разработчиков, количество задач не имеет значения — будь то 20 или 200 писем, они обрабатываются одновременно .

🔮 Будущее автономных систем 14:00

Подводя итог, Уэс Рот подчеркивает, что мы видим лишь самое начало волны . Он предлагает зрителям представить ближайшее будущее, где «агентские рои» смогут решать задачи по разработке видеоигр в прямом эфире: один агент создает код, другой — иллюстрации, третий занимается тестированием .

Хотя многие из представленных функций еще требуют тщательной проверки на надежность, автор убежден, что прогресс в автономности и способности ИИ взаимодействовать с реальным миром (через звонки и браузер) фундаментально изменит способ нашего взаимодействия с технологиями.