# Google выпустила конструктор ИИ-агентов: тест-драйв Vertex AI Agent Builder от Уэса Рота

Источник: https://www.youtube.com/watch?v=55QTd3rO7zw
Канал: Wes Roth
Опубликовано: 12.04.2024

---

Компания Google официально открыла доступ к Vertex AI Agent Builder — платформе, которая обещает демократизировать создание автономных ИИ-агентов. Автор канала Wes Roth провел первый тест-драйв инструмента, чтобы выяснить, действительно ли технология «no-code» готова к массовому использованию или она всё еще остается прерогативой разработчиков.

## 🚀 Первое знакомство: обещания Google и реальность консоли
[[JUMP:00:00]]

Несколько дней назад Google анонсировала внедрение ИИ-агентов во все свои системы для автоматизации клиентского сервиса, шопинга и повседневных задач [0:00]. Главным событием стал релиз Vertex AI Agent Builder — платформы, которая, по утверждению компании, позволяет любому человеку, независимо от технического бэкграунда, создавать собственных агентов для бизнеса или личной продуктивности [0:36].

Однако первые шаги в консоли Google Cloud оказались не самыми гладкими. При попытке настроить среду Wes Roth столкнулся с несколькими сбоями в работе интерфейса [1:29]. Ему пришлось пробовать разные регионы и имена проектов, прежде чем система позволила создать первое приложение [1:41].

Основные характеристики платформы на старте:

*   **Модели по умолчанию:** Основной моделью является Gemini 1.0 Pro [1:41].
*   **Альтернативы:** В настройках можно сменить модель; Уэс Рот отмечает, что Claude 3 Opus уже доступна в режиме публичного превью на Vertex AI [1:56].
*   **Типы приложений:** На выбор предлагаются «Поиск», «Чат» и «Рекомендации», но именно раздел «Агенты» позволяет создавать сложные системы, использующие инструменты и естественный язык для решения задач [1:02].

## 🛠 Архитектура агента: инструменты, инструкции и «магические заклинания»
[[JUMP:02:02]]

Процесс создания агента начинается с определения его роли и целей. Уэс Рот попытался создать «Агента Ноль» — торгового помощника для интернет-магазина [1:29]. Инструкции пишутся на естественном языке, например: «Ты — помощник, который помогает клиентам покупать товары и подтверждает детали заказа» [2:09].

Однако, по мнению ведущего, обещание «no-code» (без кода) пока выглядит преувеличенным. Для полноценной работы агенту требуются:

1.  **Инструменты (Tools):** Возможность подключения через OpenAPI, функции или хранилища данных [3:01].
2.  **Связки агентов:** Один «главный» агент может вызывать других специализированных агентов для подзадач [3:27].
3.  **Интеграции:** Готовые модули для мессенджеров, позволяющие встраивать агентов в существующие каналы связи [3:15].

Уэс Рот подчеркивает, что для использования инструментов пользователю всё равно необходимо понимать, как работают API и JSON-запросы [3:01]. По его оценке, на текущем этапе платформа больше ориентирована на веб-разработчиков, чем на рядовых пользователей, хотя Google и пытается сделать интерфейс максимально доступным [3:15].

## 🤖 Эксперимент с «роими агентов»: почему инструкции — это еще не всё
[[JUMP:03:27]]

В ходе часового тестирования автор создал систему из двух агентов: «Торгового ассистента» и «Кодового агента» [3:41]. 

*   **Торговый ассистент** общается с клиентом и, когда дело доходит до расчетов, передает задачу второму агенту [3:41].
*   **Кодовый агент** выполняет роль «робота, передающего масло» (аналогия из сериала «Рик и Морти»): его единственная задача — рассчитать налоги и итоговую сумму [4:20].

Для вычислений Уэс Рот подключил расширение **Code Interpreter**, аналогичное тому, что есть в OpenAI, которое позволяет ИИ оперировать цифрами и кодом [4:59]. Тем не менее, он признает, что система «из коробки» работает не идеально [5:12]. 

Ключевым открытием стало то, что эффективность агента критически зависит от раздела **Examples** (Примеры). Это реализация метода *few-shot prompting*: пользователю нужно детально расписать примеры диалогов, чтобы модель поняла, в какой момент вызывать инструменты или переключаться на другого агента [5:36]. По словам Уэса, если раздел с примерами пуст или плохо проработан, агент «валится» и не может эффективно выполнять задачи [5:49].

## 🏛 Разбор кейса от Google: управление очередью в DMV
[[JUMP:06:01]]

В качестве образца Google предоставляет пресеты, такие как агент для департамента транспорта (DMV) [6:01]. Это «рулевой» агент (steering agent), задача которого — не помогать клиенту напрямую, а максимально быстро направить его к узкоспециализированному помощнику [6:26].

Структура DMV-помощника включает:

*   **Маршрутизация:** Если клиент хочет записаться на прием, он передается агенту `book_appointment` [6:53].
*   **Сложные случаи:** Если тема касается цен или является чувствительной, запрос уходит к `fallback`-агенту, которым, скорее всего, является человек [7:06].
*   **Реальные инструменты:** Агент использует `DMV renew tool` и `DMV book appointment tool` для взаимодействия с внутренними базами данных [7:06].

При тестировании выяснилось, что в демо-режиме функции записи не работают полноценно, так как они ссылаются на фиктивные адреса (example.com), но сама логика переключения между ролями работает исправно [8:23]. Аналогичный пример Google реализовала для ритейла, где агент через API подключается к Google Store для поиска товаров и управления корзиной [8:35].

## 🔮 Будущее программирования: от кода к естественному языку
[[JUMP:09:25]]

Подводя итог, Уэс Рот задается вопросом: является ли это революцией? Он считает, что Google создала «прото-билдер» — базовую, рудиментарную версию того, что ждет нас в будущем [12:27]. 

Ведущий выделяет несколько важных трендов:

1.  **Магические инкантации:** Создание агентов начинает напоминать написание заклинаний, где в текст инструкции вставляются специальные маркеры для вызова других сущностей или инструментов [9:37].
2.  **Агентные рои (Agentic Swarms):** Будущее за множеством мелких агентов, каждый из которых идеально выполняет одну задачу, под управлением одного «мастера» [10:16].
3.  **Закат классического кода:** Уэс утверждает, основываясь на отчетах NVIDIA, OpenAI и Microsoft, что естественный язык постепенно вытесняет страницы традиционного кода [11:47]. Программирование превращается в написание четких инструкций на человеческом языке с небольшими вкраплениями программных вставок там, где нужна математическая точность [12:00].

Хотя текущий Vertex AI Agent Builder может разочаровать своей сложностью для новичков, Уэс Рот подчеркивает, что это важный шаг в правильном направлении [12:54]. Технологии развиваются быстро, и скоро ИИ сам будет понимать, какие API и хуки ему нужны, переводя наши желания в работающий софт [12:14].