# Как создать мощного AI-агента одним API-вызовом

Источник: https://www.youtube.com/watch?v=W3f9Mdyc_Xg
Канал: DeepLearning.AI
Опубликовано: 04.12.2025

---

## Создание интеллектуальных агентов для глубокого поиска: подход Groq
[[JUMP:0:00]]

Создание эффективных AI-агентов остается сложной инженерной задачей, часто сталкивающейся с проблемами низкой скорости работы и высокой латентности. Хатидже Озен (Hatice Ozen) из Groq представила концепцию «составных AI-систем» (Compound AI Systems), позволяющую реализовать глубокий поиск с помощью всего одного API-вызова. Основная идея заключается в переносе оркестрации инструментов и логики обработки на серверную сторону, что кардинально снижает задержки и упрощает разработку.

### Проблематика современных AI-агентов
[[JUMP:1:07]]

По словам Озен, большинство разработчиков сегодня находятся на стадии экспериментов, и создание действительно работающих агентов сопряжено с рядом препятствий:

* **Проблема управления состоянием:** Агенту необходимо поддерживать контекст беседы на протяжении нескольких вызовов LLM.
* **Сложность оркестрации:** Требуется ручная настройка маршрутизации между инструментами, обработка ошибок и координация внешних API.
* **Латентность:** В условиях, когда каждое звено цепочки (LLM + вызов API + рассуждения) добавляет задержку, итоговый пользовательский опыт становится неудовлетворительным. 
* **Торговая площадка возможностей:** Разработчики вынуждены упрощать своих агентов, чтобы они работали достаточно быстро, тем самым жертвуя их функциональностью.

Хатидже Озен отмечает, что для таких критических областей, как высокочастотная торговля или автоматизация программирования, задержки в работе агентов недопустимы, так как они делают процесс неэффективным.

### Архитектурное решение: Groq и LPU
[[JUMP:12:08]]

Компания Groq (основанная в 2016 году Джонатаном Россом, изобретателем TPU в Google) делает ставку на собственное железо — LPU (Language Processing Unit).

* **Отличие от GPU:** В отличие от традиционных графических процессоров, архитектура LPU спроектирована специально для задач логического вывода (AI inference), что позволяет достигать кратного прироста скорости.
* **Совместимость:** API Groq полностью совместимо с OpenAI. Для перехода на Groq достаточно заменить `base_url`, `API key` и `model ID` в существующем коде.
* **Отсутствие «бутылочного горлышка»:** Программная часть Groq построена таким образом, чтобы минимизировать необходимость в сложной оптимизации ядер (kernelless compiler), что обеспечивает гармонию между софтом и «железом».

### Как построить агента с помощью Compound AI
[[JUMP:14:51]]

Система Groq Compound берет на себя всю «грязную» работу по интеграции инструментов. 

1.  **Серверная оркестрация:** Инструменты, такие как веб-поиск (используются проверенные провайдеры, например, Brave Search), выполнение кода и автоматизация браузера, уже встроены в систему.
2.  **Минимум кода:** Вместо того чтобы настраивать клиентские инструменты, разработчик делает один API-вызов, который запускает агента с доступом ко всем возможностям.
3.  **Гибкость:** Пользователи могут использовать параметры `include_domain` и `exclude_domain` для настройки области поиска, что особенно полезно для специфических исследовательских задач.

### Перспективы и вопросы сообщества
[[JUMP:25:34]]

В ходе обсуждения Хатидже Озен ответила на вопросы о дальнейшем развитии платформы:

* **Интеграции:** Groq активно работает с экосистемой low-code/no-code инструментов, таких как LangFlow. При отсутствии прямой интеграции всегда доступна опция «bring your own key».
* **Мониторинг:** На данный момент Groq не создает собственные инструменты для глубокой наблюдаемости (observability), но поддерживает интеграцию с популярными решениями вроде Arise или MLflow.
* **Планы:** В ближайшем будущем ожидается поддержка серверов MCP (Model Context Protocol), что позволит разработчикам подключать к агентам любые собственные инструменты для еще более глубокой кастомизации.