Как создать мощного AI-агента одним API-вызовом

DeepLearning.AI 880 30 мин 2 мин 04.12.2025
Главное

Создание интеллектуальных агентов для глубокого поиска: подход Groq 0:00

Создание эффективных AI-агентов остается сложной инженерной задачей, часто сталкивающейся с проблемами низкой скорости работы и высокой латентности. Хатидже Озен (Hatice Ozen) из Groq представила концепцию «составных AI-систем» (Compound AI Systems), позволяющую реализовать глубокий поиск с помощью всего одного API-вызова. Основная идея заключается в переносе оркестрации инструментов и логики обработки на серверную сторону, что кардинально снижает задержки и упрощает разработку.

Проблематика современных AI-агентов 1:07

По словам Озен, большинство разработчиков сегодня находятся на стадии экспериментов, и создание действительно работающих агентов сопряжено с рядом препятствий:

Хатидже Озен отмечает, что для таких критических областей, как высокочастотная торговля или автоматизация программирования, задержки в работе агентов недопустимы, так как они делают процесс неэффективным.

Архитектурное решение: Groq и LPU 12:08

Компания Groq (основанная в 2016 году Джонатаном Россом, изобретателем TPU в Google) делает ставку на собственное железо — LPU (Language Processing Unit).

Как построить агента с помощью Compound AI 14:51

Система Groq Compound берет на себя всю «грязную» работу по интеграции инструментов.

  1. Серверная оркестрация: Инструменты, такие как веб-поиск (используются проверенные провайдеры, например, Brave Search), выполнение кода и автоматизация браузера, уже встроены в систему.
  2. Минимум кода: Вместо того чтобы настраивать клиентские инструменты, разработчик делает один API-вызов, который запускает агента с доступом ко всем возможностям.
  3. Гибкость: Пользователи могут использовать параметры include_domain и exclude_domain для настройки области поиска, что особенно полезно для специфических исследовательских задач.

Перспективы и вопросы сообщества 25:34

В ходе обсуждения Хатидже Озен ответила на вопросы о дальнейшем развитии платформы:

💬 Цитаты

«Контекст — это король. Нам нужно дать нашей LLM доступ к правильному контексту, чтобы она могла дать нам ответы, основанные на данных в реальном времени.»

Хатидже Озен 2:48

«Я не ненавижу GPU, они хороши для тренировки моделей, но они не являются тем решением, которое нам нужно сейчас, особенно когда мы пытаемся создавать работающих AI-агентов.»

Хатидже Озен 12:49
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
LPU (Language Processing Unit)
Специализированная архитектура чипов Groq, оптимизированная для сверхбыстрого выполнения задач логического вывода AI.
AI Inference
Процесс использования уже обученной нейросети для получения ответов на запросы пользователей.
Compound AI Systems
Системы, построенные на объединении нескольких моделей и инструментов в единый рабочий процесс с серверной оркестрацией.
MCP (Model Context Protocol)
Стандарт, позволяющий агентам подключаться к внешним источникам данных и инструментам в стандартизированном виде.
📊 Цифры
🗓 Хронология
  1. 2016 Основание Groq Джонатаном Россом после ухода из Google.
  2. 2020 Публикация первой ISA-статьи о аппаратной архитектуре LPU.
  3. 2022 Публикация второй ISA-статьи о развитии архитектуры LPU.
  4. 2024 (начало) Период активного осознания ограничений LLM и начала массового интереса к AI-агентам.
⚖️ Другая сторона
Искусственный интеллект Groq LPU AI agents Compound AI Systems Hatice Ozen