# CrewAI и Grock: как создавать и масштабировать автономных ИИ-агентов для бизнеса

Источник: https://www.youtube.com/watch?v=AMsmgJlVhmg
Канал: DeepLearning.AI
Опубликовано: 27.03.2025

---

Жоао Моура (João Moura), основатель CrewAI, и Грэм Стил (Graham Steele) из команды Grock представляют подробный технический обзор и мастер-класс по созданию автономных ИИ-агентов. В центре внимания — переход от простых чат-ботов к сложным системам, способным принимать решения, использовать инструменты и автоматизировать корпоративные процессы в промышленных масштабах.

## 🤖 Эволюция ИИ-агентов: от генерации контента к автономным действиям
[[JUMP:04:35]]

По мнению Жоао Моуры, современное понимание языковых моделей (LLM) должно выйти за рамки простого предсказания следующего токена или написания писем [04:49]. Ключевой характеристикой агента является «когнитивная функция» — способность выбирать лучший вариант из предложенных и принимать решения с высокой степенью уверенности [05:15]. 

Жоао Моура выделяет несколько фундаментальных отличий агентов:

*   **Уход от диалога:** Вместо бесконечного чата пользователь дает агенту конкретную задачу и цель [05:41].
*   **Использование инструментов:** Агент сам решает, когда ему нужно извлечь данные из Salesforce, а когда — обратиться к инвойсам в SAP [05:53].
*   **Автоматизация нового уровня:** По словам основателя CrewAI, ИИ-агенты — это «RPA (Robotic Process Automation) на стероидах», который не ломается при малейшем изменении интерфейса и справляется там, где традиционные системы автоматизации потерпели неудачу [06:22].

Согласно данным CrewAI, в январе 2025 года через их платформу было запущено более 50 миллионов агентов [03:44]. При этом в индустрии нет «чистого лидера» среди сценариев использования: задачи распределены между продажами, бэк-офисом, поддержкой и маркетингом [08:10]. Жоао Моура полагает, что в долгосрочной перспективе разработка агентов перейдет в категорию no-code, подобно конструкторам интернет-магазинов, хотя сегодня для создания сложных систем всё еще требуются инженеры [08:49].

## 🏗️ Архитектура CrewAI: Crews против Flows
[[JUMP:15:00]]

Жоао Моура объясняет, что экосистема CrewAI разделена на два основных подхода в зависимости от требуемой точности и сложности задачи.

**CrewAI Crews (Экипажи):**
Это группы агентов, работающих совместно над задачей. Разработчик настраивает количество запросов, временные лимиты и программные ограничения (guardrails) [15:24]. Основной упор здесь сделан на «агентность» (agency) — способность системы к самовосстановлению и самостоятельному поиску путей решения.

**CrewAI Flows (Потоки):**
Это событийно-ориентированная система автоматизации, которая позволяет сочетать обычный код с вызовами ИИ-агентов [15:50]. Жоао Моура считает этот подход идеальным для задач с высокой точностью. 

Основные особенности Flows:

*   **Механизм Publisher/Subscriber:** В отличие от жестких графов (как в LangGraph), Flows работают на основе событий [50:41].
*   **Управление состоянием (State):** Позволяет передавать данные между обычными функциями Python и «экипажами» агентов [16:30].
*   **Гибкое масштабирование:** Разные функции внутри потока могут масштабироваться независимо друг от друга в зависимости от нагрузки [1:08:15].

## 📊 Реальные кейсы: от IRS-форм до анализа транзакций
[[JUMP:10:15]]

Спикеры привели примеры использования агентов в компаниях из списка Fortune 500 [03:16]:

1.  **Финансовый сектор и OCR:** Один из клиентов CrewAI использует агентов для обработки бумажных чеков и писем. Агенты не просто распознают текст (OCR), но и анализируют рукописные пометки (например, «перевести 50% на счет X»), классифицируют запросы и делегируют их нужным отделам [12:03].
2.  **Сложная отчетность:** Жоао Моура упомянул кейс с заполнением форм налоговой службы США (IRS). Сама форма занимает 62 страницы, а инструкция к ней — 720 страниц [13:50]. Агенты справляются с этой высокой сложностью, обеспечивая необходимую точность.
3.  **Образовательный контент:** Крупный онлайн-бренд использует агентов для ускоренной генерации учебных курсов, где требуется креативность в сочетании с жесткой проверкой фактов [14:32].

## 🛠️ Мастер-класс Кейс №1: Подготовка к встречам
[[JUMP:18:14]]

Первый практический пример — автоматизация исследования участников встречи. Инструменты: CrewAI (Open Source) и Serper (поиск в сети).

Основные шаги:

*   **Определение ролей в YAML:** Жоао Моура подчеркивает важность использования YAML-файлов для описания агентов (Role, Goal, Backstory) [23:35]. По его мнению, ролевая игра заставляет LLM работать значительно лучше за счет правильного контекста [25:46].
*   **Задачи (Tasks):** Для каждой задачи прописывается `expected_output`. Это не только улучшает промптинг, но и позволяет использовать LLM как судью для оценки качества результата [27:37].
*   **Инструменты (Tools):** Агенту-исследователю (Researcher) выдаются инструменты для поиска в Google и скрапинга веб-страниц [29:20].
*   **Результат:** Агенты находят информацию об участниках (например, из компании Citadel), анализируют их приоритеты и готовят список «говорящих точек» и ожидаемых вопросов [37:10].

## 📄 Мастер-класс Кейс №2: Автогенерация документации проекта
[[JUMP:49:22]]

Второй кейс демонстрирует использование Flows для создания документации к GitHub-репозиторию. 

Технические особенности:

1.  **Pydantic для структурированных данных:** Вместо обычного текста на выходе получается объект Python со списком компонентов и файлов [53:06].
2.  **Кастомные инструменты:** Жоао Моура показывает, как создать инструмент менее чем в 100 строк кода, который подключается к любой внутренней API или базе данных [55:10].
3.  **Валидация Mermaid-диаграмм:** Чтобы избежать галлюцинаций ИИ при рисовании схем, в поток добавлен программный «гардрейл» (guardrail). Он проверяет синтаксис Mermaid и заставляет агента переделывать схему до тех пор, пока она не станет валидной [58:02].
4.  **Параллельное выполнение:** Благодаря аннотации `@listen`, функции создания документации и сохранения плана запускаются асинхронно в параллельном режиме [1:04:16].

## ⚡ Grock: Почему скорость инференса критична для агентов
[[JUMP:1:11:58]]

Грэм Стил, ведущий эксперт DeepLearning.AI и представитель Grock, представил концепцию LPU (Language Processing Unit). По его словам, GPU отлично подходят для обучения моделей, но крайне неэффективны для быстрого инференса [1:14:42].

Аргументы Грэма Стила в пользу Grock:

*   **Рекордная скорость:** Инференс Llama 3.3 70B на Grock значительно быстрее конкурентов [1:15:08].
*   **Параллельные запросы:** Для агентных систем, где одновременно запускаются десятки «экипажей», важна не скорость одиночного вызова, а производительность при массовой нагрузке [1:15:34].
*   **Экономика:** По мнению Грэма Стила, использование Grock позволяет масштабировать приложения без экспоненциального роста затрат [1:13:24].
*   **Совместимость:** API Grock полностью совместимо с форматом OpenAI, что позволяет переключить агентную систему на новый движок буквально одной строкой кода [1:17:18].

## 🎬 Кейс №3: Консервационные потоки и интеграция с Databricks
[[JUMP:1:19:21]]

Финальный пример — чат-бот, который в реальном времени анализирует каталог Netflix в базе данных Databricks.

Механика работы:

*   **Использование Llama 3.3 70B:** Модель запускается через Grock для обеспечения мгновенных ответов [1:19:50].
*   **Роутинг (Router):** Поток анализирует запрос пользователя. Если это простое приветствие, отвечает обычная LLM. Если требуется анализ данных, запускается Crew (экипаж) [1:23:55].
*   **Инструмент SQL-запросов:** Агенты самостоятельно пишут SQL-запросы к Databricks, получают данные о фильмах и возвращают структурированный ответ [1:25:36].
*   **Персистентность (Persistence):** Благодаря аннотации `@persist`, всё состояние потока и история переписки сохраняются в базе. Поток можно перезапустить с того же места, сохранив контекст [1:24:39].

---