CrewAI и Grock: как создавать и масштабировать автономных ИИ-агентов для бизнеса

Жоао Моура (João Moura), основатель CrewAI, и Грэм Стил (Graham Steele) из команды Grock представляют подробный технический обзор и мастер-класс по созданию автономных ИИ-агентов. В центре внимания — переход от простых чат-ботов к сложным системам, способным принимать решения, использовать инструменты и автоматизировать корпоративные процессы в промышленных масштабах.

🤖 Эволюция ИИ-агентов: от генерации контента к автономным действиям 4:35

По мнению Жоао Моуры, современное понимание языковых моделей (LLM) должно выйти за рамки простого предсказания следующего токена или написания писем . Ключевой характеристикой агента является «когнитивная функция» — способность выбирать лучший вариант из предложенных и принимать решения с высокой степенью уверенности .

Жоао Моура выделяет несколько фундаментальных отличий агентов:

Уход от диалога: Вместо бесконечного чата пользователь дает агенту конкретную задачу и цель .
Использование инструментов: Агент сам решает, когда ему нужно извлечь данные из Salesforce, а когда — обратиться к инвойсам в SAP .
Автоматизация нового уровня: По словам основателя CrewAI, ИИ-агенты — это «RPA (Robotic Process Automation) на стероидах», который не ломается при малейшем изменении интерфейса и справляется там, где традиционные системы автоматизации потерпели неудачу .

Согласно данным CrewAI, в январе 2025 года через их платформу было запущено более 50 миллионов агентов . При этом в индустрии нет «чистого лидера» среди сценариев использования: задачи распределены между продажами, бэк-офисом, поддержкой и маркетингом . Жоао Моура полагает, что в долгосрочной перспективе разработка агентов перейдет в категорию no-code, подобно конструкторам интернет-магазинов, хотя сегодня для создания сложных систем всё еще требуются инженеры .

🏗️ Архитектура CrewAI: Crews против Flows 15:00

Жоао Моура объясняет, что экосистема CrewAI разделена на два основных подхода в зависимости от требуемой точности и сложности задачи.

CrewAI Crews (Экипажи): Это группы агентов, работающих совместно над задачей. Разработчик настраивает количество запросов, временные лимиты и программные ограничения (guardrails) . Основной упор здесь сделан на «агентность» (agency) — способность системы к самовосстановлению и самостоятельному поиску путей решения.

CrewAI Flows (Потоки): Это событийно-ориентированная система автоматизации, которая позволяет сочетать обычный код с вызовами ИИ-агентов . Жоао Моура считает этот подход идеальным для задач с высокой точностью.

Основные особенности Flows:

Механизм Publisher/Subscriber: В отличие от жестких графов (как в LangGraph), Flows работают на основе событий .
Управление состоянием (State): Позволяет передавать данные между обычными функциями Python и «экипажами» агентов .
Гибкое масштабирование: Разные функции внутри потока могут масштабироваться независимо друг от друга в зависимости от нагрузки .

📊 Реальные кейсы: от IRS-форм до анализа транзакций 10:15

Спикеры привели примеры использования агентов в компаниях из списка Fortune 500 :

Финансовый сектор и OCR: Один из клиентов CrewAI использует агентов для обработки бумажных чеков и писем. Агенты не просто распознают текст (OCR), но и анализируют рукописные пометки (например, «перевести 50% на счет X»), классифицируют запросы и делегируют их нужным отделам .
Сложная отчетность: Жоао Моура упомянул кейс с заполнением форм налоговой службы США (IRS). Сама форма занимает 62 страницы, а инструкция к ней — 720 страниц . Агенты справляются с этой высокой сложностью, обеспечивая необходимую точность.
Образовательный контент: Крупный онлайн-бренд использует агентов для ускоренной генерации учебных курсов, где требуется креативность в сочетании с жесткой проверкой фактов .

🛠️ Мастер-класс Кейс №1: Подготовка к встречам 18:14

Первый практический пример — автоматизация исследования участников встречи. Инструменты: CrewAI (Open Source) и Serper (поиск в сети).

Основные шаги:

Определение ролей в YAML: Жоао Моура подчеркивает важность использования YAML-файлов для описания агентов (Role, Goal, Backstory) . По его мнению, ролевая игра заставляет LLM работать значительно лучше за счет правильного контекста .
Задачи (Tasks): Для каждой задачи прописывается expected_output. Это не только улучшает промптинг, но и позволяет использовать LLM как судью для оценки качества результата .
Инструменты (Tools): Агенту-исследователю (Researcher) выдаются инструменты для поиска в Google и скрапинга веб-страниц .
Результат: Агенты находят информацию об участниках (например, из компании Citadel), анализируют их приоритеты и готовят список «говорящих точек» и ожидаемых вопросов .

📄 Мастер-класс Кейс №2: Автогенерация документации проекта 49:22

Второй кейс демонстрирует использование Flows для создания документации к GitHub-репозиторию.

Технические особенности:

Pydantic для структурированных данных: Вместо обычного текста на выходе получается объект Python со списком компонентов и файлов .
Кастомные инструменты: Жоао Моура показывает, как создать инструмент менее чем в 100 строк кода, который подключается к любой внутренней API или базе данных .
Валидация Mermaid-диаграмм: Чтобы избежать галлюцинаций ИИ при рисовании схем, в поток добавлен программный «гардрейл» (guardrail). Он проверяет синтаксис Mermaid и заставляет агента переделывать схему до тех пор, пока она не станет валидной .
Параллельное выполнение: Благодаря аннотации @listen, функции создания документации и сохранения плана запускаются асинхронно в параллельном режиме .

⚡ Grock: Почему скорость инференса критична для агентов 1:11:58

Грэм Стил, ведущий эксперт DeepLearning.AI и представитель Grock, представил концепцию LPU (Language Processing Unit). По его словам, GPU отлично подходят для обучения моделей, но крайне неэффективны для быстрого инференса .

Аргументы Грэма Стила в пользу Grock:

Рекордная скорость: Инференс Llama 3.3 70B на Grock значительно быстрее конкурентов .
Параллельные запросы: Для агентных систем, где одновременно запускаются десятки «экипажей», важна не скорость одиночного вызова, а производительность при массовой нагрузке .
Экономика: По мнению Грэма Стила, использование Grock позволяет масштабировать приложения без экспоненциального роста затрат .
Совместимость: API Grock полностью совместимо с форматом OpenAI, что позволяет переключить агентную систему на новый движок буквально одной строкой кода .

🎬 Кейс №3: Консервационные потоки и интеграция с Databricks 1:19:21

Финальный пример — чат-бот, который в реальном времени анализирует каталог Netflix в базе данных Databricks.

Механика работы:

Использование Llama 3.3 70B: Модель запускается через Grock для обеспечения мгновенных ответов .
Роутинг (Router): Поток анализирует запрос пользователя. Если это простое приветствие, отвечает обычная LLM. Если требуется анализ данных, запускается Crew (экипаж) .
Инструмент SQL-запросов: Агенты самостоятельно пишут SQL-запросы к Databricks, получают данные о фильмах и возвращают структурированный ответ .
Персистентность (Persistence): Благодаря аннотации @persist, всё состояние потока и история переписки сохраняются в базе. Поток можно перезапустить с того же места, сохранив контекст .