CrewAI и Grock: как создавать и масштабировать автономных ИИ-агентов для бизнеса

DeepLearning.AI 1,2 тыс. 1 ч 26 мин 5 мин 27.03.2025
Главное

Жоао Моура (João Moura), основатель CrewAI, и Грэм Стил (Graham Steele) из команды Grock представляют подробный технический обзор и мастер-класс по созданию автономных ИИ-агентов. В центре внимания — переход от простых чат-ботов к сложным системам, способным принимать решения, использовать инструменты и автоматизировать корпоративные процессы в промышленных масштабах.

🤖 Эволюция ИИ-агентов: от генерации контента к автономным действиям 4:35

По мнению Жоао Моуры, современное понимание языковых моделей (LLM) должно выйти за рамки простого предсказания следующего токена или написания писем . Ключевой характеристикой агента является «когнитивная функция» — способность выбирать лучший вариант из предложенных и принимать решения с высокой степенью уверенности .

Жоао Моура выделяет несколько фундаментальных отличий агентов:

Согласно данным CrewAI, в январе 2025 года через их платформу было запущено более 50 миллионов агентов . При этом в индустрии нет «чистого лидера» среди сценариев использования: задачи распределены между продажами, бэк-офисом, поддержкой и маркетингом . Жоао Моура полагает, что в долгосрочной перспективе разработка агентов перейдет в категорию no-code, подобно конструкторам интернет-магазинов, хотя сегодня для создания сложных систем всё еще требуются инженеры .

🏗️ Архитектура CrewAI: Crews против Flows 15:00

Жоао Моура объясняет, что экосистема CrewAI разделена на два основных подхода в зависимости от требуемой точности и сложности задачи.

CrewAI Crews (Экипажи): Это группы агентов, работающих совместно над задачей. Разработчик настраивает количество запросов, временные лимиты и программные ограничения (guardrails) . Основной упор здесь сделан на «агентность» (agency) — способность системы к самовосстановлению и самостоятельному поиску путей решения.

CrewAI Flows (Потоки): Это событийно-ориентированная система автоматизации, которая позволяет сочетать обычный код с вызовами ИИ-агентов . Жоао Моура считает этот подход идеальным для задач с высокой точностью.

Основные особенности Flows:

📊 Реальные кейсы: от IRS-форм до анализа транзакций 10:15

Спикеры привели примеры использования агентов в компаниях из списка Fortune 500 :

  1. Финансовый сектор и OCR: Один из клиентов CrewAI использует агентов для обработки бумажных чеков и писем. Агенты не просто распознают текст (OCR), но и анализируют рукописные пометки (например, «перевести 50% на счет X»), классифицируют запросы и делегируют их нужным отделам .
  2. Сложная отчетность: Жоао Моура упомянул кейс с заполнением форм налоговой службы США (IRS). Сама форма занимает 62 страницы, а инструкция к ней — 720 страниц . Агенты справляются с этой высокой сложностью, обеспечивая необходимую точность.
  3. Образовательный контент: Крупный онлайн-бренд использует агентов для ускоренной генерации учебных курсов, где требуется креативность в сочетании с жесткой проверкой фактов .

🛠️ Мастер-класс Кейс №1: Подготовка к встречам 18:14

Первый практический пример — автоматизация исследования участников встречи. Инструменты: CrewAI (Open Source) и Serper (поиск в сети).

Основные шаги:

📄 Мастер-класс Кейс №2: Автогенерация документации проекта 49:22

Второй кейс демонстрирует использование Flows для создания документации к GitHub-репозиторию.

Технические особенности:

  1. Pydantic для структурированных данных: Вместо обычного текста на выходе получается объект Python со списком компонентов и файлов .
  2. Кастомные инструменты: Жоао Моура показывает, как создать инструмент менее чем в 100 строк кода, который подключается к любой внутренней API или базе данных .
  3. Валидация Mermaid-диаграмм: Чтобы избежать галлюцинаций ИИ при рисовании схем, в поток добавлен программный «гардрейл» (guardrail). Он проверяет синтаксис Mermaid и заставляет агента переделывать схему до тех пор, пока она не станет валидной .
  4. Параллельное выполнение: Благодаря аннотации @listen, функции создания документации и сохранения плана запускаются асинхронно в параллельном режиме .

⚡ Grock: Почему скорость инференса критична для агентов 1:11:58

Грэм Стил, ведущий эксперт DeepLearning.AI и представитель Grock, представил концепцию LPU (Language Processing Unit). По его словам, GPU отлично подходят для обучения моделей, но крайне неэффективны для быстрого инференса .

Аргументы Грэма Стила в пользу Grock:

🎬 Кейс №3: Консервационные потоки и интеграция с Databricks 1:19:21

Финальный пример — чат-бот, который в реальном времени анализирует каталог Netflix в базе данных Databricks.

Механика работы:


💬 Цитаты

«ИИ-агенты — это модное слово, но в конце концов мы говорим об автоматизации на базе ИИ, которая раньше была невозможна.»

Жоао Моура 06:09

«GPUs прекрасны для обучения, но они действительно плохи, когда дело доходит до быстрого инференса ИИ.»

Грэм Стил 11:42
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
LPU
Language Processing Unit — специализированный чип от Groq, оптимизированный для инференса языковых моделей.
RPA
Robotic Process Automation — технология автоматизации бизнес-процессов, основанная на имитации действий человека в интерфейсах.
Mermaid
Инструмент для создания диаграмм и графиков с использованием текстового описания.
Инференс
Процесс использования обученной модели ИИ для получения предсказаний или ответов на новые данные.
📊 Цифры
🗓 Хронология
  1. Февраль 2024 Запуск Groq Cloud.
  2. Январь 2025 CrewAI фиксирует запуск 50 миллионов агентов за месяц.
  3. Февраль 2025 Проведение мастер-класса AI Dev 25.
⚖️ Другая сторона
Искусственный интеллект João Moura CrewAI Grock Llama 3.3 LPU