Жоао Моура (João Moura), основатель CrewAI, и Грэм Стил (Graham Steele) из команды Grock представляют подробный технический обзор и мастер-класс по созданию автономных ИИ-агентов. В центре внимания — переход от простых чат-ботов к сложным системам, способным принимать решения, использовать инструменты и автоматизировать корпоративные процессы в промышленных масштабах.
🤖 Эволюция ИИ-агентов: от генерации контента к автономным действиям 4:35
По мнению Жоао Моуры, современное понимание языковых моделей (LLM) должно выйти за рамки простого предсказания следующего токена или написания писем . Ключевой характеристикой агента является «когнитивная функция» — способность выбирать лучший вариант из предложенных и принимать решения с высокой степенью уверенности .
Жоао Моура выделяет несколько фундаментальных отличий агентов:
- Уход от диалога: Вместо бесконечного чата пользователь дает агенту конкретную задачу и цель .
- Использование инструментов: Агент сам решает, когда ему нужно извлечь данные из Salesforce, а когда — обратиться к инвойсам в SAP .
- Автоматизация нового уровня: По словам основателя CrewAI, ИИ-агенты — это «RPA (Robotic Process Automation) на стероидах», который не ломается при малейшем изменении интерфейса и справляется там, где традиционные системы автоматизации потерпели неудачу .
Согласно данным CrewAI, в январе 2025 года через их платформу было запущено более 50 миллионов агентов . При этом в индустрии нет «чистого лидера» среди сценариев использования: задачи распределены между продажами, бэк-офисом, поддержкой и маркетингом . Жоао Моура полагает, что в долгосрочной перспективе разработка агентов перейдет в категорию no-code, подобно конструкторам интернет-магазинов, хотя сегодня для создания сложных систем всё еще требуются инженеры .
🏗️ Архитектура CrewAI: Crews против Flows 15:00
Жоао Моура объясняет, что экосистема CrewAI разделена на два основных подхода в зависимости от требуемой точности и сложности задачи.
CrewAI Crews (Экипажи): Это группы агентов, работающих совместно над задачей. Разработчик настраивает количество запросов, временные лимиты и программные ограничения (guardrails) . Основной упор здесь сделан на «агентность» (agency) — способность системы к самовосстановлению и самостоятельному поиску путей решения.
CrewAI Flows (Потоки): Это событийно-ориентированная система автоматизации, которая позволяет сочетать обычный код с вызовами ИИ-агентов . Жоао Моура считает этот подход идеальным для задач с высокой точностью.
Основные особенности Flows:
- Механизм Publisher/Subscriber: В отличие от жестких графов (как в LangGraph), Flows работают на основе событий .
- Управление состоянием (State): Позволяет передавать данные между обычными функциями Python и «экипажами» агентов .
- Гибкое масштабирование: Разные функции внутри потока могут масштабироваться независимо друг от друга в зависимости от нагрузки .
📊 Реальные кейсы: от IRS-форм до анализа транзакций 10:15
Спикеры привели примеры использования агентов в компаниях из списка Fortune 500 :
- Финансовый сектор и OCR: Один из клиентов CrewAI использует агентов для обработки бумажных чеков и писем. Агенты не просто распознают текст (OCR), но и анализируют рукописные пометки (например, «перевести 50% на счет X»), классифицируют запросы и делегируют их нужным отделам .
- Сложная отчетность: Жоао Моура упомянул кейс с заполнением форм налоговой службы США (IRS). Сама форма занимает 62 страницы, а инструкция к ней — 720 страниц . Агенты справляются с этой высокой сложностью, обеспечивая необходимую точность.
- Образовательный контент: Крупный онлайн-бренд использует агентов для ускоренной генерации учебных курсов, где требуется креативность в сочетании с жесткой проверкой фактов .
🛠️ Мастер-класс Кейс №1: Подготовка к встречам 18:14
Первый практический пример — автоматизация исследования участников встречи. Инструменты: CrewAI (Open Source) и Serper (поиск в сети).
Основные шаги:
- Определение ролей в YAML: Жоао Моура подчеркивает важность использования YAML-файлов для описания агентов (Role, Goal, Backstory) . По его мнению, ролевая игра заставляет LLM работать значительно лучше за счет правильного контекста .
- Задачи (Tasks): Для каждой задачи прописывается
expected_output. Это не только улучшает промптинг, но и позволяет использовать LLM как судью для оценки качества результата . - Инструменты (Tools): Агенту-исследователю (Researcher) выдаются инструменты для поиска в Google и скрапинга веб-страниц .
- Результат: Агенты находят информацию об участниках (например, из компании Citadel), анализируют их приоритеты и готовят список «говорящих точек» и ожидаемых вопросов .
📄 Мастер-класс Кейс №2: Автогенерация документации проекта 49:22
Второй кейс демонстрирует использование Flows для создания документации к GitHub-репозиторию.
Технические особенности:
- Pydantic для структурированных данных: Вместо обычного текста на выходе получается объект Python со списком компонентов и файлов .
- Кастомные инструменты: Жоао Моура показывает, как создать инструмент менее чем в 100 строк кода, который подключается к любой внутренней API или базе данных .
- Валидация Mermaid-диаграмм: Чтобы избежать галлюцинаций ИИ при рисовании схем, в поток добавлен программный «гардрейл» (guardrail). Он проверяет синтаксис Mermaid и заставляет агента переделывать схему до тех пор, пока она не станет валидной .
- Параллельное выполнение: Благодаря аннотации
@listen, функции создания документации и сохранения плана запускаются асинхронно в параллельном режиме .
⚡ Grock: Почему скорость инференса критична для агентов 1:11:58
Грэм Стил, ведущий эксперт DeepLearning.AI и представитель Grock, представил концепцию LPU (Language Processing Unit). По его словам, GPU отлично подходят для обучения моделей, но крайне неэффективны для быстрого инференса .
Аргументы Грэма Стила в пользу Grock:
- Рекордная скорость: Инференс Llama 3.3 70B на Grock значительно быстрее конкурентов .
- Параллельные запросы: Для агентных систем, где одновременно запускаются десятки «экипажей», важна не скорость одиночного вызова, а производительность при массовой нагрузке .
- Экономика: По мнению Грэма Стила, использование Grock позволяет масштабировать приложения без экспоненциального роста затрат .
- Совместимость: API Grock полностью совместимо с форматом OpenAI, что позволяет переключить агентную систему на новый движок буквально одной строкой кода .
🎬 Кейс №3: Консервационные потоки и интеграция с Databricks 1:19:21
Финальный пример — чат-бот, который в реальном времени анализирует каталог Netflix в базе данных Databricks.
Механика работы:
- Использование Llama 3.3 70B: Модель запускается через Grock для обеспечения мгновенных ответов .
- Роутинг (Router): Поток анализирует запрос пользователя. Если это простое приветствие, отвечает обычная LLM. Если требуется анализ данных, запускается Crew (экипаж) .
- Инструмент SQL-запросов: Агенты самостоятельно пишут SQL-запросы к Databricks, получают данные о фильмах и возвращают структурированный ответ .
- Персистентность (Persistence): Благодаря аннотации
@persist, всё состояние потока и история переписки сохраняются в базе. Поток можно перезапустить с того же места, сохранив контекст .