Создание полноценного автономного AI-агента — задача, требующая интеграции нескольких ключевых компонентов: пользовательского интерфейса, системы принятия решений (LLM), инструментов для взаимодействия с внешними приложениями, долговременной памяти и средств автоматизации. В этом курсе, представленном Шон Эскивелем (разработчиком в Composio и амбассадором Cursor), рассматривается процесс создания системы, вдохновленной проектом OpenClaw, с использованием стека Vercel AI SDK, Composio, Supermemory и других современных инструментов.
🏗️ Базовая архитектура: Vercel AI SDK 9:41
В качестве фундамента используется шаблон чат-бота от Vercel, который берет на себя основные задачи по настройке UI и базы данных. Разработка ведется в среде Cursor — AI-ориентированном редакторе кода, позволяющем автоматизировать написание функционала.
- UI: Создается на базе Next.js, обеспечивая привычный интерфейс чата с боковой панелью, поддержкой темной темы и историей диалогов.
- Бэкенд: Интегрируются Neon (serverless Postgres для хранения данных) и Upstash (Redis для rate limiting и потоковой передачи чатов).
- Vercel AI Gateway: Используется как роутер для моделей (например, Claude Sonnet 3.5, GPT), предоставляя гибкость в выборе моделей и встроенную систему отказоустойчивости.
🛠️ «Руки» агента: Composio и инструменты 19:26
Чтобы AI-агент мог выполнять реальные действия, ему необходимы инструменты. Шон Эскивель отмечает важность «контекстного инжиниринга»: вместо загрузки всех возможных инструментов в контекстное окно, система должна динамически предоставлять только релевантные.
- Composio: Предоставляет доступ к 1000+ инструментариям (Gmail, Slack, Notion, GitHub и др.).
- OAuth: Реализуется через Composio, что позволяет безопасно подключать личные аккаунты пользователей без передачи паролей напрямую агенту.
- Пример работы: Агент может искать письма в Gmail, а затем создавать черновик ответа, используя соответствующие API-вызовы, инкапсулированные в Composio.
🧠 Долговременная память: Supermemory 36:21
Стандартный контекст LLM ограничен рамками одного чата. Для создания по-настоящему «умного» ассистента используется Supermemory.
- Функция: Позволяет хранить, искать и извлекать факты о пользователе (имена, предпочтения, текущие проекты) в разных сессиях.
- Реализация: Агент динамически решает, когда нужно сохранить или найти информацию, используя инструменты
addMemoryиsearchMemory. - Преимущество: Это решение экономит токены и повышает точность, так как информация не «засоряет» системный промпт постоянно, а вызывается только при необходимости.
👤 Личность агента («Душа») 43:42
«Душа» агента — это его системный промпт, определяющий стиль общения, имя и поведение. Шон Эскивель предлагает хранить конфигурацию личности как колонку soul в базе данных пользователя.
- Онбординг: Если агент не имеет настроенной «души», он инициирует диалог, собирая информацию о пользователе и его предпочтениях (например, желание изучать новые японские слова).
- Применение: Сохраненный промпт автоматически добавляется к системным инструкциям во всех будущих сессиях.
📱 Мультиканальность: Telegram 49:07
Для максимальной доступности агент интегрируется в Telegram, что превращает его из веб-инструмента в ежедневного помощника.
- Механика: Используются webhook-сообщения от Telegram, которые перенаправляются на локальный сервер (через ngrok в режиме разработки).
- Синхронизация: Учетная запись в веб-приложении и Telegram связываются через единый
user_id, что дает доступ к общим данным, памяти и настройкам.
⏱️ Автоматизация: Vercel Cron 59:06
Для выполнения повторяющихся задач агент получает «сердцебиение» в виде заданий cron.
- Пример: Пользователь может дать команду «каждый день в 9 утра составлять краткую сводку последних пяти писем».
- Реализация: Задания сохраняются в базе данных, а Vercel Cron вызывает соответствующий эндпоинт приложения, который активирует рабочие процессы агента.