🛠 Разработка ИИ-агентов: от основ до глубокого поиска с Vercel AI SDK 0:00
Аюш Капур, инженер из команды Vercel, представил подробное руководство по работе с Vercel AI SDK — универсальным набором инструментов для TypeScript, предназначенным для быстрой разработки ИИ-приложений. Библиотека является бесплатной, открытой и поддерживает множество фреймворков (Next.js, Svelte, Vue, React) и сред выполнения, включая Node.js.
🧱 Фундаментальные примитивы SDK 2:21
Разработка с помощью AI SDK строится на трёх базовых функциях, которые позволяют взаимодействовать с языковыми моделями (LLM):
generateText: основная функция для генерации текста. Позволяет легко переключаться между моделями (например, GPT-4o mini или Perplexity Sonar) без изменения архитектуры приложения, просто заменяя параметры конфигурации. SDK поддерживает более 30 различных провайдеров, включая Anthropic, Google, XAI и HuggingFace.- Tool calling (вызов инструментов): механизм, позволяющий модели взаимодействовать с внешним миром. Для настройки инструмента необходимо определить:
name: имя функции.description: описание, помогающее модели понять, когда использовать инструмент.inputSchema: схема входных аргументов.execute: асинхронная функция выполнения задачи.
generateObject: функция для получения структурированного вывода в формате JSON. По мнению Капура, использование совместно с библиотекой Zod (для валидации схем) делает этот метод особенно мощным, обеспечивая типобезопасность на этапе выполнения.
🤖 Создание агента глубокого поиска (Deep Research Agent) 15:35
Для решения комплексных задач, требующих многошаговой логики, Аюш Капур продемонстрировал создание агента, имитирующего глубокий поиск информации. Логика работы агента строится на итеративном процессе:
- Генерация подзапросов: исходя из начального запроса, агент разбивает его на $N$ подзапросов (где $N$ — параметр «ширины» поиска).
- Поиск и оценка: с использованием поискового API (например, Exa AI) агент собирает контент и оценивает его релевантность.
- Feedback Loop (петля обратной связи): если результат оценён как «нерелевантный», модель использует это как сигнал для повторного уточнения поиска.
- Рекурсия: при глубине поиска более единицы агент рекурсивно запускает процесс, генерируя новые уточняющие вопросы.
Для финального отчета используется функция generateReport, которая собирает все «обучающие данные» (learnings) в структурированный Markdown-файл.
💡 Советы для разработчиков
- Inference Capacity: Капур подчеркивает, что современные модели способны к логическому выводу (инференсу) — например, они могут самостоятельно извлекать широту и долготу из названия города, если правильно описать это в
inputSchemaинструмента. - Экспериментальный подход: Самый эффективный способ освоить SDK — «пачкать руки», постоянно экспериментируя с конфигурациями и промптами.
- Документация: Все примеры кода и подробности реализации доступны на официальном ресурсе ai-sdk.dev.