Агентный ИИ: как эволюционируют языковые модели и методы работы с ними 0:09
Технологии искусственного интеллекта стремительно меняются, превращая языковые модели из простых генераторов следующего слова в полноценных «агентов», способных взаимодействовать с внешним миром. Инсоп Сонг, эксперт в области машинного обучения, на вебинаре Stanford Online подробно разобрал эволюцию использования языковых моделей, объяснив, как перейти от базовых запросов к сложным агентным системам. В дискуссии с модератором Петрой также были затронуты практические вопросы: от оценки качества работы ИИ-агентов до борьбы с галлюцинациями и этических аспектов разработки.
🧠 От предсказания слов к полноценному ИИ-агенту 0:37
Языковая модель по своей сути — это модель машинного обучения, которая предсказывает наиболее вероятное следующее слово на основе входящего текста. Процесс создания такой модели состоит из двух ключевых этапов:
- Предварительное обучение (Pre-training): Модель обучается на огромных массивах данных (интернет, книги) предсказывать следующее слово. После этого она обладает обширными знаниями, но управлять ею крайне сложно.
- Пост-обучение (Post-training): Включает инструктивное обучение (instruction following) и обучение с подкреплением на основе отзывов людей (RLHF), чтобы модель лучше понимала ожидания пользователя и отвечала в нужном стиле.
Однако для полноценного решения бизнес-задач одного текстового взаимодействия недостаточно. Агентный ИИ (Agentic AI) предлагает более продвинутый подход: модель не просто генерирует текст, а взаимодействует с окружающей средой. Основная концепция здесь — ReAct (Reason and Action — «рассуждение и действие»). Агент, используя цепочки рассуждений (chain of thought), разбивает сложные задачи на этапы, планирует свои действия, использует внешние инструменты (например, поиск в интернете, калькуляторы или API) и накапливает опыт в памяти для получения финального ответа.
🛠 Методы проектирования и лучшие практики 7:07
Для эффективной работы с языковыми моделями эксперт выделяет несколько ключевых стратегий:
- Качественный промптинг: Инструкции должны быть ясными, подробными и детальными.
- Few-shot обучение: предоставление модели нескольких примеров «вход — ожидаемый выход» значительно повышает точность.
- Chain of Thought (цепочка мыслей): вместо прямого вопроса следует попросить модель «подумать» или самостоятельно разработать решение перед тем, как давать ответ.
- Разбиение задач: сложные запросы лучше делить на простые последовательные этапы, передавая результат предыдущего шага в следующий.
- Системный трекинг и автоматизированная оценка: для отладки и прогресса критически важно логирование и использование LLM в качестве «судьи» (LLM-as-a-judge), который оценивает качество сгенерированного ответа относительно эталонного.
🛡 Преодоление ограничений: RAG и инструменты 20:46
Языковые модели имеют ряд встроенных ограничений, таких как галлюцинации (генерация неверной информации), отсутствие свежих данных после «точки отсечения» (knowledge cutoff), отсутствие атрибуции источников и ограниченное окно контекста.
Для решения этих проблем активно применяется метод Retrieval Augmented Generation (RAG) — генерация с дополнением из внешних источников. Суть метода заключается в следующем:
- Собственные данные (документы, базы знаний) разбиваются на фрагменты и преобразуются в векторы (embeddings).
- При запросе пользователя система ищет наиболее релевантные фрагменты в векторной базе данных.
- Эти фрагменты передаются модели как «контекст» или «справочник», на который она должна опираться при ответе.
Помимо RAG, важным компонентом являются инструменты (function calling). Агент может генерировать не просто текст, а программный код или вызовы API, которые выполняются во внешней «песочнице». Это позволяет модели получать актуальную информацию (например, погоду) или проводить вычисления, недоступные ей напрямую.
🏢 Шаблоны проектирования агентных систем 38:49
При создании сложных систем эксперт рекомендует использовать следующие архитектурные паттерны:
- Планирование: модель декомпозирует задачу на мелкие подзадачи.
- Рефлексия: модель или другой агент критикуют сгенерированный результат, что позволяет итеративно улучшать его качество.
- Многоагентное сотрудничество: задача делится между несколькими специализированными агентами, каждый из которых имеет свою роль или «персону».
Отвечая на вопросы слушателей, Инсоп Сонг подчеркнул, что в сфере оценки качества агентов «отраслевым стандартом» становится «агентное судейство» (agentic judging), где используется цепочка рефлексии: сначала junior-агент делает первичную оценку, а senior-агент затем анализирует его работу. Начинающим разработчикам он посоветовал начинать с малого: использовать «песочницы» (playgrounds) провайдеров моделей для экспериментов, постепенно усложняя задачи до API-интеграций и собственных фреймворков.