# Инсоп Сонг: «Агентный ИИ — эволюция языковых моделей»

Источник: https://www.youtube.com/watch?v=kJLiOGle3Lw
Канал: Stanford Online
Опубликовано: 05.02.2025

---

## Агентный ИИ: как эволюционируют языковые модели и методы работы с ними
[[JUMP:00:09]]

Технологии искусственного интеллекта стремительно меняются, превращая языковые модели из простых генераторов следующего слова в полноценных «агентов», способных взаимодействовать с внешним миром. Инсоп Сонг, эксперт в области машинного обучения, на вебинаре Stanford Online подробно разобрал эволюцию использования языковых моделей, объяснив, как перейти от базовых запросов к сложным агентным системам. В дискуссии с модератором Петрой также были затронуты практические вопросы: от оценки качества работы ИИ-агентов до борьбы с галлюцинациями и этических аспектов разработки.

## 🧠 От предсказания слов к полноценному ИИ-агенту
[[JUMP:00:37]]

Языковая модель по своей сути — это модель машинного обучения, которая предсказывает наиболее вероятное следующее слово на основе входящего текста. Процесс создания такой модели состоит из двух ключевых этапов:

*   **Предварительное обучение (Pre-training):** Модель обучается на огромных массивах данных (интернет, книги) предсказывать следующее слово. После этого она обладает обширными знаниями, но управлять ею крайне сложно.
*   **Пост-обучение (Post-training):** Включает инструктивное обучение (instruction following) и обучение с подкреплением на основе отзывов людей (RLHF), чтобы модель лучше понимала ожидания пользователя и отвечала в нужном стиле.

Однако для полноценного решения бизнес-задач одного текстового взаимодействия недостаточно. Агентный ИИ (Agentic AI) предлагает более продвинутый подход: модель не просто генерирует текст, а взаимодействует с окружающей средой. Основная концепция здесь — **ReAct** (Reason and Action — «рассуждение и действие»). Агент, используя цепочки рассуждений (chain of thought), разбивает сложные задачи на этапы, планирует свои действия, использует внешние инструменты (например, поиск в интернете, калькуляторы или API) и накапливает опыт в памяти для получения финального ответа.

## 🛠 Методы проектирования и лучшие практики
[[JUMP:07:07]]

Для эффективной работы с языковыми моделями эксперт выделяет несколько ключевых стратегий:

1.  **Качественный промптинг:** Инструкции должны быть ясными, подробными и детальными.
2.  **Few-shot обучение:** предоставление модели нескольких примеров «вход — ожидаемый выход» значительно повышает точность.
3.  **Chain of Thought (цепочка мыслей):** вместо прямого вопроса следует попросить модель «подумать» или самостоятельно разработать решение перед тем, как давать ответ.
4.  **Разбиение задач:** сложные запросы лучше делить на простые последовательные этапы, передавая результат предыдущего шага в следующий.
5.  **Системный трекинг и автоматизированная оценка:** для отладки и прогресса критически важно логирование и использование LLM в качестве «судьи» (LLM-as-a-judge), который оценивает качество сгенерированного ответа относительно эталонного.

## 🛡 Преодоление ограничений: RAG и инструменты
[[JUMP:20:46]]

Языковые модели имеют ряд встроенных ограничений, таких как галлюцинации (генерация неверной информации), отсутствие свежих данных после «точки отсечения» (knowledge cutoff), отсутствие атрибуции источников и ограниченное окно контекста.

Для решения этих проблем активно применяется метод **Retrieval Augmented Generation (RAG)** — генерация с дополнением из внешних источников. Суть метода заключается в следующем:

*   Собственные данные (документы, базы знаний) разбиваются на фрагменты и преобразуются в векторы (embeddings).
*   При запросе пользователя система ищет наиболее релевантные фрагменты в векторной базе данных.
*   Эти фрагменты передаются модели как «контекст» или «справочник», на который она должна опираться при ответе.

Помимо RAG, важным компонентом являются **инструменты (function calling)**. Агент может генерировать не просто текст, а программный код или вызовы API, которые выполняются во внешней «песочнице». Это позволяет модели получать актуальную информацию (например, погоду) или проводить вычисления, недоступные ей напрямую.

## 🏢 Шаблоны проектирования агентных систем
[[JUMP:38:49]]

При создании сложных систем эксперт рекомендует использовать следующие архитектурные паттерны:

*   **Планирование:** модель декомпозирует задачу на мелкие подзадачи.
*   **Рефлексия:** модель или другой агент критикуют сгенерированный результат, что позволяет итеративно улучшать его качество.
*   **Многоагентное сотрудничество:** задача делится между несколькими специализированными агентами, каждый из которых имеет свою роль или «персону».

Отвечая на вопросы слушателей, Инсоп Сонг подчеркнул, что в сфере оценки качества агентов «отраслевым стандартом» становится «агентное судейство» (agentic judging), где используется цепочка рефлексии: сначала junior-агент делает первичную оценку, а senior-агент затем анализирует его работу. Начинающим разработчикам он посоветовал начинать с малого: использовать «песочницы» (playgrounds) провайдеров моделей для экспериментов, постепенно усложняя задачи до API-интеграций и собственных фреймворков.