Инсоп Сонг: «Агентный ИИ — эволюция языковых моделей»

Агентный ИИ: как эволюционируют языковые модели и методы работы с ними 0:09

Технологии искусственного интеллекта стремительно меняются, превращая языковые модели из простых генераторов следующего слова в полноценных «агентов», способных взаимодействовать с внешним миром. Инсоп Сонг, эксперт в области машинного обучения, на вебинаре Stanford Online подробно разобрал эволюцию использования языковых моделей, объяснив, как перейти от базовых запросов к сложным агентным системам. В дискуссии с модератором Петрой также были затронуты практические вопросы: от оценки качества работы ИИ-агентов до борьбы с галлюцинациями и этических аспектов разработки.

🧠 От предсказания слов к полноценному ИИ-агенту 0:37

Языковая модель по своей сути — это модель машинного обучения, которая предсказывает наиболее вероятное следующее слово на основе входящего текста. Процесс создания такой модели состоит из двух ключевых этапов:

Предварительное обучение (Pre-training): Модель обучается на огромных массивах данных (интернет, книги) предсказывать следующее слово. После этого она обладает обширными знаниями, но управлять ею крайне сложно.
Пост-обучение (Post-training): Включает инструктивное обучение (instruction following) и обучение с подкреплением на основе отзывов людей (RLHF), чтобы модель лучше понимала ожидания пользователя и отвечала в нужном стиле.

Однако для полноценного решения бизнес-задач одного текстового взаимодействия недостаточно. Агентный ИИ (Agentic AI) предлагает более продвинутый подход: модель не просто генерирует текст, а взаимодействует с окружающей средой. Основная концепция здесь — ReAct (Reason and Action — «рассуждение и действие»). Агент, используя цепочки рассуждений (chain of thought), разбивает сложные задачи на этапы, планирует свои действия, использует внешние инструменты (например, поиск в интернете, калькуляторы или API) и накапливает опыт в памяти для получения финального ответа.

🛠 Методы проектирования и лучшие практики 7:07

Для эффективной работы с языковыми моделями эксперт выделяет несколько ключевых стратегий:

Качественный промптинг: Инструкции должны быть ясными, подробными и детальными.
Few-shot обучение: предоставление модели нескольких примеров «вход — ожидаемый выход» значительно повышает точность.
Chain of Thought (цепочка мыслей): вместо прямого вопроса следует попросить модель «подумать» или самостоятельно разработать решение перед тем, как давать ответ.
Разбиение задач: сложные запросы лучше делить на простые последовательные этапы, передавая результат предыдущего шага в следующий.
Системный трекинг и автоматизированная оценка: для отладки и прогресса критически важно логирование и использование LLM в качестве «судьи» (LLM-as-a-judge), который оценивает качество сгенерированного ответа относительно эталонного.

🛡 Преодоление ограничений: RAG и инструменты 20:46

Языковые модели имеют ряд встроенных ограничений, таких как галлюцинации (генерация неверной информации), отсутствие свежих данных после «точки отсечения» (knowledge cutoff), отсутствие атрибуции источников и ограниченное окно контекста.

Для решения этих проблем активно применяется метод Retrieval Augmented Generation (RAG) — генерация с дополнением из внешних источников. Суть метода заключается в следующем:

Собственные данные (документы, базы знаний) разбиваются на фрагменты и преобразуются в векторы (embeddings).
При запросе пользователя система ищет наиболее релевантные фрагменты в векторной базе данных.
Эти фрагменты передаются модели как «контекст» или «справочник», на который она должна опираться при ответе.

Помимо RAG, важным компонентом являются инструменты (function calling). Агент может генерировать не просто текст, а программный код или вызовы API, которые выполняются во внешней «песочнице». Это позволяет модели получать актуальную информацию (например, погоду) или проводить вычисления, недоступные ей напрямую.

🏢 Шаблоны проектирования агентных систем 38:49

При создании сложных систем эксперт рекомендует использовать следующие архитектурные паттерны:

Планирование: модель декомпозирует задачу на мелкие подзадачи.
Рефлексия: модель или другой агент критикуют сгенерированный результат, что позволяет итеративно улучшать его качество.
Многоагентное сотрудничество: задача делится между несколькими специализированными агентами, каждый из которых имеет свою роль или «персону».

Отвечая на вопросы слушателей, Инсоп Сонг подчеркнул, что в сфере оценки качества агентов «отраслевым стандартом» становится «агентное судейство» (agentic judging), где используется цепочка рефлексии: сначала junior-агент делает первичную оценку, а senior-агент затем анализирует его работу. Начинающим разработчикам он посоветовал начинать с малого: использовать «песочницы» (playgrounds) провайдеров моделей для экспериментов, постепенно усложняя задачи до API-интеграций и собственных фреймворков.