Инсоп Сонг: «Агентный ИИ — эволюция языковых моделей»

Stanford Online 637 тыс. 57 мин 3 мин 05.02.2025
Главное

Агентный ИИ: как эволюционируют языковые модели и методы работы с ними 0:09

Технологии искусственного интеллекта стремительно меняются, превращая языковые модели из простых генераторов следующего слова в полноценных «агентов», способных взаимодействовать с внешним миром. Инсоп Сонг, эксперт в области машинного обучения, на вебинаре Stanford Online подробно разобрал эволюцию использования языковых моделей, объяснив, как перейти от базовых запросов к сложным агентным системам. В дискуссии с модератором Петрой также были затронуты практические вопросы: от оценки качества работы ИИ-агентов до борьбы с галлюцинациями и этических аспектов разработки.

🧠 От предсказания слов к полноценному ИИ-агенту 0:37

Языковая модель по своей сути — это модель машинного обучения, которая предсказывает наиболее вероятное следующее слово на основе входящего текста. Процесс создания такой модели состоит из двух ключевых этапов:

Однако для полноценного решения бизнес-задач одного текстового взаимодействия недостаточно. Агентный ИИ (Agentic AI) предлагает более продвинутый подход: модель не просто генерирует текст, а взаимодействует с окружающей средой. Основная концепция здесь — ReAct (Reason and Action — «рассуждение и действие»). Агент, используя цепочки рассуждений (chain of thought), разбивает сложные задачи на этапы, планирует свои действия, использует внешние инструменты (например, поиск в интернете, калькуляторы или API) и накапливает опыт в памяти для получения финального ответа.

🛠 Методы проектирования и лучшие практики 7:07

Для эффективной работы с языковыми моделями эксперт выделяет несколько ключевых стратегий:

  1. Качественный промптинг: Инструкции должны быть ясными, подробными и детальными.
  2. Few-shot обучение: предоставление модели нескольких примеров «вход — ожидаемый выход» значительно повышает точность.
  3. Chain of Thought (цепочка мыслей): вместо прямого вопроса следует попросить модель «подумать» или самостоятельно разработать решение перед тем, как давать ответ.
  4. Разбиение задач: сложные запросы лучше делить на простые последовательные этапы, передавая результат предыдущего шага в следующий.
  5. Системный трекинг и автоматизированная оценка: для отладки и прогресса критически важно логирование и использование LLM в качестве «судьи» (LLM-as-a-judge), который оценивает качество сгенерированного ответа относительно эталонного.

🛡 Преодоление ограничений: RAG и инструменты 20:46

Языковые модели имеют ряд встроенных ограничений, таких как галлюцинации (генерация неверной информации), отсутствие свежих данных после «точки отсечения» (knowledge cutoff), отсутствие атрибуции источников и ограниченное окно контекста.

Для решения этих проблем активно применяется метод Retrieval Augmented Generation (RAG) — генерация с дополнением из внешних источников. Суть метода заключается в следующем:

Помимо RAG, важным компонентом являются инструменты (function calling). Агент может генерировать не просто текст, а программный код или вызовы API, которые выполняются во внешней «песочнице». Это позволяет модели получать актуальную информацию (например, погоду) или проводить вычисления, недоступные ей напрямую.

🏢 Шаблоны проектирования агентных систем 38:49

При создании сложных систем эксперт рекомендует использовать следующие архитектурные паттерны:

Отвечая на вопросы слушателей, Инсоп Сонг подчеркнул, что в сфере оценки качества агентов «отраслевым стандартом» становится «агентное судейство» (agentic judging), где используется цепочка рефлексии: сначала junior-агент делает первичную оценку, а senior-агент затем анализирует его работу. Начинающим разработчикам он посоветовал начинать с малого: использовать «песочницы» (playgrounds) провайдеров моделей для экспериментов, постепенно усложняя задачи до API-интеграций и собственных фреймворков.

💬 Цитаты

«Агентный ИИ — это прогрессия или расширение существующих методов использования языковых моделей.»

Инсоп Сонг 43:36

«Начинайте просто, экспериментируйте и итерируйте.»

Инсоп Сонг 53:30
👥 Спикеры
📖 Термины
RAG (Retrieval Augmented Generation)
Метод генерации текста, при котором модель использует внешние достоверные источники данных для ответа.
Agentic AI
Системы, в которых языковая модель выступает «ядром», способным планировать задачи, использовать инструменты и взаимодействовать со средой.
Function calling
Возможность модели генерировать структурированный запрос к внешней функции или API.
LLM-as-a-judge
Использование языковой модели в качестве автоматизированного судьи для оценки качества работы других моделей или агентов.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Agentic AI RAG LLM Stanford Online