Beyond LLM: Стэндфордский гайд по созданию агентных систем в 2025 году

Stanford Online 363 тыс. 1 ч 49 мин 3 мин 21.11.2025
Главное

В рамках курса CS230 по глубокому обучению в Стэндфордском университете прошла лекция, посвященная выходу за пределы «ванильных» языковых моделей. Эксперты Стэндфорда разобрали, как превратить статичные LLM в динамические агентные системы, способные решать сложные бизнес-задачи.

🧱 Ограничения базовых моделей и необходимость аугментации 3:42

Использование предобученных моделей, таких как GPT-4, в чистом виде (vanilla LLM) сопряжено с рядом критических ограничений :

Для решения этих проблем используется вертикальная ось оптимизации: от промпт-инжиниринга до создания мультиагентных систем .

🧠 Промпт-инжиниринг: от «зеро-шот» до цепочек рассуждений 18:08

Согласно исследованию гарвардских и пенсильванских ученых, консультанты BCG, прошедшие обучение промпт-инжинирингу, показывают результаты выше, чем те, кто просто имеет доступ к ИИ .

Ключевые техники оптимизации промптов:

  1. Назначение роли (Persona): Использование конструкций вида «Act as...» (Действуй как эксперт по возобновляемой энергии) значительно улучшает качество ответа .
  2. Few-Shot Prompting: Предоставление модели нескольких примеров в самом запросе. Это помогает «выровнять» модель под специфический стиль или задачу (например, классификацию тональности отзывов в нишевой индустрии) .
  3. Chain of Thought (Цепочка мыслей): Инструкция «думай шаг за шагом» заставляет модель прописывать логику решения, прежде чем выдать финальный ответ .
  4. Chaining (Цепочки промптов): Разделение одной сложной задачи на последовательность более простых . Например, вместо одного запроса на написание письма клиенту:
    • Шаг 1: Извлечь ключевые проблемы из жалобы.
    • Шаг 2: Создать план ответа.
    • Шаг 3: Написать финальный текст по плану .

🛠️ Retrieval-Augmented Generation (RAG) 45:54

RAG — это механизм интеграции LLM с внешними базами знаний без переобучения самой модели .

Процесс работы RAG:

Спикер упоминает метод HyDE (Hypothetical Document Embeddings): когда модель сначала генерирует гипотетический (возможно, ложный) ответ, и уже этот текст используется для поиска реальных документов. Это помогает, когда краткий вопрос пользователя семантически не похож на развернутые документы в базе .

🤖 Агентные рабочие процессы (Agentic Workflows) 53:47

Эндрю Ын (Andrew Ng) популяризировал термин «агентные рабочие процессы», акцентируя внимание на итеративном процессе, а не просто на «умном» чат-боте .

Основные компоненты агента :

Спикер подчеркивает переход от детерминированного программирования к «нечеткому» (fuzzy engineering) . Если раньше софт работал строго по алгоритму, то агентные системы ведут себя динамично, что требует создания новых механизмов контроля и «человека в цикле» (human-in-the-loop) для исправления ошибок агента .

🧪 Оценка и мультиагентные системы 1:34:25

Ключевой вызов — понять, работает ли агент корректно. Для этого используются LLM-судьи (LLM as a judge) — более мощные модели, которые оценивают ответы других моделей по заданным критериям (рубрикам) .

Преимущества мультиагентных систем:

  1. Параллелизм: Несколько задач выполняются одновременно разными агентами .
  2. Специализация: Один агент сфокусирован на дизайне, другой на коде, третий на безопасности .
  3. Иерархия: «Оркестратор» общается с пользователем и распределяет задачи между узкоспециализированными агентами .

В завершение лекции обсуждается будущее AI. Спикер скептичен к идее скорого плато в развитии LLM, полагая, что новые архитектурные поиски (за пределами трансформеров) и мультимодальность (объединение текста, видео и аудио) дадут новый рывок, сравнимый с тем, как обучаются дети, сочетая наблюдение, инстинкты и обратную связь .

💬 Цитаты

«К тому времени, как вы закончите тонкую настройку модели, выйдет следующая версия, которая побьет вашу тюнингованную модель прямо 'из коробки'.»

Лидер курса CS230 42:24

«Fuzzy-инжиниринг (нечеткое проектирование) — это действительно сложно. Оно требует иного менталитета, чем традиционное ПО.»

Лидер курса CS230 58:51
👥 Спикер
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
RAG
Метод предоставления модели актуальной информации из внешних источников без её переобучения.
Эмбеддинг
Математическое представление текста или данных в виде вектора (списка чисел), отражающего их смысл.
Fuzzy Engineering
Подход к разработке ПО, где входы и выходы системы не являются строго фиксированными и могут интерпретироваться гибко.
LLM Traces
Подробный лог всех промежуточных шагов и вызовов модели внутри сложного процесса для отладки.
MCP (Model Context Protocol)
Протокол для стандартизации общения языковых моделей с внешними данными и инструментами.
📊 Цифры
🗓 Хронология
  1. 2016 Запуск и провал Twitter-бота Tay от Microsoft.
  2. 2023 Популяризация метода Chain of Thought в исследовательских работах.
  3. Ноябрь 2023 Публичные дебаты Сэма Альтмана и Илона Маска о предвзятости ИИ.
⚖️ Другая сторона
Искусственный интеллект RAG Prompt Engineering Stanford Andrew Ng Agentic Workflows