# Как создать армию ИИ-агентов: пошаговое руководство Wes Roth по Microsoft AutoGen и GPT-4o

Источник: https://www.youtube.com/watch?v=W9yap9AeVYU
Канал: Wes Roth
Опубликовано: 21.05.2024

---

Популярный ИИ-энтузиаст и автор одноименного YouTube-канала Wes Roth представил подробный туториал по обновленной версии Microsoft AutoGen Studio. В своем видео он демонстрирует, как создать «армию ИИ-агентов» для автоматизации сложных задач — от написания кода видеоигр до проведения глубоких рыночных исследований — без необходимости глубокого погружения в программирование.

## 🛠️ Установка и настройка: ИИ-агенты для каждого
[[JUMP:0:00]]

Wes Roth подчеркивает, что с момента первого релиза установка AutoGen Studio значительно упростилась и теперь не требует серьезных навыков кодинга [0:00]. Процесс развертывания системы базируется на создании изолированной среды, которую ведущий сравнивает с «карманной вселенной» внутри компьютера [1:47].

Основные этапы подготовки окружения:

*   **Установка Python:** Необходима версия, рекомендованная официальной документацией на сайте autogen-studio.com [0:52].
*   **Использование Anaconda:** Ведущий рекомендует использовать Conda для управления пакетами и создания виртуальных сред, чтобы избежать конфликтов с другими программами [1:33].
*   **API-ключи:** Для работы требуются ключи от OpenAI или Microsoft Azure.

По наблюдениям Wes Roth, многие разработчики, с которыми он общался, считают облачный сервис Azure более стабильным для запуска моделей OpenAI по сравнению с прямым использованием API OpenAI [3:33]. При этом сам автор в процессе видео переходит на использование Mac OS, отмечая, что эта операционная система кажется ему более удобной для современной разработки ИИ-инструментов [4:12].

Запуск интерфейса осуществляется простой командой `autogenstudio ui`, которая разворачивает локальный веб-сервер [4:54].

## 🧩 Архитектура AutoGen Studio: навыки, модели и рабочие процессы
[[JUMP:5:34]]

Интерфейс AutoGen Studio разделен на три основные вкладки: Build (Сборка), Playground (Песочница) и Gallery (Галерея) [5:34]. Основная работа по кастомизации происходит в разделе Build, который состоит из четырех ключевых компонентов:

1.  **Workflows (Рабочие процессы):** Логика взаимодействия агентов и определение того, кто и за что отвечает в рамках конкретной задачи [5:46].
2.  **Agents (Агенты):** Сами цифровые сущности, выполняющие команды [6:00].
3.  **Models (Модели):** «Мозги» системы, такие как GPT-4o или локальные модели [6:13].
4.  **Skills (Навыки):** Наборы Python-кода, расширяющие возможности агентов [6:26].

Wes Roth сравнивает навыки с «кулинарными рецептами» [6:38]. Пользователю не обязательно уметь писать код с нуля; достаточно понимать, что конкретный блок кода выполняет определенную функцию — например, генерирует изображение через DALL-E 3 или парсит данные с веб-сайта [7:30].

Примером эффективного навыка является функция скрапинга текста с веб-страниц [8:49]. Агент получает URL, извлекает содержимое и возвращает его в виде текста, который затем может быть использован другими агентами в цепочке.

## 🚀 Тест-драйв GPT-4o: создание игр за считанные секунды
[[JUMP:9:30]]

Особое внимание в уроке уделено интеграции новейшей модели GPT-4o (Omni). Wes Roth демонстрирует, как добавить модель в систему, используя актуальные идентификаторы из документации OpenAI [9:43].

В качестве эксперимента ведущий поручил системе написать код для игры «Тетрис» на языке Python [10:48]. Результаты теста:

*   **Скорость:** Модель GPT-4o сгенерировала полный код игры примерно за 4–6 секунд [12:17].
*   **Качество:** После установки библиотеки Pygame код запустился с первого раза и выдал полностью рабочую версию игры [11:52].

При создании более сложной игры, «Flappy Bird», возникла потребность во внешних ассетах (изображениях птицы, труб и фона). Агент самостоятельно предложил решение: он написал отдельный Python-скрипт для генерации необходимых графических заглушек [12:56]. Wes Roth в шутку сравнил игровой процесс в созданной версии с тестом «Кобаяси Мару» из Star Trek — сценарием, в котором невозможно победить, поскольку ИИ создал бесконечно сложную полосу препятствий [14:01].

## 📊 Автоматизация сложных бизнес-задач: от графиков до научных отчетов
[[JUMP:15:46]]

Wes Roth наглядно показывает, что AutoGen Studio способна решать задачи, выходящие за рамки простого чат-бота. Благодаря способности агентов устанавливать необходимые библиотеки «на лету», система выполняет сложные аналитические запросы.

Ключевые примеры автоматизации:

*   **Анализ фондового рынка:** Агенты по запросу находят данные об акциях Nvidia, Tesla, Apple и Microsoft за последние 6 месяцев, автоматически устанавливают библиотеку `yfinance` для получения данных и `matplotlib` для визуализации, после чего сохраняют готовый график на рабочий стол пользователя [16:06].
*   **Научные исследования:** Автор продемонстрировал цепочку задач: найти на портале arXiv 5 последних статей об LLM, создать через DALL-E обложку в тему исследований, составить краткие аннотации (summary) текстов и упаковать всё это в многостраничный PDF-файл [20:12].

По оценке Wes Roth, подобная задача заняла у ИИ-агентов около 45 секунд и стоила примерно 14 центов в эквиваленте токенов API [20:51]. В то же время человеку-ассистенту на выполнение этой же работы потребовалось бы от 30 до 60 минут [21:04].

В завершение Wes Roth призывает зрителей следовать его мантире: «Пусть роботы делают работу» [0:26]. Он считает, что использование автономных агентов — это не просто технологическое развлечение, а способ не остаться позади в стремительно меняющемся мире искусственного интеллекта [19:57].