Как создать армию ИИ-агентов: пошаговое руководство Wes Roth по Microsoft AutoGen и GPT-4o

Wes Roth 55 тыс. 21 мин 4 мин 21.05.2024
Главное

Популярный ИИ-энтузиаст и автор одноименного YouTube-канала Wes Roth представил подробный туториал по обновленной версии Microsoft AutoGen Studio. В своем видео он демонстрирует, как создать «армию ИИ-агентов» для автоматизации сложных задач — от написания кода видеоигр до проведения глубоких рыночных исследований — без необходимости глубокого погружения в программирование.

🛠️ Установка и настройка: ИИ-агенты для каждого 0:00

Wes Roth подчеркивает, что с момента первого релиза установка AutoGen Studio значительно упростилась и теперь не требует серьезных навыков кодинга . Процесс развертывания системы базируется на создании изолированной среды, которую ведущий сравнивает с «карманной вселенной» внутри компьютера .

Основные этапы подготовки окружения:

По наблюдениям Wes Roth, многие разработчики, с которыми он общался, считают облачный сервис Azure более стабильным для запуска моделей OpenAI по сравнению с прямым использованием API OpenAI . При этом сам автор в процессе видео переходит на использование Mac OS, отмечая, что эта операционная система кажется ему более удобной для современной разработки ИИ-инструментов .

Запуск интерфейса осуществляется простой командой autogenstudio ui, которая разворачивает локальный веб-сервер .

🧩 Архитектура AutoGen Studio: навыки, модели и рабочие процессы 5:34

Интерфейс AutoGen Studio разделен на три основные вкладки: Build (Сборка), Playground (Песочница) и Gallery (Галерея) . Основная работа по кастомизации происходит в разделе Build, который состоит из четырех ключевых компонентов:

  1. Workflows (Рабочие процессы): Логика взаимодействия агентов и определение того, кто и за что отвечает в рамках конкретной задачи .
  2. Agents (Агенты): Сами цифровые сущности, выполняющие команды .
  3. Models (Модели): «Мозги» системы, такие как GPT-4o или локальные модели .
  4. Skills (Навыки): Наборы Python-кода, расширяющие возможности агентов .

Wes Roth сравнивает навыки с «кулинарными рецептами» . Пользователю не обязательно уметь писать код с нуля; достаточно понимать, что конкретный блок кода выполняет определенную функцию — например, генерирует изображение через DALL-E 3 или парсит данные с веб-сайта .

Примером эффективного навыка является функция скрапинга текста с веб-страниц . Агент получает URL, извлекает содержимое и возвращает его в виде текста, который затем может быть использован другими агентами в цепочке.

🚀 Тест-драйв GPT-4o: создание игр за считанные секунды 9:30

Особое внимание в уроке уделено интеграции новейшей модели GPT-4o (Omni). Wes Roth демонстрирует, как добавить модель в систему, используя актуальные идентификаторы из документации OpenAI .

В качестве эксперимента ведущий поручил системе написать код для игры «Тетрис» на языке Python . Результаты теста:

При создании более сложной игры, «Flappy Bird», возникла потребность во внешних ассетах (изображениях птицы, труб и фона). Агент самостоятельно предложил решение: он написал отдельный Python-скрипт для генерации необходимых графических заглушек . Wes Roth в шутку сравнил игровой процесс в созданной версии с тестом «Кобаяси Мару» из Star Trek — сценарием, в котором невозможно победить, поскольку ИИ создал бесконечно сложную полосу препятствий .

📊 Автоматизация сложных бизнес-задач: от графиков до научных отчетов 15:46

Wes Roth наглядно показывает, что AutoGen Studio способна решать задачи, выходящие за рамки простого чат-бота. Благодаря способности агентов устанавливать необходимые библиотеки «на лету», система выполняет сложные аналитические запросы.

Ключевые примеры автоматизации:

По оценке Wes Roth, подобная задача заняла у ИИ-агентов около 45 секунд и стоила примерно 14 центов в эквиваленте токенов API . В то же время человеку-ассистенту на выполнение этой же работы потребовалось бы от 30 до 60 минут .

В завершение Wes Roth призывает зрителей следовать его мантире: «Пусть роботы делают работу» . Он считает, что использование автономных агентов — это не просто технологическое развлечение, а способ не остаться позади в стремительно меняющемся мире искусственного интеллекта .

💬 Цитаты

«Сделайте это своей мантрой: пусть роботы делают работу.»

«Думайте об окружении Conda как о маленькой карманной вселенной на вашем компьютере.»

«Это заняло у ИИ около 45 секунд. Это стоило около 14 центов. У человека-ассистента это заняло бы от 30 до 60 минут.»

👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Conda environment
Изолированная виртуальная среда для установки программ, исключающая конфликты библиотек.
Skill (в AutoGen)
Блок Python-кода, который агент использует как инструмент для выполнения конкретной функции (например, создания графиков).
User Proxy
Агент, выступающий посредником между пользователем и системой, инициирующий выполнение задач.
Scraping
Процесс автоматического сбора данных с веб-сайтов.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Microsoft AutoGen GPT-4o Wes Roth AutoGen Studio OpenAI API