В новом техническом руководстве исследователь ИИ Вес Рот (Wes Roth) демонстрирует возможности экосистемы Hermes Agent. Видео приурочено к хакатону «Hermes Agent Accelerated Business Hackathon», организованному Nous Research при поддержке NVIDIA и Stripe, где главной задачей является создание полностью автономных агентов, способных управлять бизнесом, зарабатывать и тратить средства.
🚀 Hermes Agent: от идеи к автономному бизнесу 0:00
Вес Рот вспоминает свой прогноз двухлетней давности о появлении полностью автономных ИИ-предприятий . Сегодня это становится реальностью благодаря Hermes Agent. В качестве примера автор приводит проект «Dark Factory» — автономную «фабрику ПО», которая принимает идею вечером, а к утру выдает развернутый URL с готовым проектом .
Основные компоненты современной экосистемы Hermes:
- Stripe Skills: позволяют агенту совершать покупки, оплачивать подписки (SaaS) и пополнять баланс API .
- NVIDIA Nemotron-3: семейство открытых моделей для обеспечения конфиденциальности и производительности .
- Reach Update: недавнее обновление Hermes, добавившее поддержку Unreal Engine для автоматического создания видеоигр .
🛠 Установка и настройка на VPS 2:40
Автор подчеркивает, что для серьезной работы агента лучше использовать виртуальный частный сервер (VPS), а не локальное железо, так как агент должен быть доступен 24/7 .
Процесс развертывания через Hostinger (рекомендуемый план — KVM2 с 8 ГБ RAM и 100 ГБ NVMe ):
- Выбор шаблона: Вес Рот рекомендует использовать установку в один клик с предустановленным Docker и Hermes Agent .
- Запуск через терминал: после деплоя управление происходит напрямую в Docker-контейнере .
- Команды инициализации:
🧬 Подключение языковых моделей: Portal и OpenAI Codex 11:16
Hermes Agent — это «скелет» агента, которому нужен «мозг» (LLM). Вес Рот описывает два основных пути подключения моделей:
1. Nous Portal
Интегрированное решение от разработчиков Hermes.
- Дает доступ к более чем 300 моделям (включая Claude 3 Opus, GPT-4 и специфические модели NVIDIA) под одной подпиской .
- Включает встроенные инструменты (Tool Gateway): поиск в вебе, генерация изображений и видео .
2. OpenAI Codex (OAUTH)
Позволяет использовать существующую подписку ChatGPT Plus для работы агента .
- Преимущество: вы не платите за каждый миллион токенов отдельно, а используете лимиты своей подписки .
- Настройка: команда
hermes setup, выбор провайдера OpenAI и авторизация через 9-значный код в браузере .
💳 Агентские платежи через Stripe и Link 20:00
Ключевая новинка — способность агента самостоятельно совершать финансовые операции через Stripe Link CLI . Вес Рот поясняет, что это экспериментальная и «фронтирная» технология, требующая осторожности .
Механика безопасности:
- Approval Flow: агент не может сам подтвердить платеж. Уведомление приходит в приложение Link на смартфоне владельца, где требуется нажать «Approve» (включая биометрию) .
- Виртуальные карты: для каждой транзакции создается одноразовая виртуальная карта. Продавец никогда не видит реальные данные вашей физической карты, и агент тоже их не знает .
В ходе демонстрации Вес Рот успешно заставляет агента найти самый дешевый товар для животных и купить брендированный стикер-пак за $1.06 на Shopify . Несмотря на успех, автор отмечает, что многие крупные ритейлеры (Walmart, PetSmart) блокируют агентов, принимая их за вредоносных ботов . Тем не менее, сценарий «дозаправки» (topping off) баланса API-сервисов агентом в ночное время уже полностью работоспособен .
🛡 Безопасность с NVIDIA Nemoclaw 32:10
Поскольку агент имеет доступ к деньгам и файловой системе, NVIDIA разработала Nemoclaw — защитную «оболочку» вокруг агента .
Nemoclaw состоит из трех частей :
- OpenShell: «песочница» (sandbox) на уровне ядра для безопасного исполнения кода.
- NVIDIA Nemotron: модели с открытыми весами, которые можно запускать локально и приватно .
- Privacy Router: умный маршрутизатор. Если запрос содержит конфиденциальные данные (например, данные пациента в больнице), он направляется на локальную модель. Если запрос общий — он может быть отправлен в облако (Claude/GPT) .
Практическая демонстрация блокировки: Вес Рот показывает работу агента в режиме реального времени . Когда агент пытается выйти в сеть, в консоли Nemoclaw появляются запросы на подтверждение (Network Rules). Автор отклоняет доступ к определенному сайту, и агент мгновенно получает ошибку «Blocked», даже не подозревая, что находится под внешним контролем .
💡 Итоги и ресурсы 51:38
Вес Рот призывает разработчиков не бояться технических сложностей и использовать чат-ботов (Claude или ChatGPT) для отладки ошибок в терминале . Он уверен, что сегодняшние эксперименты с Hermes Agent закладывают фундамент для бизнеса на «полном автопилоте» в ближайшем будущем .