7 уровней настройки Hermes Agent: от установки на сервер до MCP-бэкенда

В 2026 году использование ИИ-агентов переросло из развлечения в индустрию с оборотами в миллионы долларов. Дэвид Ондрей, эксперт по нейросетям и основатель стартапа Vectal, делится своим опытом настройки Hermes Agent — одного из самых быстрорастущих Open Source проектов в истории. В этом материале мы разберем семь уровней эволюции автономного помощника: от простой установки на сервер до превращения его в полноценный бэкенд, способный управлять другими ИИ-моделями.

🛠️ Уровень 1: Фундамент и установка на VPS 0:00

По мнению Дэвида Ондрея, для эффективной работы ИИ-агент должен жить на собственном компьютере, а не зависеть от локальной машины пользователя. Автор рекомендует использовать выделенные VPS-серверы (например, Hostinger), так как это обеспечивает автономность 24/7.

Для базовой настройки на 2026 год Дэвид предлагает следующий алгоритм:

Выбор сервера: Ондрей считает оптимальным план KVM2 (минимум на 12–24 месяца), так как на одном таком сервере можно одновременно запускать Hermes Agent, Open Claw, Agent Zero и системы автоматизации вроде n8n.
Установка: Вместо Docker-контейнеров эксперт предпочитает установку на уровне корня (root level) для большей гибкости. Установка выполняется одной командой из официального GitHub-репозитория проекта, который на момент записи видео уже набрал 133 000 звезд.
Выбор «мозгов»: В качестве провайдера инференса Ондрей настоятельно рекомендует OpenRouter. Это дает доступ к любым моделям, включая Claude Opus 4.7 или GPT-5.5, без привязки к одному вендору.

Дэвид подчеркивает, что он лично тратит от $6 000 до $10 000 в месяц только на API-запросы для своих агентов. По его словам, это не теоретические рассуждения, а практика, позволившая ему разогнать стартап до $155 000 ARR, используя только ИИ-инструменты.

💬 Уровень 2: Интеграция с мессенджерами (Discord) 8:08

Второй этап — вывод управления агентом в привычную среду. Ондрей считает, что использование Hermes через Discord, Slack или Telegram гораздо удобнее, чем работа в терминале.

Процесс настройки шлюза (gateway):

В терминале выполняется команда hermes gateway setup.
Создается приложение в Discord Developer Portal.
Включаются все «Privileged Gateway Intents» (Presence, Server Members, Message Content).
Бот авторизуется на сервере с правами на чтение истории и отправку файлов.

Ондрей отмечает, что после настройки агент начинает реагировать на теги и создавать отдельные ветки (threads) для решения задач. Это позволяет взаимодействовать с ИИ даже с мобильного телефона.

🧹 Уровень 3: Куратор навыков и борьба с «раздуванием» 13:50

Одной из проблем самообучающихся агентов является накопление неиспользуемых навыков (skills). По словам Ондрея, без должного контроля это приводит к «засорению» контекста и лишним затратам на токены, которые могут исчисляться тысячами долларов.

Для решения этой проблемы в Hermes Agent внедрен инструмент Hermes Curator:

Автоматическая очистка: Если навык не использовался более 30 дней, он помечается как устаревший.
Удаление: После 90 дней простоя навык удаляется полностью.
Экономия: Дэвид утверждает, что включение куратора делает агента более сфокусированным и менее склонным к ошибкам из-за избытка нерелевантной информации.

📅 Уровень 4: Автоматизация и ежедневные бэкапы 15:00

На четвертом уровне агент начинает выполнять задачи по расписанию (cron jobs). Самый важный сценарий, который Ондрей советует настроить абсолютно каждому — автоматический бэкап всей директории Hermes в приватный репозиторий GitHub.

Настройка включает:

Создание приватного репозитория на GitHub.
Генерацию Fine-grained Personal Access Token с правами на чтение и запись контента.
Установку токена в переменные окружения через команду hermes config set GITHUB_TOKEN.

Дэвид демонстрирует, как агент сам создает cron-задачу (например, на 3:00 утра по местному времени) и ежедневно пушит изменения в облако. Это гарантирует сохранность данных и накопленных навыков в случае сбоя сервера.

📋 Уровень 5: Многоагентная Kanban-доска 20:48

Это одно из самых масштабных обновлений системы. Ондрей считает, что в будущем у каждого человека будут сотни ИИ-агентов, и главный вопрос заключается в том, как ими управлять.

Hermes Agent решает это через визуальный интерфейс Kanban:

Параллельная работа: Агенты (Researcher, Writer, Reviewer) берут задачи из колонки «To-Do» и работают одновременно.
Визуализация: Вместо того чтобы следить за логами в терминале, пользователь видит карточки задач, их приоритеты и статус выполнения.
Автоматическая отладка: Дэвид показывает впечатляющий пример: агент сам открывает браузер, заходит на локальный сервер, делает скриншоты интерфейса и исправляет ошибки в собственном коде, если что-то пошло не так.

В качестве примера Ондрей ставит задачу по исследованию рынка YouTube: один агент ищет тренды, второй анализирует конкурентов, третий ищет «пробелы» в контенте, а четвертый пишет сценарий.

🧠 Уровень 6: Голографическая память 32:05

Дэвид критикует стандартные подходы к памяти ИИ. По его мнению, простое увеличение контекстного окна — это путь к увеличению расходов и потере внимания модели. Технология RAG (поиск по сходству векторов) также несовершенна, так как она плохо работает со структурированными фактами.

Вместо этого он предлагает использовать Holographic Memory:

Локальное хранение: Данные не отправляются в облако, а хранятся в локальной базе данных SQL.
Извлечение фактов: Агент автоматически анализирует прошлые сессии и сохраняет только важные атрибуты (имена, предпочтения, настройки серверов).
Проверка противоречий: Система способна заметить, если два факта в памяти противоречат друг другу (например, разная частота публикации видео), и уточнить информацию у пользователя.

🔌 Уровень 7: Hermes как сервер MCP 37:42

Высший уровень мастерства — превращение Hermes в сервер Model Context Protocol (MCP). Это позволяет другим инструментам разработки (например, Claude Code или Cursor) взаимодействовать с Hermes как с бэкендом.

Дэвид выделяет три ключевых сценария использования:

Шлюз подтверждения (Approval Gate): Если внешний инструмент хочет выполнить опасную команду (например, удалить базу данных), Hermes перехватывает её и отправляет запрос на подтверждение в ваш Discord.
Режим «Ушел от компьютера»: Вы можете запустить тяжелый рефакторинг в редакторе кода, закрыть ноутбук и получать отчеты о прогрессе на телефон через Hermes.
Мобильная диагностика: Можно попросить Claude Code (через Hermes) проанализировать баг в репозитории и выдать решение, не открывая компьютер.

В финале Ондрей демонстрирует, как Claude Code через MCP-сервер Hermes анализирует его цели и привычки, подтверждая, что агент успешно извлек данные о его бизнесе и стиле работы из истории переписки.