В 2026 году использование ИИ-агентов переросло из развлечения в индустрию с оборотами в миллионы долларов. Дэвид Ондрей, эксперт по нейросетям и основатель стартапа Vectal, делится своим опытом настройки Hermes Agent — одного из самых быстрорастущих Open Source проектов в истории. В этом материале мы разберем семь уровней эволюции автономного помощника: от простой установки на сервер до превращения его в полноценный бэкенд, способный управлять другими ИИ-моделями.
🛠️ Уровень 1: Фундамент и установка на VPS 0:00
По мнению Дэвида Ондрея, для эффективной работы ИИ-агент должен жить на собственном компьютере, а не зависеть от локальной машины пользователя. Автор рекомендует использовать выделенные VPS-серверы (например, Hostinger), так как это обеспечивает автономность 24/7.
Для базовой настройки на 2026 год Дэвид предлагает следующий алгоритм:
- Выбор сервера: Ондрей считает оптимальным план KVM2 (минимум на 12–24 месяца), так как на одном таком сервере можно одновременно запускать Hermes Agent, Open Claw, Agent Zero и системы автоматизации вроде n8n.
- Установка: Вместо Docker-контейнеров эксперт предпочитает установку на уровне корня (root level) для большей гибкости. Установка выполняется одной командой из официального GitHub-репозитория проекта, который на момент записи видео уже набрал 133 000 звезд.
- Выбор «мозгов»: В качестве провайдера инференса Ондрей настоятельно рекомендует OpenRouter. Это дает доступ к любым моделям, включая Claude Opus 4.7 или GPT-5.5, без привязки к одному вендору.
Дэвид подчеркивает, что он лично тратит от $6 000 до $10 000 в месяц только на API-запросы для своих агентов. По его словам, это не теоретические рассуждения, а практика, позволившая ему разогнать стартап до $155 000 ARR, используя только ИИ-инструменты.
💬 Уровень 2: Интеграция с мессенджерами (Discord) 8:08
Второй этап — вывод управления агентом в привычную среду. Ондрей считает, что использование Hermes через Discord, Slack или Telegram гораздо удобнее, чем работа в терминале.
Процесс настройки шлюза (gateway):
- В терминале выполняется команда
hermes gateway setup. - Создается приложение в Discord Developer Portal.
- Включаются все «Privileged Gateway Intents» (Presence, Server Members, Message Content).
- Бот авторизуется на сервере с правами на чтение истории и отправку файлов.
Ондрей отмечает, что после настройки агент начинает реагировать на теги и создавать отдельные ветки (threads) для решения задач. Это позволяет взаимодействовать с ИИ даже с мобильного телефона.
🧹 Уровень 3: Куратор навыков и борьба с «раздуванием» 13:50
Одной из проблем самообучающихся агентов является накопление неиспользуемых навыков (skills). По словам Ондрея, без должного контроля это приводит к «засорению» контекста и лишним затратам на токены, которые могут исчисляться тысячами долларов.
Для решения этой проблемы в Hermes Agent внедрен инструмент Hermes Curator:
- Автоматическая очистка: Если навык не использовался более 30 дней, он помечается как устаревший.
- Удаление: После 90 дней простоя навык удаляется полностью.
- Экономия: Дэвид утверждает, что включение куратора делает агента более сфокусированным и менее склонным к ошибкам из-за избытка нерелевантной информации.
📅 Уровень 4: Автоматизация и ежедневные бэкапы 15:00
На четвертом уровне агент начинает выполнять задачи по расписанию (cron jobs). Самый важный сценарий, который Ондрей советует настроить абсолютно каждому — автоматический бэкап всей директории Hermes в приватный репозиторий GitHub.
Настройка включает:
- Создание приватного репозитория на GitHub.
- Генерацию Fine-grained Personal Access Token с правами на чтение и запись контента.
- Установку токена в переменные окружения через команду
hermes config set GITHUB_TOKEN.
Дэвид демонстрирует, как агент сам создает cron-задачу (например, на 3:00 утра по местному времени) и ежедневно пушит изменения в облако. Это гарантирует сохранность данных и накопленных навыков в случае сбоя сервера.
📋 Уровень 5: Многоагентная Kanban-доска 20:48
Это одно из самых масштабных обновлений системы. Ондрей считает, что в будущем у каждого человека будут сотни ИИ-агентов, и главный вопрос заключается в том, как ими управлять.
Hermes Agent решает это через визуальный интерфейс Kanban:
- Параллельная работа: Агенты (Researcher, Writer, Reviewer) берут задачи из колонки «To-Do» и работают одновременно.
- Визуализация: Вместо того чтобы следить за логами в терминале, пользователь видит карточки задач, их приоритеты и статус выполнения.
- Автоматическая отладка: Дэвид показывает впечатляющий пример: агент сам открывает браузер, заходит на локальный сервер, делает скриншоты интерфейса и исправляет ошибки в собственном коде, если что-то пошло не так.
В качестве примера Ондрей ставит задачу по исследованию рынка YouTube: один агент ищет тренды, второй анализирует конкурентов, третий ищет «пробелы» в контенте, а четвертый пишет сценарий.
🧠 Уровень 6: Голографическая память 32:05
Дэвид критикует стандартные подходы к памяти ИИ. По его мнению, простое увеличение контекстного окна — это путь к увеличению расходов и потере внимания модели. Технология RAG (поиск по сходству векторов) также несовершенна, так как она плохо работает со структурированными фактами.
Вместо этого он предлагает использовать Holographic Memory:
- Локальное хранение: Данные не отправляются в облако, а хранятся в локальной базе данных SQL.
- Извлечение фактов: Агент автоматически анализирует прошлые сессии и сохраняет только важные атрибуты (имена, предпочтения, настройки серверов).
- Проверка противоречий: Система способна заметить, если два факта в памяти противоречат друг другу (например, разная частота публикации видео), и уточнить информацию у пользователя.
🔌 Уровень 7: Hermes как сервер MCP 37:42
Высший уровень мастерства — превращение Hermes в сервер Model Context Protocol (MCP). Это позволяет другим инструментам разработки (например, Claude Code или Cursor) взаимодействовать с Hermes как с бэкендом.
Дэвид выделяет три ключевых сценария использования:
- Шлюз подтверждения (Approval Gate): Если внешний инструмент хочет выполнить опасную команду (например, удалить базу данных), Hermes перехватывает её и отправляет запрос на подтверждение в ваш Discord.
- Режим «Ушел от компьютера»: Вы можете запустить тяжелый рефакторинг в редакторе кода, закрыть ноутбук и получать отчеты о прогрессе на телефон через Hermes.
- Мобильная диагностика: Можно попросить Claude Code (через Hermes) проанализировать баг в репозитории и выдать решение, не открывая компьютер.
В финале Ондрей демонстрирует, как Claude Code через MCP-сервер Hermes анализирует его цели и привычки, подтверждая, что агент успешно извлек данные о его бизнесе и стиле работы из истории переписки.