Уэс Рот: «Hermes Agent и GPT 5.5 строят сложные симуляции почти без участия человека»

Уэс Рот потратил 40 часов на создание системы тестирования нейросетей, где ИИ-агенты самостоятельно учатся управлять космическими кораблями в гравитационной симуляции. Он утверждает, что связка Hermes Agent и GPT 5.5 позволяет автоматизировать написание сложного кода и проведение итерационных тестов в ночное время без участия человека.

🌌 Симуляция гравитации как бенчмарк для ИИ 0:00

Уэс Рот разработал игру Gravel, в которой четыре гравитационных колодца («солнца») притягивают корабли . Нейросеть должна управлять тягой двигателей, чтобы удерживать корабли внутри движущегося круга. Модели не получают прямых команд управления, а пишут исполняемый код на языке Python для автоматического пилотирования .

Процесс обучения состоит из нескольких этапов:

Модель получает описание физики игры, параметров гравитации и работы двигателей на английском языке .
Система запускает 20 итераций, где каждая последующая версия кода основывается на диагностических отчётах предыдущих запусков .
Лучший результат проверяется на 100 различных «сидах» (случайных начальных позициях солнц и круга) для подтверждения стабильности алгоритма .

В ходе тестов Claude Opus 4.5 поднял свой результат с 46 до 276 очков за 20 попыток . В то же время Claude Sonnet 4.6 продемонстрировал более пологую кривую обучения, достигнув предела в 78 очков .

🤖 Возможности и логика Hermes Agent 7:35

Hermes Agent — это проект с открытым исходным кодом от Noose Research, предназначенный для создания автономных навыков у нейросетей . По словам Уэса Рота, главной особенностью агента является персистентная память. Он запоминает структуру проектов и самостоятельно создаёт новые навыки (skills), которые совершенствуются со временем .

Агент выполняет роль координатора или «умной обёртки». Он может вызывать другие среды, такие как Claude Code или Codex, в качестве вспомогательных инструментов . Уэс Рот использует этот подход для разделения труда: днём он работает совместно с ИИ, а ночью агент запускает автоматизированные циклы тестов и симуляций . К 5:32 утра агент завершил проверку GPT 5.4, GPT 5.5 Pro, Deepseek V4 Pro и Gemini 3.1 Pro .

🛠️ Установка Hermes Agent на VPS 9:42

Для бесперебойной работы агентов Уэс Рот использует виртуальные частные серверы (VPS) . Это позволяет избежать проблем с домашним оборудованием и обеспечивает постоянный доступ к интернету.

Технические требования и параметры установки:

Провайдер: Hostinger, тариф KVM2 .
Ресурсы: 2 vCPU, 8 ГБ оперативной памяти и 100 ГБ NVMe-диска .
Операционная система: Ubuntu 24.04 LTS (Long Term Support) .
Команда подключения: ssh root@IP-адрес .

Установка производится одной командой через официальный скрипт Hermes . В процессе настройки Уэс Рот рекомендует выбрать провайдера Noose Portal. Эта подписка объединяет доступ к сотням моделей и включает инструменты поиска в вебе, генерации изображений и автоматизации браузера без необходимости настраивать каждый API-ключ отдельно .

⚙️ Настройка среды и инструментов 25:40

После установки необходимо сконфигурировать поведение агента. Уэс Рот выделил несколько ключевых параметров настройки:

Лимит итераций: Рекомендуется установить значение 90 для большинства задач и 150 для глубоких исследований .
Терминал: Для новых установок Ubuntu следует выбирать локальный бэкенд, а позже переходить на Docker для изоляции процессов .
Sudo: Отключение поддержки sudo для агента повышает безопасность, предотвращая выполнение административных команд от имени суперпользователя .

Обновление агента до последней версии выполняется командой Hermes update . Для активации GPT 5.5 требуется авторизация через OpenAI Codex OAUTH . После этого модель становится доступной внутри интерфейса Hermes для генерации кода и выполнения задач.

🛡️ Риски и безопасность при работе с агентами 28:52

Уэс Рот предупреждает об опасности режима dangerously bypass approval. В этом режиме агент исполняет команды без подтверждения пользователем и вне «песочницы» . Это ускоряет работу при длительных циклах, но создает риск повреждения системы.

Меры предосторожности от автора:

Никогда не устанавливать агентов в таком режиме на основной рабочий компьютер .
Использовать выделенные VPS или старые ноутбуки с Linux для изоляции «радиуса взрыва» при ошибках .
Настраивать интеграцию с 1Password для безопасного управления API-ключами .
Использовать Docker-контейнеры для изоляции повреждений .

🏆 Результаты дуэлей нейросетей 31:42

В PvP-арене модели сталкиваются напрямую. Уэс Рот запустил дуэль между GPT 5.5 High и Claude Opus 4.7 . Hermes Agent создал специальный навык Gravo GBT agent loop для координации этого процесса .

Итоги соревнований:

GPT 5.5 High одержала победу в 7 раундах из 10 .
Claude Opus 4.7 выиграл 3 раунда .
В общем зачете Claude Opus 4.7 удерживает винрейт 88.3% против более широкого круга моделей .

На первых итерациях модели часто допускают «ошибки новичка»: тратят всё топливо на резкое ускорение и улетают в пустое пространство . К 10–20 итерации алгоритмы превращаются в «асов», которые экономно используют тягу и заранее просчитывают траекторию движения круга . По мнению Уэса Рота, GPT 5.5 особенно эффективна в долгосрочном планировании и решении комплексных проектов .