Уэс Рот потратил 40 часов на создание системы тестирования нейросетей, где ИИ-агенты самостоятельно учатся управлять космическими кораблями в гравитационной симуляции. Он утверждает, что связка Hermes Agent и GPT 5.5 позволяет автоматизировать написание сложного кода и проведение итерационных тестов в ночное время без участия человека.
🌌 Симуляция гравитации как бенчмарк для ИИ 0:00
Уэс Рот разработал игру Gravel, в которой четыре гравитационных колодца («солнца») притягивают корабли . Нейросеть должна управлять тягой двигателей, чтобы удерживать корабли внутри движущегося круга. Модели не получают прямых команд управления, а пишут исполняемый код на языке Python для автоматического пилотирования .
Процесс обучения состоит из нескольких этапов:
- Модель получает описание физики игры, параметров гравитации и работы двигателей на английском языке .
- Система запускает 20 итераций, где каждая последующая версия кода основывается на диагностических отчётах предыдущих запусков .
- Лучший результат проверяется на 100 различных «сидах» (случайных начальных позициях солнц и круга) для подтверждения стабильности алгоритма .
В ходе тестов Claude Opus 4.5 поднял свой результат с 46 до 276 очков за 20 попыток . В то же время Claude Sonnet 4.6 продемонстрировал более пологую кривую обучения, достигнув предела в 78 очков .
🤖 Возможности и логика Hermes Agent 7:35
Hermes Agent — это проект с открытым исходным кодом от Noose Research, предназначенный для создания автономных навыков у нейросетей . По словам Уэса Рота, главной особенностью агента является персистентная память. Он запоминает структуру проектов и самостоятельно создаёт новые навыки (skills), которые совершенствуются со временем .
Агент выполняет роль координатора или «умной обёртки». Он может вызывать другие среды, такие как Claude Code или Codex, в качестве вспомогательных инструментов . Уэс Рот использует этот подход для разделения труда: днём он работает совместно с ИИ, а ночью агент запускает автоматизированные циклы тестов и симуляций . К 5:32 утра агент завершил проверку GPT 5.4, GPT 5.5 Pro, Deepseek V4 Pro и Gemini 3.1 Pro .
🛠️ Установка Hermes Agent на VPS 9:42
Для бесперебойной работы агентов Уэс Рот использует виртуальные частные серверы (VPS) . Это позволяет избежать проблем с домашним оборудованием и обеспечивает постоянный доступ к интернету.
Технические требования и параметры установки:
- Провайдер: Hostinger, тариф KVM2 .
- Ресурсы: 2 vCPU, 8 ГБ оперативной памяти и 100 ГБ NVMe-диска .
- Операционная система: Ubuntu 24.04 LTS (Long Term Support) .
- Команда подключения:
ssh root@IP-адрес.
Установка производится одной командой через официальный скрипт Hermes . В процессе настройки Уэс Рот рекомендует выбрать провайдера Noose Portal. Эта подписка объединяет доступ к сотням моделей и включает инструменты поиска в вебе, генерации изображений и автоматизации браузера без необходимости настраивать каждый API-ключ отдельно .
⚙️ Настройка среды и инструментов 25:40
После установки необходимо сконфигурировать поведение агента. Уэс Рот выделил несколько ключевых параметров настройки:
- Лимит итераций: Рекомендуется установить значение 90 для большинства задач и 150 для глубоких исследований .
- Терминал: Для новых установок Ubuntu следует выбирать локальный бэкенд, а позже переходить на Docker для изоляции процессов .
- Sudo: Отключение поддержки sudo для агента повышает безопасность, предотвращая выполнение административных команд от имени суперпользователя .
Обновление агента до последней версии выполняется командой Hermes update . Для активации GPT 5.5 требуется авторизация через OpenAI Codex OAUTH . После этого модель становится доступной внутри интерфейса Hermes для генерации кода и выполнения задач.
🛡️ Риски и безопасность при работе с агентами 28:52
Уэс Рот предупреждает об опасности режима dangerously bypass approval. В этом режиме агент исполняет команды без подтверждения пользователем и вне «песочницы» . Это ускоряет работу при длительных циклах, но создает риск повреждения системы.
Меры предосторожности от автора:
- Никогда не устанавливать агентов в таком режиме на основной рабочий компьютер .
- Использовать выделенные VPS или старые ноутбуки с Linux для изоляции «радиуса взрыва» при ошибках .
- Настраивать интеграцию с 1Password для безопасного управления API-ключами .
- Использовать Docker-контейнеры для изоляции повреждений .
🏆 Результаты дуэлей нейросетей 31:42
В PvP-арене модели сталкиваются напрямую. Уэс Рот запустил дуэль между GPT 5.5 High и Claude Opus 4.7 . Hermes Agent создал специальный навык Gravo GBT agent loop для координации этого процесса .
Итоги соревнований:
- GPT 5.5 High одержала победу в 7 раундах из 10 .
- Claude Opus 4.7 выиграл 3 раунда .
- В общем зачете Claude Opus 4.7 удерживает винрейт 88.3% против более широкого круга моделей .
На первых итерациях модели часто допускают «ошибки новичка»: тратят всё топливо на резкое ускорение и улетают в пустое пространство . К 10–20 итерации алгоритмы превращаются в «асов», которые экономно используют тягу и заранее просчитывают траекторию движения круга . По мнению Уэса Рота, GPT 5.5 особенно эффективна в долгосрочном планировании и решении комплексных проектов .