Дэвид Ондрей: как дать автономному ИИ-агенту Hermes реальный телефонный номер

David Ondrej 20,1 тыс. 31 мин 9 мин 20.05.2026
Главное

Популярность искусственного интеллекта среди продвинутых пользователей давно вышла за пределы простых текстовых чатов, однако интеграция умных агентов с реальной телефонной сетью до сих пор оставалась барьером для многих разработчиков. Известный технологический блогер Дэвид Ондрей (David Ondrej) в своем новом видеоруководстве продемонстрировал, как преодолеть этот разрыв, подключив автономного агента Hermes Agent к специализированной голосовой платформе Vapi через протокол MCP (Model Context Protocol). Автор на практических примерах объясняет, как за считанные минуты наделить ИИ способностью совершать автоматические холодные звонки, обрабатывать входящие запросы клиентов и даже выступать в роли личного консьержа, способного связываться с владельцем в режиме реального времени.

🛠️ Локальная установка и базовая настройка Hermes Agent 0:51

Первым шагом в построении автономной голосовой системы является развертывание базовой программной среды. Дэвид Ондрей демонстрирует процесс установки Hermes Agent на локальный компьютер, отмечая, что аналогичные действия можно выполнить и на виртуальном выделенном сервере (VPS). Для инсталляции используется готовый скрипт автоматической установки, доступный в официальном репозитории проекта.

Процесс запуска и инициализации выглядит следующим образом:

  1. Необходимо скопировать команду быстрой установки из репозитория Hermes Agent, вставить ее в терминал и запустить процесс.
  2. После завершения инсталляции выполняется команда hermes setup, которая открывает интерактивное меню конфигурации в консоли.
  3. В качестве основного провайдера языковых моделей автор выбирает сервис Open Router, аргументируя это удобством доступа к передовым нейросетям.

Для интеграции с Open Router пользователю требуется создать аккаунт на сайте openrouter.ai и пополнить баланс на небольшую сумму — по заверению автора, для тестов вполне достаточно от 5 до 10 долларов. В разделе API Keys генерируется новый секретный ключ. Во время демонстрации Дэвид Ондрей устанавливает лимит расходов по ключу в размере 50 долларов в качестве разумной меры предосторожности.

Возвращаясь в окно терминала, пользователь заменяет или вставляет скопированный ключ. В качестве базовой языковой модели автор выбирает флагманскую Claude 3.5 Opus (в транскрипте упомянута как Opus 4.7). Последующие шаги настройки, включая параметры генерации речи (Text to Speech), количество итераций размышления и выбор навигационной платформы, можно пропустить, нажимая клавишу Enter для сохранения оптимальных дефолтных значений. Запуск готового агента осуществляется простой командой hermes.

🤝 Синергия Hermes Agent и платформы Vapi 3:13

По оценке Дэвида Ондрея, около 99% продвинутых пользователей ИИ привыкли применять технологии для веб-серфинга, написания кода или работы с электронной почтой, но все еще избегают доверять нейросетям телефонные звонки. Решением этой проблемы становится облачная платформа Vapi, которая предоставляет необходимую телекоммуникационную инфраструктуру.

Суть интеграции двух систем автор описывает лаконичной формулой: Vapi делает телефонные вызовы гибко конфигурируемыми, в то время как Hermes Agent делает их полностью автономными. Их взаимодействие открывает доступ к функциям, которые ранее требовали содержания целого штата сотрудников.

Платформа Vapi берет на себя техническую сторону аудиопотока:

Со своей стороны, автономный агент Hermes обогащает систему логическими инструментами:

Статистика платформы Vapi демонстрирует коммерческую доступность технологии: средняя стоимость минуты разговора составляет всего 0,1 доллара, а средняя задержка ответа (latency) не превышает 1,15 секунды (1150 миллисекунд), что делает общение естественным для человеческого восприятия. Внутренний конвейер обработки звука Vapi состоит из трех этапов: транскрибатор переводит речь человека в текст, большая языковая модель генерирует текстовый ответ, а движок синтеза речи превращает его в финальный аудиопоток.

🔌 Подключение Vapi через MCP-сервер 6:25

Связующим звеном между локальным агентом и облачной АТС выступает специализированный сервер протокола MCP (Model Context Protocol). Автор подчеркивает, что благодаря архитектурным особенностям Hermes Agent, пользователю даже не нужно вручную редактировать конфигурационные файлы — агент способен настроить интеграцию самостоятельно.

Для сопряжения систем достаточно скопировать URL-адрес страницы с настройками API из панели управления Vapi, отправить его в чат с Hermes и дать прямую команду на установку нового MCP-сервера. Агент в автоматическом режиме распознает структуру расширения и запросит у пользователя приватный ключ аутентификации.

Дэвид Ондрей обращает внимание на безопасные методы работы с конфиденциальными данными: хотя передача API-ключа напрямую в текстовое окно агента является самым быстрым способом настройки, в корпоративной среде правильнее использовать защищенную терминальную команду:

hermes config set VAPI_API_KEY <ваш_приватный_ключ>

После завершения автоматической инсталляции и предоставления агенту необходимых разрешений на запись файлов, сессию Hermes необходимо перезапустить сочетанием клавиш Ctrl+C. Проверить корректность привязки можно с помощью лаконичного запроса к агенту с просьбой вывести список активных MCP-серверов и зарегистрированных ключей конфигурации. Приятным бонусом платформы Vapi, по словам автора, является предоставление до 10 бесплатных американских телефонных номеров на одну учетную запись, что позволяет сразу приступить к тестированию сценариев.

📞 Сценарий 1: Исследование рынка и первый исходящий звонок 12:44

В качестве базового эксперимента Дэвид Ондрей предлагает бытовой сценарий: поиск спа-салона в Нью-Йорке с целью бронирования сеанса массажа. На примере простого текстового запроса с опечатками автор демонстрирует, как Hermes Agent выполняет серию поисковых запросов в Интернете, находит актуальные заведения в районе Манхэттена и извлекает их контактные телефоны.

Как только данные получены, агент запрашивает разрешение на звонок. После подтверждения Hermes связывается с API Vapi, задействует встроенного ассистента для бронирования встреч (Appointment Booking Assistant) и инициирует вызов на реальный телефонный номер салона. В панели управления Vapi статус звонка мгновенно меняется на «Call in progress».

Анализ аудиозаписи состоявшегося разговора выявил сильные и слабые стороны текущей сборки:

Для оптимизации качества диалога автор рекомендует провести тонкую настройку голосового ассистента непосредственно в интерфейсе Vapi. В частности, слабую модель GPT-4o целесообразно заменить на более быструю и продвинутую GPT-5.4 Mini или стандартную GPT-5.4, а параметр Randomness (temperature) выставить на уровне 0.7. Чтобы сделать голос робота более человечным, Дэвид Ондрей переключает синтез на женский голос «Emma», немного снижает скорость речи и добавляет едва заметный фоновый шум офиса (office background sounds) для маскировки «цифровой природы» звонка.

📈 Сценарий 2: Автоматизация холодного обзвона и лидогенерация 16:40

Второй сценарий ориентирован на сегмент B2B и демонстрирует создание полноценного виртуального менеджера по продажам. С помощью текстового запроса на естественном языке автор поручает Hermes спроектировать в Vapi абсолютно нового ассистента для холодного обзвона студий автодетейлинга в Нью-Джерси с целью назначения встреч.

Используя MCP-соединение, Hermes Agent опрашивает доступные телефонные номера, создает в облаке Vapi нового агента под названием «New Jersey car detailing leadgen outreach» и самостоятельно прописывает для него сложнейший системный промпт. Робот получает виртуальную личность: «Вы — Морган, специалист по развитию продаж (SDR) из агентства лидогенерации Bright Lane». Hermes детально прописывает для Моргана инструкции по тону общения (теплый, непринужденный, уверенный американский английский) и закладывает алгоритмы обработки типичных клиентских возражений.

Для масштабирования этой механики Дэвид Ондрей предлагает развернуть автономную систему массового обзвона:

  1. Голосовые ассистенты могут запускаться параллельно, распределяя задачи: один квалифицирует лиды, второй подтверждает время, третий осуществляет первичный контакт.
  2. По мнению Ондрея, компании, которые первыми внедрят подобные инструменты, неизбежно опередят конкурентов, игнорирующих прогресс, поскольку ИИ-агенты способны непрерывно работать в режиме 24/7.
  3. Агенту отдается команда на создание крон-задачи (cron job) для автоматического совершения вызовов каждые 10 минут по списку компаний из Нью-Джерси.
  4. Чтобы избежать повторных звонков одним и тем же абонентам, Hermes Agent по запросу автора разворачивает локальную базу данных SQLite, где фиксирует историю контактов и результаты каждого разговора.

В ходе практического теста один из исходящих вызовов продлился аномальные 8 минут. Проверка логов показала, что робот наткнулся на автоответчик компании и зациклился, пытаясь вести диалог с записанным приветствием голосовой почты. Для решения этой проблемы Дэвид Ондрей оперативно корректирует инструкции для Hermes: в правила ассистента добавляется жесткое условие — мгновенно класть трубку при обнаружении голосовой почты («If you notice voicemail just hang up»), а управляющая нейросеть принудительно переводится на архитектуру GPT-5.4.

📥 Сценарий 3: Обработка входящих вызовов для бизнеса 24:02

Третий сектор применения связки Hermes и Vapi — автоматизация входящей линии (inbound calls), что позволяет существенно снизить затраты на содержание администраторов и секретарей, находящихся на окладе. Техническую стабильность таких звонков обеспечивает внутренний оркестратор Vapi (orchestrator), который берет на себя самые сложные задачи: отсекает фоновые шумы, мгновенно прерывает речь робота, если человек перебивает его, и пытается распознать эмоциональное состояние собеседника.

Дэвид Ондрей моделирует ситуацию для вымышленного спа-салона в польском городе Катовице. По команде из терминала Hermes Agent за 55 секунд создает конфигурацию входящего голосового помощника, способного информировать клиентов о часах работы, доступных видах массажа и ценах. Удивительной особенностью созданного агента становится языковая гибкость: Hermes автоматически настраивает польский языковой пакет с возможностью бесшовного переключения на английский язык по ходу беседы.

Для глубокой интеграции в бизнес-процессы платформа Vapi позволяет подключать к голосовым агентам кастомные API-инструменты. Разработчик может загрузить готовую JSON-схему своих внутренних программных продуктов, CRM-систем или связать телефонию с популярными автоматизаторами Zapier и N8N. Это позволяет роботу не просто консультировать, но и реально вносить записи о бронировании в рабочий календарь заведения в прямом эфире.

🧠 Сценарий 4: Двусторонняя интеграция и инструмент «Ask Hermes» 26:38

Наиболее технологически сложным и впечатляющим сценарием Дэвид Ондрей называет организацию обратной связи, когда не Hermes управляет Vapi, а голосовой ассистент во время живого разговора с клиентом обращается за помощью к родительскому агенту Hermes, развернутому на VPS. Такой подход превращает систему в персонального цифрового консьержа.

Если у голосового ассистента Vapi не хватает контекста или данных для ответа на специфический вопрос клиента, он активирует кастомный инструмент под названием ask_hermes. Запрос транслируется через безопасный сетевой туннель Ngrok, развернутый на стороне пользователя, и поступает к Hermes Agent, который оперирует более мощной и дорогой языковой моделью с полным доступом к файловой системе и базам данных. Более того, по словам автора, в критической ситуации Hermes может отправить владельцу бизнеса экстренное уведомление в Discord, Telegram или WhatsApp о том, что на линии находится перспективный клиент, требующий личного переключения на живого оператора.

В финальном тесте Дэвид Ондрей демонстрирует эту магию в действии, запуская интерактивный голосовой виджет:

  1. Автор активирует микрофон и запрашивает у голосового ассистента список доступных инструментов.
  2. Робот перечисляет функции: контроль браузера, редактирование файлов на VPS, веб-поиск, управление крон-задачами и делегирование под-агентам.
  3. Затем Дэвид дает устную команду: «Я хочу, чтобы ты спросил у Hermes, какова его внутренняя структура папок».
  4. Голосовой ассистент берет паузу в несколько секунд для обращения через Ngrok-туннель к серверу и безошибочно зачитывает ответ: «На верхнем уровне VPS находятся директории Hermes и Waffruit, а также адаптеры vap_adapter и optvappy_adapter».

Подводя итог, Дэвид Ондрей призывает предпринимателей и разработчиков не откладывать освоение голосовых ИИ-технологий, подчеркивая, что даже если на понимание всех нюансов уйдет несколько недель, эти навыки станут фундаментальным конкурентным преимуществом в ближайшем будущем.

💬 Цитаты

«Vapi делает телефонные звонки конфигурируемыми, в то время как Hermes делает их автономными.»

Дэвид Ондрей 03:38

«Мир действительно делится на людей, которые принимают ИИ, и людей, которые его ненавидят.»

Дэвид Ондрей 19:04
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
MCP (Model Context Protocol)
Открытый протокол, позволяющий языковым моделям безопасно подключаться к внешним инструментам и источникам данных.
Крон-задача (Cron job)
Планировщик задач в операционной системе, используемый для автоматического запуска скриптов в заданное время.
Ngrok
Инструмент, создающий безопасный публичный туннель к локальному серверу на компьютере разработчика.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Hermes Agent Vapi Open Router MCP-сервер