Ян, создатель Space Agent и основатель Agent Zero, представил новый тип ИИ-агентов, способных самостоятельно изменять пользовательский интерфейс в браузере. В отличие от традиционных систем, ограниченных текстовым выводом в мессенджерах, эта разработка напрямую манипулирует JavaScript-рантаймом на стороне клиента . По словам Яна, технология позволяет создавать рабочую среду с нуля под любую специфическую задачу пользователя без написания кода вручную.
🛠️ Архитектура саморазвивающегося интерфейса 0:38
Традиционные ИИ-агенты обычно работают на удаленных серверах (VPS) и взаимодействуют с пользователем через жестко заданные интерфейсы вроде WhatsApp или Telegram . Space Agent меняет эту парадигму, запускаясь непосредственно в браузере на стороне клиента .
Ключевые особенности архитектуры:
- Прямая мутация DOM: Агент может на лету изменять структуру HTML-страницы, на которой он отображается .
- Система виджетов: Вместо простых текстовых ответов агент генерирует функциональные компоненты: графики, таблицы, игровые интерфейсы или панели управления .
- Токен-эффективность: Система использует специальные токены для разделения текста ответа и исполняемого JavaScript-кода. Весь цикл проверки погоды с отрисовкой виджета занимает около 280 токенов .
Ян утверждает, что это первый агент, который не просто обновляет файлы разметки, а создает полноценный UI для отображения результатов своей работы пользователю .
🚀 Возможности Space Agent в реальном времени 7:02
В ходе демонстрации Ян показал, как агент создает сложные приложения за несколько минут. Создание полноценного менеджера заметок с поддержкой папок, Markdown и вложений заняло около 10 минут правок .
Примеры использования, созданные агентом:
- Дашборд систем наблюдения: Агент самостоятельно нашел публичные IP-камеры, отрисовал сетку вещания и настроил вывод видеопотока .
- Среда мониторинга агентов: В Space Agent можно интегрировать интерфейс Agent Zero через API, создав единый пульт управления несколькими ИИ-системами .
- Инструменты для трейдинга: Агент за один запрос сформировал график акций NVIDIA, Apple и Google, используя данные Yahoo Finance .
- Музыкальные приложения: Система создала степ-секвенсор с контрольной панелью звука и гитарным интерфейсом для джема за 20 минут .
По мнению Яна, в будущем операционные системы могут отказаться от фиксированных приложений. Вместо поиска нужной кнопки пользователь будет просить агента переписать экран под текущую потребность .
🧠 Эволюция промптов и автоматическая оптимизация 6:10
Ян не писал системный промпт для Space Agent вручную. Он создал начальный набросок и запустил автоматический процесс исследования в Codeex .
Процесс включал следующие этапы:
- Генерация трех вариантов промпта: консервативного, среднего и радикального.
- Автоматическое тестирование на наборах сценариев.
- Ручное добавление кейсов, где агент допускал ошибки.
- Итеративное повторение цикла (текущая версия промпта — №250) .
Целью такой оптимизации была максимальная надежность при минимальном потреблении токенов. Для работы с контекстом используется «транзитное пространство» (transient space) — код виджетов помещается в самый конец промпта после точек кэширования, чтобы при обновлении интерфейса не инвалидировать кэш всей истории диалога .
💻 Процесс разработки с помощью ИИ 33:24
Весь основной код Space Agent был написан с помощью инструментов ИИ (Codex) за 25 дней . Ян утверждает, что не написал ни одной строчки кода самостоятельно, выступая в роли архитектора и контролера.
Методология разработки (Documentation First):
- Hierarchy of .mmd files: Каждая часть системы документируется в Markdown-файлах, которые агент читает перед внесением правок .
- Контекстный контроль: Документация в папках модулей позволяет ИИ видеть принципы работы конкретного узла, не перегружая контекстное окно всей базой кода проекта .
- Скорость: По оценке автора, использование ИИ дало ускорение разработки в 12–20 раз по сравнению с ручным кодингом .
Ян считает, что навык программирования останется критически важным, чтобы вовремя замечать неэффективные решения ИИ и направлять его .
🛡️ Безопасность и локальная работа 28:20
Space Agent поддерживает три режима работы: гостевой аккаунт на сайте, самостоятельный хостинг на VPS или нативное приложение на Electron .
По словам собеседников, ключевым преимуществом нативного приложения является полная конфиденциальность. Данные пользователя и файлы не покидают компьютер, а backend-слой на Node.js работает локально . Также система позволяет запускать модели прямо в браузере (через формат ONNX с Hugging Face), что требует мощного GPU, но обеспечивает полную автономность .
Для исправления критических сбоев предусмотрен режим «Админ» (Admin Mode). Он открывается в виде фиксированного сплит-интерфейса, который невозможно сломать изменениями в JavaScript. Из этого режима пользователь может заставить агента починить «самого себя» или откатить изменения через встроенную систему Git-путешествий во времени .