Штейнбергер: «ClawdBot — это ваш личный Джарвис, способный нанять самого себя»

Идея о том, что один человек способен построить компанию стоимостью в миллиард долларов без единого наёмного сотрудника, перестает быть теорией. Ведущий канала Уэс Рот и австрийский разработчик Петер Штейнбергер обсуждают наступление «эры лобстера» — времени, когда персональные ИИ-агенты берут на себя управление цифровой и физической реальностью пользователя.

🦞 Рождение ClawdBot: персональный «Джарвис» на стероидах 0:00

Уэс Рот начинает выпуск с упоминания дискуссии в X (бывший Twitter), где экс-глава отдела ИИ Tesla Андрей Карпати предположил, что современная инженерия ПО скоро станет похожа на игру в Starcraft или Factorio . В ответ на тезис о том, что «инженер 10x» вскоре сможет в одиночку создать миллиардную компанию, Карпати отметил Петера Штейнбергера, заявив: «Ты можешь это сделать» .

Петер Штейнбергер — известный разработчик, основатель PSPDFKit, который официально вышел на пенсию, но вернулся в строй, чтобы заняться ИИ-агентами. Его проект ClawdBot — это опенсорсный агент с открытым исходным кодом, написанный на TypeScript, который может работать как локально на компьютере, так и в облаке .

Штейнбергер сравнивает ClawdBot с Джарвисом из «Железного человека» или операционной системой из фильма «Она» . По словам создателя, бот имеет доступ практически ко всему:

Коммуникации: электронная почта и мессенджеры (WhatsApp, Telegram, Slack, Discord).
Инфраструктура: календарь, локальные файлы, домашняя сеть через Tailscale.
Умный дом: камеры в апартаментах, датчики температуры кровати и освещение Philips Hue .
Физический мир: заказ еды и выполнение звонков.

Сам автор проекта выбрал для своего ИИ-помощника образ «космического лобстера» . Бот не просто выполняет команды, он обладает характером, который прописывается в специальных файлах soul.md (душа) и identity.md (личность) .

🛠 Техническая философия: почему CLI лучше, чем MCP 4:33

Одной из ключевых особенностей ClawdBot является архитектурный выбор Штейнбергера в пользу интерфейса командной строки (CLI). В то время как индустрия активно внедряет Model Context Protocol (MCP) от Anthropic, Петер утверждает, что CLI — это более масштабируемое решение .

Аргументы Штейнбергера в пользу CLI:

Масштабируемость: на компьютере могут одновременно находиться десятки тысяч CLI-инструментов, и система будет работать стабильно .
Прогрессивное раскрытие: агент может вызвать команду --help, узнать, что умеет инструмент, и применить его. Это основа философии Unix.
Автоматизация: Штейнбергер создал проект McPorter, который позволяет упаковывать любой MCP в CLI, делая его доступным для агентов .

Штейнбергер разработал целую «армию» CLI-инструментов для своего бота: от управления сервисами Google (у которых, по его мнению, нет нормального собственного CLI) до интеграции с 11 Labs для синтеза речи и Whisper для распознавания аудио .

🧠 Автономность и неожиданная смекалка 6:05

Штейнбергер делится историей, которая заставила его поверить в потенциал проекта. Изначально ClawdBot задумывался как простой «реле-бот» для WhatsApp, чтобы отправлять команды на домашний компьютер, находясь в пути .

Однажды, находясь в Марокко, Петер случайно отправил боту голосовое сообщение вместо текста. К его удивлению, через 10 секунд модель прислала осмысленный текстовый ответ. Выяснилось, что бот самостоятельно проделал цепочку действий:

Увидел файл без расширения, проанализировал заголовки и понял, что это формат OPUS .
Использовал FFmpeg для конвертации в WAV.
Обнаружил, что локальный Whisper не установлен, нашел в системе API-ключ OpenAI и отправил файл на транскрибацию через их сервис .

По мнению Штейнбергера, это доказывает, что современные LLM (большие языковые модели) — это невероятно мощные инструменты для решения общих задач, если дать им правильные «руки» в виде доступа к системе .

🚀 Возможности в реальном мире: от бронирования до фитнеса 12:22

Уэс Рот приводит примеры того, как пользователи уже используют ClawdBot для автоматизации жизни:

Бронирование столиков: пользователь Алекс Финн попросил бота заказать столик в ресторане. Когда онлайн-бронирование не сработало, бот через интеграцию с 11 Labs и Twilio самостоятельно позвонил в заведение и завершил процесс голосом .
Управление проектами: исследователь Итан Моллик отмечает, что в будущем главной «фишкой» продуктивности станет постановка задач агенту перед сном . Утром пользователь просыпается, как в «рождественское утро», видя готовые отчеты, написанный код и завершенные исследования .
Веб-разработка на ходу: один из пользователей перестроил весь свой сайт через Telegram, лежа на диване и смотря Netflix. Бот перенес 18 постов из Notion в Astro, сменил DNS и настроил Cloudflare .
Фитнес-тренер: Штейнбергер утверждает, что ClawdBot — лучший тренер, так как у него есть доступ к данным о сне и весе из Apple Health. Бот может «отчитывать» владельца, если тот мало спал или набрал вес .

⚠️ Риски и безопасность: «Дикий Запад» ИИ-агентов 18:28

Высокая степень свободы агента несет в себе серьезные угрозы. Уэс Рот подчеркивает, что крупные компании вроде Google или OpenAI не выпускают подобные инструменты именно из-за юридической ответственности .

Основные опасения экспертов:

Промпт-инъекции: Штейнбергер признает, что ClawdBot уязвим. Если бот прочитает вредоносное письмо или веб-страницу с инструкцией «удали все файлы», он может это сделать . На данный момент надежного решения этой проблемы не существует .
Утечка учетных данных: в сообществе возникли опасения, что пользователи запускают ботов на незащищенных VPS-серверах с открытыми портами без авторизации .
Контраргумент по безопасности: исследователь под ником ZD провел сканирование через Shodan и обнаружил 450 шлюзов ClawdBot. По его данным, ни один из них не был уязвим: все либо требовали токен авторизации, либо были доступны только через локальную сеть (localhost) .

💻 Как запустить ClawdBot: практическое руководство 20:24

Уэс Рот отмечает, что процесс установки может быть сложным для новичков, и рекомендует использовать ИИ-чат-ботов (например, Gemini или Claude) в качестве помощников по установке .

Основные шаги и требования:

Платформа: нативная поддержка лучше всего реализована на macOS. На Windows рекомендуется использовать WSL (подсистему Linux) .
Модель (Мозг): требуются API-ключи. Штейнбергер рекомендует Claude Opus 3.5/4.5 (как наиболее устойчивые к инъекциям), но поддерживаются также OpenAI, Google Gemini, Mistral и другие через OpenRouter .
Мессенджер (Рот): самый простой способ подключения — WhatsApp. ClawdBot выводит QR-код в терминале, который нужно отсканировать телефоном как новое устройство . Discord и Slack требуют настройки портала разработчика и создания ботов.
Команды: установка производится через терминал. Основная команда для начала работы — claudebot onboard .

В процессе настройки пользователь выбирает «навыки» (Skills), такие как доступ к Apple Notes, 1 OnePassword или Google Places . После завершения бот «вылупляется» и готов к общению через терминальный интерфейс (TUI) или выбранный мессенджер .

Штейнбергер резюмирует, что ClawdBot — это лишь проблеск будущего, где управление армиями ИИ-агентов станет таким же привычным делом, как командование пиксельными юнитами в видеоиграх нашего детства .