Уэс Рот: «Manus AI опережает разработки OpenAI и Anthropic»

В марте 2025 года состоялся релиз Manus AI — полностью автономного ИИ-агента, который многие эксперты называют важнейшим шагом на пути к созданию сильного искусственного интеллекта (AGI). Известный технологический блогер Уэс Рот (Wes Roth) протестировал возможности новой системы, запустив серию сложных сценариев от веб-разработки до автоматизации маркетинга через API. По итогам тестов Рот пришел к выводу, что архитектура Manus во многом опережает текущие закрытые разработки лидеров индустрии в лице OpenAI и Anthropic, предлагая пользователям принципиально новый уровень взаимодействия с виртуальными средами.

🤖 Вход в эпоху автономных агентов: первые впечатления и архитектура Manus 0:00

По мнению независимого ИИ-разработчика Маккея Ригли (McKay Wrigley), опыт работы с Manus на 80% передает то, какими будут ощущения от взаимодействия с полноценным сильным искусственным интеллектом (AGI). Уэс Рот подчеркивает, что данный обзор не является спонсорским материалом, и он лично разделяет восторженные отзывы коллег по цеху. Согласно заявлениям создателей проекта, официальный релиз Manus состоялся 7 марта 2025 года, ознаменовав полноценное начало эры суверенных цифровых сотрудников. Интерес к платформе со стороны ИТ-сообщества оказался настолько велик, что лист ожидания моментально вырос до 1 миллиона человек.

Облачная песочница на базе Ubuntu

С технической точки зрения Manus представляет собой изолированную виртуальную машину в облаке под управлением операционной системы Linux Ubuntu. Агент обладает правами суперпользователя и доступом к командной строке, что обеспечивает ему практически неограниченные возможности для выполнения системных операций. По оценке Уэса Рота, визуальный интерфейс Manus с раздельными окнами терминала, браузера и редактора кода напоминает систему Devin от компании Cognition AI. Ключевым преимуществом агентской структуры перед стандартными чат-ботами является способность обходить ограничения контекстного окна с помощью итеративных циклов: система ставит задачу, выполняет ее, проверяет ошибки и переходит к следующему шагу в автономном режиме.

Платформа предлагает два ключевых режима работы:

Стандартный режим (Standard mode): базовый вариант, в котором выполнялось большинство поисковых и инженерных тестов в рамках обзора.
Режим повышенных усилий (High effort mode): задействует расширенную цепочку рассуждений (Chain of Thought) для детального разбора комплексных задач. Из-за высокой вычислительной нагрузки в экспериментальный период этот режим ограничен одним использованием в день.

🎮 Кейс первый: Создание ретро-сайта об ИИ-играх и феномен Fly Peter 1:45

В качестве первого испытания Уэс Рот поручил Manus исследовать рынок инди-игр, созданных за последние три месяца с помощью современных ИИ-инструментов вроде Cursor, Grok 3 и Claude 3.7. Финальной целью была компиляция собранных данных в веб-сайт с эстетикой видеоигр 1990-х годов. В качестве примера коммерчески успешного проекта Уэс Рот привел игру flypeter.com, созданную разработчиком Питером Левелсом (Peter Levels) с помощью моделей Grok и Claude 2.

Разбор феномена коммерческого успеха Питера Левелса

По имеющимся у ведущего данным, эта простая игра, на написание базового кода которой ушло всего около 30 минут, приносит создателю доход в размере от $50 000 до $100 000 в месяц за счет масштабного привлечения спонсоров и рекламодателей. Внутри игрового пространства бренды платят реальные деньги за размещение своих логотипов — реклама появляется даже на виртуальной Луне и на пролетающих дирижаблях. По мнению Уэса Рота, это наглядно демонстрирует, как современные нейросети суперзаряжают разработчиков, позволяя им мгновенно монетизировать простейшие ИИ-продукты.

В процессе выполнения задачи Manus продемонстрировал следующие автономные действия:

Создал рабочий файл to-do.md в среде Linux для автоматического структурирования подзадач.
Осуществил глубокий поиск информации на YouTube, анализируя текстовые транскрипты роликов, обходя защитные барьеры веб-ресурсов.
Инициализировал локальный Git-репозиторий и развернул среду разработки на базе Cloudflare Workers.

Результатом теста стал полностью функционирующий сайт на хостинге gizzy-yazel.manus.space. Система успешно каталогизировала такие проекты, как космический шутер от Алекса Финна (Alex Finn) и интерактивные 3D-сцены, дополнив их подробной аналитикой об использованных ИИ-стеках и даже количестве подписчиков у авторов. По мнению Уэса Рота, Manus блестяще справился с когнитивной нагрузкой по перефразированию описаний и созданию фронтенда, заслужив за этот этап оценку «A+».

🐧 Кейс второй: Обучающий курс по Linux и «чтение мыслей» Anthropic 5:16

Второй сценарий предполагал создание комплексного обучающего онлайн-курса для новичков по использованию Linux Ubuntu для ИИ-разработки. Уэс Рот отмечает, что большинство передовых ИИ-инструментов изначально выпускаются для систем Linux и macOS из-за схожей архитектурной базы, в то время как пользователи Windows часто сталкиваются с техническими задержками. Например, сам ведущий так и не смог запустить инструмент Claude Coder на операционной системе Windows.

Manus разработал подробный пошаговый план курса в темной теме с черно-желтым оформлением, включив туда:

Подробные инструкции по созданию загрузочной флешки с помощью утилиты Rufus.
Базовые команды для навигации в терминале Ubuntu и стандартные горячие клавиши.
Методологию настройки изолированного виртуального окружения Python для управления зависимостями.

Устранение пробелов в официальной документации

Наибольшее удивление Уэса Рота вызвало то, как агент описал процесс интеграции Claude Coder и GitHub. Прямых и подробных инструкций по совместному использованию этих систем на тот момент в открытом доступе практически не было. Тем не менее, Manus сумел самостоятельно проанализировать техническую документацию Anthropic, логически сопоставить факты и вывести корректный алгоритм действий на основе контекста: он объяснил, что для клонирования репозитория через Claude Coder нужно не вводить стандартные git-команды вручную, а передавать текстовый запрос самому ИИ-ассистенту.

Единственным объектом критики со стороны ведущего стало избыточное включение инструкций для подсистемы Windows WSL, скопированных из официальных мануалов Anthropic, что Рот назвал лишним для чистого курса по нативной Ubuntu. Тем не менее, общая оценка за этот тест также составила «A+».

⚔️ Программирование 3D-игр и автоматизация медиа-воронки через API 14:39

Попытка использовать Manus в качестве полноценного инженера-программиста для создания сложной 3D-игры на базе библиотеки Three.js показала текущие лимиты технологии. Уэс Рот запросил создание симулятора истребителя времен Второй мировой войны с меняющимися локациями (океан, город, лес), циклом смены дня и ночи, а также продвинутыми визуальными эффектами (трассирующие снаряды, дым, линзовые блики). В процессе планирования агент продемонстрировал функцию долгосрочной памяти (Knowledge suggestions), предложив автоматически зафиксировать данные требования для всех будущих промптов пользователя, что Рот посчитал крайне эффективным решением для рутинной работы. Однако на этапе компиляции игра так и не запустилась из-за внутренних ошибок песочницы и исчерпания лимитов контекстного окна.

Эксперимент с API-ключами и безопасностью

Параллельно тестировался сложный мультиплатформенный скрипт автоматизации создания контента по следующей цепочке: генерация сценария рекламы клетки для хомяков через LLM, озвучка полученного текста через API сервиса Eleven Labs и последующее создание видео с цифровым аватаром через API платформы HeyGen.

В вопросах безопасности Manus проявил себя менее консервативно, чем Claude Coder от Anthropic. Если продукт Anthropic выражает недовольство и читает нотации пользователю при попытке передать секретные API-ключи во внешнюю среду, то Manus без лишних диалогов принимает ключи и корректно распределяет их в конфигурационный файл .env, соблюдая базовую ИТ-гигиену для последующего деплоя на GitHub. Из-за технических сбоев на стороне сервиса HeyGen интеграцию с аватарами настроить не удалось, поэтому Уэс Рот скорректировал задачу до связки OpenAI и Eleven Labs. Агент успешно сгенерировал аудиозапись рекламного текста о «мировом господстве» и создал рабочий веб-интерфейс для генерации аудио под кодовым названием «Крысы — не домашние животные».

🔍 Что скрывается «под капотом» ИИ-доминатора? 27:14

Уэс Рот запустил отдельный исследовательский промпт, чтобы выяснить внутреннее устройство самого Manus. Согласно собранной агентом информации, система функционирует на базе языковых моделей, близких по архитектуре к китайским разработкам DeepSeek R1 и V3. Навигация по экрану осуществляется не за счет прямого компьютерного зрения по пикселям (как в OpenAI Operator), а путем программного определения интерактивных объектов на веб-страницах и наложения на них невидимых контейнеров (bounding boxes). Уэс Рот полагает, что такой подход делает работу агента значительно быстрее и точнее при стандартном веб-серфинге, хотя система может испытывать трудности с нестандартными графическими элементами.

Архитектура суб-агентов и планы на опенсорс

Основные выводы автора канала по итогам масштабного тестирования:

Manus работает на базе мультиагентной архитектуры, где специализированные независимые суб-агенты контролируются единой исполнительной системой верхнего уровня.
Разработчики планируют открыть исходный код управляющего фреймворка (scaffolding) до конца 2025 года, что позволит пользователям подключать к этой структуре любые флагманские модели вроде Claude 3.7 Sonnet или Grok 3.

По мнению Уэса Рота, Manus на текущий момент выглядит более зрелым, комплексным и структурированным продуктом в сфере автономных агентов, чем публичные анонсы систем от OpenAI и Anthropic. Хотя представители крупных ИИ-лабораторий не комментировали эти заявления, Рот убежден, что в ближайшем будущем подобные системы позволят компаниям полностью отказаться от найма сторонних веб-разработчиков для выполнения типовых задач среднего уровня, заменив их автоматическими очередями заданий.