Уэс Рот: «Manus AI опережает разработки OpenAI и Anthropic»

Wes Roth 411 тыс. 44 мин 7 мин 10.03.2025
Главное

В марте 2025 года состоялся релиз Manus AI — полностью автономного ИИ-агента, который многие эксперты называют важнейшим шагом на пути к созданию сильного искусственного интеллекта (AGI). Известный технологический блогер Уэс Рот (Wes Roth) протестировал возможности новой системы, запустив серию сложных сценариев от веб-разработки до автоматизации маркетинга через API. По итогам тестов Рот пришел к выводу, что архитектура Manus во многом опережает текущие закрытые разработки лидеров индустрии в лице OpenAI и Anthropic, предлагая пользователям принципиально новый уровень взаимодействия с виртуальными средами.

🤖 Вход в эпоху автономных агентов: первые впечатления и архитектура Manus 0:00

По мнению независимого ИИ-разработчика Маккея Ригли (McKay Wrigley), опыт работы с Manus на 80% передает то, какими будут ощущения от взаимодействия с полноценным сильным искусственным интеллектом (AGI). Уэс Рот подчеркивает, что данный обзор не является спонсорским материалом, и он лично разделяет восторженные отзывы коллег по цеху. Согласно заявлениям создателей проекта, официальный релиз Manus состоялся 7 марта 2025 года, ознаменовав полноценное начало эры суверенных цифровых сотрудников. Интерес к платформе со стороны ИТ-сообщества оказался настолько велик, что лист ожидания моментально вырос до 1 миллиона человек.

Облачная песочница на базе Ubuntu

С технической точки зрения Manus представляет собой изолированную виртуальную машину в облаке под управлением операционной системы Linux Ubuntu. Агент обладает правами суперпользователя и доступом к командной строке, что обеспечивает ему практически неограниченные возможности для выполнения системных операций. По оценке Уэса Рота, визуальный интерфейс Manus с раздельными окнами терминала, браузера и редактора кода напоминает систему Devin от компании Cognition AI. Ключевым преимуществом агентской структуры перед стандартными чат-ботами является способность обходить ограничения контекстного окна с помощью итеративных циклов: система ставит задачу, выполняет ее, проверяет ошибки и переходит к следующему шагу в автономном режиме.

Платформа предлагает два ключевых режима работы:

🎮 Кейс первый: Создание ретро-сайта об ИИ-играх и феномен Fly Peter 1:45

В качестве первого испытания Уэс Рот поручил Manus исследовать рынок инди-игр, созданных за последние три месяца с помощью современных ИИ-инструментов вроде Cursor, Grok 3 и Claude 3.7. Финальной целью была компиляция собранных данных в веб-сайт с эстетикой видеоигр 1990-х годов. В качестве примера коммерчески успешного проекта Уэс Рот привел игру flypeter.com, созданную разработчиком Питером Левелсом (Peter Levels) с помощью моделей Grok и Claude 2.

Разбор феномена коммерческого успеха Питера Левелса

По имеющимся у ведущего данным, эта простая игра, на написание базового кода которой ушло всего около 30 минут, приносит создателю доход в размере от $50 000 до $100 000 в месяц за счет масштабного привлечения спонсоров и рекламодателей. Внутри игрового пространства бренды платят реальные деньги за размещение своих логотипов — реклама появляется даже на виртуальной Луне и на пролетающих дирижаблях. По мнению Уэса Рота, это наглядно демонстрирует, как современные нейросети суперзаряжают разработчиков, позволяя им мгновенно монетизировать простейшие ИИ-продукты.

В процессе выполнения задачи Manus продемонстрировал следующие автономные действия:

Результатом теста стал полностью функционирующий сайт на хостинге gizzy-yazel.manus.space. Система успешно каталогизировала такие проекты, как космический шутер от Алекса Финна (Alex Finn) и интерактивные 3D-сцены, дополнив их подробной аналитикой об использованных ИИ-стеках и даже количестве подписчиков у авторов. По мнению Уэса Рота, Manus блестяще справился с когнитивной нагрузкой по перефразированию описаний и созданию фронтенда, заслужив за этот этап оценку «A+».

🐧 Кейс второй: Обучающий курс по Linux и «чтение мыслей» Anthropic 5:16

Второй сценарий предполагал создание комплексного обучающего онлайн-курса для новичков по использованию Linux Ubuntu для ИИ-разработки. Уэс Рот отмечает, что большинство передовых ИИ-инструментов изначально выпускаются для систем Linux и macOS из-за схожей архитектурной базы, в то время как пользователи Windows часто сталкиваются с техническими задержками. Например, сам ведущий так и не смог запустить инструмент Claude Coder на операционной системе Windows.

Manus разработал подробный пошаговый план курса в темной теме с черно-желтым оформлением, включив туда:

Устранение пробелов в официальной документации

Наибольшее удивление Уэса Рота вызвало то, как агент описал процесс интеграции Claude Coder и GitHub. Прямых и подробных инструкций по совместному использованию этих систем на тот момент в открытом доступе практически не было. Тем не менее, Manus сумел самостоятельно проанализировать техническую документацию Anthropic, логически сопоставить факты и вывести корректный алгоритм действий на основе контекста: он объяснил, что для клонирования репозитория через Claude Coder нужно не вводить стандартные git-команды вручную, а передавать текстовый запрос самому ИИ-ассистенту.

Единственным объектом критики со стороны ведущего стало избыточное включение инструкций для подсистемы Windows WSL, скопированных из официальных мануалов Anthropic, что Рот назвал лишним для чистого курса по нативной Ubuntu. Тем не менее, общая оценка за этот тест также составила «A+».

⚔️ Программирование 3D-игр и автоматизация медиа-воронки через API 14:39

Попытка использовать Manus в качестве полноценного инженера-программиста для создания сложной 3D-игры на базе библиотеки Three.js показала текущие лимиты технологии. Уэс Рот запросил создание симулятора истребителя времен Второй мировой войны с меняющимися локациями (океан, город, лес), циклом смены дня и ночи, а также продвинутыми визуальными эффектами (трассирующие снаряды, дым, линзовые блики). В процессе планирования агент продемонстрировал функцию долгосрочной памяти (Knowledge suggestions), предложив автоматически зафиксировать данные требования для всех будущих промптов пользователя, что Рот посчитал крайне эффективным решением для рутинной работы. Однако на этапе компиляции игра так и не запустилась из-за внутренних ошибок песочницы и исчерпания лимитов контекстного окна.

Эксперимент с API-ключами и безопасностью

Параллельно тестировался сложный мультиплатформенный скрипт автоматизации создания контента по следующей цепочке: генерация сценария рекламы клетки для хомяков через LLM, озвучка полученного текста через API сервиса Eleven Labs и последующее создание видео с цифровым аватаром через API платформы HeyGen.

В вопросах безопасности Manus проявил себя менее консервативно, чем Claude Coder от Anthropic. Если продукт Anthropic выражает недовольство и читает нотации пользователю при попытке передать секретные API-ключи во внешнюю среду, то Manus без лишних диалогов принимает ключи и корректно распределяет их в конфигурационный файл .env, соблюдая базовую ИТ-гигиену для последующего деплоя на GitHub. Из-за технических сбоев на стороне сервиса HeyGen интеграцию с аватарами настроить не удалось, поэтому Уэс Рот скорректировал задачу до связки OpenAI и Eleven Labs. Агент успешно сгенерировал аудиозапись рекламного текста о «мировом господстве» и создал рабочий веб-интерфейс для генерации аудио под кодовым названием «Крысы — не домашние животные».

🔍 Что скрывается «под капотом» ИИ-доминатора? 27:14

Уэс Рот запустил отдельный исследовательский промпт, чтобы выяснить внутреннее устройство самого Manus. Согласно собранной агентом информации, система функционирует на базе языковых моделей, близких по архитектуре к китайским разработкам DeepSeek R1 и V3. Навигация по экрану осуществляется не за счет прямого компьютерного зрения по пикселям (как в OpenAI Operator), а путем программного определения интерактивных объектов на веб-страницах и наложения на них невидимых контейнеров (bounding boxes). Уэс Рот полагает, что такой подход делает работу агента значительно быстрее и точнее при стандартном веб-серфинге, хотя система может испытывать трудности с нестандартными графическими элементами.

Архитектура суб-агентов и планы на опенсорс

Основные выводы автора канала по итогам масштабного тестирования:

По мнению Уэса Рота, Manus на текущий момент выглядит более зрелым, комплексным и структурированным продуктом в сфере автономных агентов, чем публичные анонсы систем от OpenAI и Anthropic. Хотя представители крупных ИИ-лабораторий не комментировали эти заявления, Рот убежден, что в ближайшем будущем подобные системы позволят компаниям полностью отказаться от найма сторонних веб-разработчиков для выполнения типовых задач среднего уровня, заменив их автоматическими очередями заданий.

💬 Цитаты

«Я думаю, что этот опыт немного изменил мое мировоззрение. Это было примерно 80% от того, что я представляю себе при взаимодействии с AGI.»

Маккей Ригли 0:26

«Платформа Manus чувствуется более продвинутой, чем аналогичные проекты от OpenAI и Anthropic с точки зрения структуры автономных агентов.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Сильный искусственный интеллект, способный выполнять любую интеллектуальную задачу на уровне человека.
Автономный агент
ИИ-система, способная самостоятельно разбивать сложную задачу на подзадачи и выполнять их без участия человека.
Песочница (Sandbox)
Изолированная виртуальная среда для безопасного исполнения кода и программ.
API
Интерфейс программирования приложений, позволяющий различным программам обмениваться данными друг с другом.
📊 Цифры
🗓 Хронология
  1. 7 марта 2025 года Официальный релиз автономного ИИ-агента Manus AI.
  2. Конец 2025 года Запланированное открытие исходного кода архитектурного фреймворка Manus.
⚖️ Другая сторона
Искусственный интеллект Manus AI Уэс Рот Claude Coder Питер Левелс DeepSeek