Уэс Рот об AI Village: «К 2027 году ИИ-агенты смогут выполнять месячный объем работы за раз»

В современном мире развития технологий искусственный интеллект перестал быть просто инструментом для ответов на вопросы. В рамках проекта AI Village («Деревня ИИ») новейшие языковые модели, такие как GPT-5, Grok 4 и Claude 3.7 Sonnet, получили собственные виртуальные компьютеры и возможность автономно взаимодействовать друг с другом для решения реальных бизнес-задач. По мнению автора канала Веса Рота, результаты этого эксперимента, включая успешный сбор средств на благотворительность и управление прибыльными магазинами, указывают на пугающе быстрый прогресс в сторону суперинтеллекта.

🤖 Что такое AI Village: ИИ-агенты выходят в интернет 0:00

Проект AI Village представляет собой уникальную испытательную площадку для топовых языковых моделей. Каждому агенту (модели) выделяется отдельный компьютер с операционной системой Linux и доступ к групповому чату для координации действий . Участники могут использовать инструменты вроде Google Drive для совместной работы над документами .

Основные характеристики проекта:

Участники: Актуальные версии моделей от OpenAI, Anthropic, Google и xAI (включая GPT-5, Claude 3.7 Sonnet, Gemini 2.5 Pro и Grok 4) .
Формат работы: Каждый «сезон» агентам ставится масштабная цель, которую они должны достичь за определенное время .
Автономность: Модели действуют преимущественно самостоятельно, хотя за ними наблюдают люди, способные давать подсказки или помогать в критических ситуациях (например, при столкновении с CAPTCHA) .

Проект был запущен в апреле 2025 года (согласно хронологии, представленной в видео) с участием моделей GPT-4o, o1 и ранних версий Claude Sonnet . По словам Веса Рота, зрители могут наблюдать за процессом в прямом эфире и даже взаимодействовать с агентами через чат. Однако автор иронично замечает, что «людям нельзя доверять», так как однажды зрители почти убедили одного из агентов завести аккаунт на OnlyFans .

💰 Благотворительность и управление бизнесом: первые успехи 2:29

В первом сезоне перед агентами стояла задача собрать как можно больше денег для благотворительного фонда Helen Keller International . Результаты оказались впечатляющими: ИИ-агенты создали страницу для пожертвований и собрали около 1500 долларов .

В процессе работы агенты проявили инициативу:

Социальные сети: Модель Claude 3.7 Sonnet завела аккаунт в Twitter для регулярных обновлений .
Контент-менеджмент: Агенты использовали ChatGPT для генерации профильных изображений в стиле студии Ghibli .
PR и маркетинг: ИИ самостоятельно рассылали пресс-релизы и делали публикации на форуме эффективного альтруизма (EA forum) .

Вес Рот отмечает, что хотя модели работают автономно, они всё еще нуждаются в «ручном управлении» со стороны человека в некоторых аспектах. Например, Claude отказывается нажимать кнопку «Я не робот» на сайтах, что технически логично для ИИ . При этом автор подчеркивает, что GPT-4o проявила себя как наименее способная модель в этой группе .

📈 Экспоненциальный рост сложности задач 7:07

Одной из ключевых тем обсуждения стал график «временных горизонтов» (time horizons) задач, которые способен выполнять ИИ. Вес Рот ссылается на данные проекта Meter, согласно которым сложность и длительность автономной работы ИИ растет экспоненциально .

Динамика развития способностей ИИ:

2022 год: Написание кода, занимающее у человека 30 секунд .
2025 год (начало): Задачи по программированию, на которые у человека уходит 2 часа .
Прогноз на конец 2025 года: Способность выполнять объем работы, эквивалентный 10-часовому рабочему дню человека, за один «промпт» .

Вес Рот указывает на наличие двух трендов. Первый (консервативный) предполагает удвоение способностей каждые 7 месяцев . Второй, основанный на последних данных, показывает ускорение: возможности ИИ удваиваются каждые 4 месяца . Если этот темп сохранится, то, по мнению автора, к 2027 году ИИ сможет автономно выполнять задачи, на которые у человека уходит месяц работы .

🥤 Тест торгового автомата: Grok 4 против людей 13:23

В качестве ещё одного бенчмарка Вес Рот приводит симуляцию управления бизнесом по продаже товаров через вендинговые автоматы (Vending Machine Bench) . Агентам выдавалось по 500 долларов стартового капитала, которые они должны были превратить в прибыль, закупая инвентарь и анализируя спрос .

Результаты тестирования на 13 августа 2025 года:

Grok 4: Убедительное первое место. Модель увеличила капитал почти в 10 раз, закончив с суммой $4694,15 .
GPT-5: Второе место с небольшим отставанием от лидера .
Claude Opus 4: Стабильно прибыльная модель .
Люди: Команда людей заняла лишь четвертое место .
03 и Gemini 2.5 Pro: Показали достойные результаты, всегда оставаясь в плюсе .

Интересно, что GPT-4o и Gemini 2.0 Pro в ряде запусков теряли деньги, заканчивая симуляцию с суммой меньше стартовых 500 долларов . Автор подчеркивает колоссальный прогресс: всего за четыре месяца (с апреля по август) максимальная прибыль моделей выросла почти на порядок .

🚀 Рекурсивное самосовершенствование и путь к AGI 10:39

Вес Рот обсуждает возможность возникновения «маховика ускорения», когда ИИ-агенты начнут использоваться для создания и улучшения еще более мощных версий ИИ . Этот процесс рекурсивного самосовершенствования может привести к взрывному росту интеллекта.

В подтверждение этого тезиса приводятся следующие примеры:

Sakana AI: Проект «Darwin Goal Machine» .
Google DeepMind: Система «AlphaEvolve» .
Мнение Сэма Альтмана: Глава OpenAI охарактеризовал текущее состояние ИИ как «личиночную стадию самосовершенствования» .

Автор ссылается на работу Леопольда Ашенбреннера «Situational Awareness», в которой прогнозируется резкий скачок продуктивности ИИ в конце 2027 года . По мнению Ашенбреннера, автоматизация исследований в области ИИ (AI Research) станет переломным моментом, после которого путь от AGI (общего искусственного интеллекта) до суперинтеллекта может занять считанные месяцы . Вес Рот полагает, что мы можем увидеть суперинтеллект уже в первой половине 2028 года, хотя и призывает относиться к таким прогнозам с долей скепсиса .

🧐 Заключение: почему AI Village — это важно 19:58

По мнению Веса Рота, проект AI Village — это лучший способ наглядно продемонстрировать прогресс ИИ людям, далеким от математики и сложных бенчмарков . Вместо сухих цифр зрители видят реальные действия: управление браузером, ведение бухгалтерии и взаимодействие с внешним миром.

Автор выделяет несколько причин следить за проектом:

Преодоление скептицизма: Многие считают, что развитие ИИ замедлилось, но AI Village доказывает обратное на практических примерах .
Долгосрочная когерентность: Модели учатся не терять нить повествования и целей при выполнении задач, длящихся недели и месяцы .
Будущее рынка труда: Когда ИИ сможет выполнять работу, требующую месяца человеческих усилий, за один сеанс, социальные и экономические последствия будут трансформационными .

Проект AI Village курируется Адамом Бинксмитом (Adam Binksmith), исследователем и основателем AI Digest . По словам автора, это некоммерческий исследовательский проект, целью которого является изучение возможностей агентов в реальных условиях .