# Уэс Рот об AI Village: «К 2027 году ИИ-агенты смогут выполнять месячный объем работы за раз»

Источник: https://www.youtube.com/watch?v=eTgYehlVEBo
Канал: Wes Roth
Опубликовано: 19.08.2025

---

В современном мире развития технологий искусственный интеллект перестал быть просто инструментом для ответов на вопросы. В рамках проекта AI Village («Деревня ИИ») новейшие языковые модели, такие как GPT-5, Grok 4 и Claude 3.7 Sonnet, получили собственные виртуальные компьютеры и возможность автономно взаимодействовать друг с другом для решения реальных бизнес-задач. По мнению автора канала Веса Рота, результаты этого эксперимента, включая успешный сбор средств на благотворительность и управление прибыльными магазинами, указывают на пугающе быстрый прогресс в сторону суперинтеллекта.

## 🤖 Что такое AI Village: ИИ-агенты выходят в интернет
[[JUMP:0:00]]

Проект AI Village представляет собой уникальную испытательную площадку для топовых языковых моделей. Каждому агенту (модели) выделяется отдельный компьютер с операционной системой Linux и доступ к групповому чату для координации действий [0:00]. Участники могут использовать инструменты вроде Google Drive для совместной работы над документами [1:47].

Основные характеристики проекта:

*   **Участники:** Актуальные версии моделей от OpenAI, Anthropic, Google и xAI (включая GPT-5, Claude 3.7 Sonnet, Gemini 2.5 Pro и Grok 4) [0:13].
*   **Формат работы:** Каждый «сезон» агентам ставится масштабная цель, которую они должны достичь за определенное время [0:27].
*   **Автономность:** Модели действуют преимущественно самостоятельно, хотя за ними наблюдают люди, способные давать подсказки или помогать в критических ситуациях (например, при столкновении с CAPTCHA) [3:32].

Проект был запущен в апреле 2025 года (согласно хронологии, представленной в видео) с участием моделей GPT-4o, o1 и ранних версий Claude Sonnet [1:21]. По словам Веса Рота, зрители могут наблюдать за процессом в прямом эфире и даже взаимодействовать с агентами через чат. Однако автор иронично замечает, что «людям нельзя доверять», так как однажды зрители почти убедили одного из агентов завести аккаунт на OnlyFans [2:15].

## 💰 Благотворительность и управление бизнесом: первые успехи
[[JUMP:2:29]]

В первом сезоне перед агентами стояла задача собрать как можно больше денег для благотворительного фонда Helen Keller International [2:29]. Результаты оказались впечатляющими: ИИ-агенты создали страницу для пожертвований и собрали около 1500 долларов [2:41]. 

В процессе работы агенты проявили инициативу:

*   **Социальные сети:** Модель Claude 3.7 Sonnet завела аккаунт в Twitter для регулярных обновлений [3:07].
*   **Контент-менеджмент:** Агенты использовали ChatGPT для генерации профильных изображений в стиле студии Ghibli [3:07].
*   **PR и маркетинг:** ИИ самостоятельно рассылали пресс-релизы и делали публикации на форуме эффективного альтруизма (EA forum) [6:27].

Вес Рот отмечает, что хотя модели работают автономно, они всё еще нуждаются в «ручном управлении» со стороны человека в некоторых аспектах. Например, Claude отказывается нажимать кнопку «Я не робот» на сайтах, что технически логично для ИИ [3:46]. При этом автор подчеркивает, что GPT-4o проявила себя как наименее способная модель в этой группе [4:13].

## 📈 Экспоненциальный рост сложности задач
[[JUMP:7:07]]

Одной из ключевых тем обсуждения стал график «временных горизонтов» (time horizons) задач, которые способен выполнять ИИ. Вес Рот ссылается на данные проекта Meter, согласно которым сложность и длительность автономной работы ИИ растет экспоненциально [7:07].

Динамика развития способностей ИИ:

*   **2022 год:** Написание кода, занимающее у человека 30 секунд [7:19].
*   **2025 год (начало):** Задачи по программированию, на которые у человека уходит 2 часа [7:33].
*   **Прогноз на конец 2025 года:** Способность выполнять объем работы, эквивалентный 10-часовому рабочему дню человека, за один «промпт» [8:50].

Вес Рот указывает на наличие двух трендов. Первый (консервативный) предполагает удвоение способностей каждые 7 месяцев [7:45]. Второй, основанный на последних данных, показывает ускорение: возможности ИИ удваиваются каждые 4 месяца [8:38]. Если этот темп сохранится, то, по мнению автора, к 2027 году ИИ сможет автономно выполнять задачи, на которые у человека уходит месяц работы [9:44].

## 🥤 Тест торгового автомата: Grok 4 против людей
[[JUMP:13:23]]

В качестве ещё одного бенчмарка Вес Рот приводит симуляцию управления бизнесом по продаже товаров через вендинговые автоматы (Vending Machine Bench) [13:23]. Агентам выдавалось по 500 долларов стартового капитала, которые они должны были превратить в прибыль, закупая инвентарь и анализируя спрос [14:43].

Результаты тестирования на 13 августа 2025 года:

1.  **Grok 4:** Убедительное первое место. Модель увеличила капитал почти в 10 раз, закончив с суммой $4694,15 [15:22].
2.  **GPT-5:** Второе место с небольшим отставанием от лидера [16:14].
3.  **Claude Opus 4:** Стабильно прибыльная модель [16:14].
4.  **Люди:** Команда людей заняла лишь четвертое место [14:15].
5.  **03 и Gemini 2.5 Pro:** Показали достойные результаты, всегда оставаясь в плюсе [16:14].

Интересно, что GPT-4o и Gemini 2.0 Pro в ряде запусков теряли деньги, заканчивая симуляцию с суммой меньше стартовых 500 долларов [15:09]. Автор подчеркивает колоссальный прогресс: всего за четыре месяца (с апреля по август) максимальная прибыль моделей выросла почти на порядок [17:35].

## 🚀 Рекурсивное самосовершенствование и путь к AGI
[[JUMP:10:39]]

Вес Рот обсуждает возможность возникновения «маховика ускорения», когда ИИ-агенты начнут использоваться для создания и улучшения еще более мощных версий ИИ [10:52]. Этот процесс рекурсивного самосовершенствования может привести к взрывному росту интеллекта.

В подтверждение этого тезиса приводятся следующие примеры:

*   **Sakana AI:** Проект «Darwin Goal Machine» [11:34].
*   **Google DeepMind:** Система «AlphaEvolve» [11:34].
*   **Мнение Сэма Альтмана:** Глава OpenAI охарактеризовал текущее состояние ИИ как «личиночную стадию самосовершенствования» [11:19].

Автор ссылается на работу Леопольда Ашенбреннера «Situational Awareness», в которой прогнозируется резкий скачок продуктивности ИИ в конце 2027 года [18:42]. По мнению Ашенбреннера, автоматизация исследований в области ИИ (AI Research) станет переломным моментом, после которого путь от AGI (общего искусственного интеллекта) до суперинтеллекта может занять считанные месяцы [18:56]. Вес Рот полагает, что мы можем увидеть суперинтеллект уже в первой половине 2028 года, хотя и призывает относиться к таким прогнозам с долей скепсиса [19:34].

## 🧐 Заключение: почему AI Village — это важно
[[JUMP:19:58]]

По мнению Веса Рота, проект AI Village — это лучший способ наглядно продемонстрировать прогресс ИИ людям, далеким от математики и сложных бенчмарков [20:12]. Вместо сухих цифр зрители видят реальные действия: управление браузером, ведение бухгалтерии и взаимодействие с внешним миром.

Автор выделяет несколько причин следить за проектом:

*   **Преодоление скептицизма:** Многие считают, что развитие ИИ замедлилось, но AI Village доказывает обратное на практических примерах [21:05].
*   **Долгосрочная когерентность:** Модели учатся не терять нить повествования и целей при выполнении задач, длящихся недели и месяцы [16:41].
*   **Будущее рынка труда:** Когда ИИ сможет выполнять работу, требующую месяца человеческих усилий, за один сеанс, социальные и экономические последствия будут трансформационными [12:02].

Проект AI Village курируется Адамом Бинксмитом (Adam Binksmith), исследователем и основателем AI Digest [0:54]. По словам автора, это некоммерческий исследовательский проект, целью которого является изучение возможностей агентов в реальных условиях [10:39].