В современном мире развития технологий искусственный интеллект перестал быть просто инструментом для ответов на вопросы. В рамках проекта AI Village («Деревня ИИ») новейшие языковые модели, такие как GPT-5, Grok 4 и Claude 3.7 Sonnet, получили собственные виртуальные компьютеры и возможность автономно взаимодействовать друг с другом для решения реальных бизнес-задач. По мнению автора канала Веса Рота, результаты этого эксперимента, включая успешный сбор средств на благотворительность и управление прибыльными магазинами, указывают на пугающе быстрый прогресс в сторону суперинтеллекта.
🤖 Что такое AI Village: ИИ-агенты выходят в интернет 0:00
Проект AI Village представляет собой уникальную испытательную площадку для топовых языковых моделей. Каждому агенту (модели) выделяется отдельный компьютер с операционной системой Linux и доступ к групповому чату для координации действий . Участники могут использовать инструменты вроде Google Drive для совместной работы над документами .
Основные характеристики проекта:
- Участники: Актуальные версии моделей от OpenAI, Anthropic, Google и xAI (включая GPT-5, Claude 3.7 Sonnet, Gemini 2.5 Pro и Grok 4) .
- Формат работы: Каждый «сезон» агентам ставится масштабная цель, которую они должны достичь за определенное время .
- Автономность: Модели действуют преимущественно самостоятельно, хотя за ними наблюдают люди, способные давать подсказки или помогать в критических ситуациях (например, при столкновении с CAPTCHA) .
Проект был запущен в апреле 2025 года (согласно хронологии, представленной в видео) с участием моделей GPT-4o, o1 и ранних версий Claude Sonnet . По словам Веса Рота, зрители могут наблюдать за процессом в прямом эфире и даже взаимодействовать с агентами через чат. Однако автор иронично замечает, что «людям нельзя доверять», так как однажды зрители почти убедили одного из агентов завести аккаунт на OnlyFans .
💰 Благотворительность и управление бизнесом: первые успехи 2:29
В первом сезоне перед агентами стояла задача собрать как можно больше денег для благотворительного фонда Helen Keller International . Результаты оказались впечатляющими: ИИ-агенты создали страницу для пожертвований и собрали около 1500 долларов .
В процессе работы агенты проявили инициативу:
- Социальные сети: Модель Claude 3.7 Sonnet завела аккаунт в Twitter для регулярных обновлений .
- Контент-менеджмент: Агенты использовали ChatGPT для генерации профильных изображений в стиле студии Ghibli .
- PR и маркетинг: ИИ самостоятельно рассылали пресс-релизы и делали публикации на форуме эффективного альтруизма (EA forum) .
Вес Рот отмечает, что хотя модели работают автономно, они всё еще нуждаются в «ручном управлении» со стороны человека в некоторых аспектах. Например, Claude отказывается нажимать кнопку «Я не робот» на сайтах, что технически логично для ИИ . При этом автор подчеркивает, что GPT-4o проявила себя как наименее способная модель в этой группе .
📈 Экспоненциальный рост сложности задач 7:07
Одной из ключевых тем обсуждения стал график «временных горизонтов» (time horizons) задач, которые способен выполнять ИИ. Вес Рот ссылается на данные проекта Meter, согласно которым сложность и длительность автономной работы ИИ растет экспоненциально .
Динамика развития способностей ИИ:
- 2022 год: Написание кода, занимающее у человека 30 секунд .
- 2025 год (начало): Задачи по программированию, на которые у человека уходит 2 часа .
- Прогноз на конец 2025 года: Способность выполнять объем работы, эквивалентный 10-часовому рабочему дню человека, за один «промпт» .
Вес Рот указывает на наличие двух трендов. Первый (консервативный) предполагает удвоение способностей каждые 7 месяцев . Второй, основанный на последних данных, показывает ускорение: возможности ИИ удваиваются каждые 4 месяца . Если этот темп сохранится, то, по мнению автора, к 2027 году ИИ сможет автономно выполнять задачи, на которые у человека уходит месяц работы .
🥤 Тест торгового автомата: Grok 4 против людей 13:23
В качестве ещё одного бенчмарка Вес Рот приводит симуляцию управления бизнесом по продаже товаров через вендинговые автоматы (Vending Machine Bench) . Агентам выдавалось по 500 долларов стартового капитала, которые они должны были превратить в прибыль, закупая инвентарь и анализируя спрос .
Результаты тестирования на 13 августа 2025 года:
- Grok 4: Убедительное первое место. Модель увеличила капитал почти в 10 раз, закончив с суммой $4694,15 .
- GPT-5: Второе место с небольшим отставанием от лидера .
- Claude Opus 4: Стабильно прибыльная модель .
- Люди: Команда людей заняла лишь четвертое место .
- 03 и Gemini 2.5 Pro: Показали достойные результаты, всегда оставаясь в плюсе .
Интересно, что GPT-4o и Gemini 2.0 Pro в ряде запусков теряли деньги, заканчивая симуляцию с суммой меньше стартовых 500 долларов . Автор подчеркивает колоссальный прогресс: всего за четыре месяца (с апреля по август) максимальная прибыль моделей выросла почти на порядок .
🚀 Рекурсивное самосовершенствование и путь к AGI 10:39
Вес Рот обсуждает возможность возникновения «маховика ускорения», когда ИИ-агенты начнут использоваться для создания и улучшения еще более мощных версий ИИ . Этот процесс рекурсивного самосовершенствования может привести к взрывному росту интеллекта.
В подтверждение этого тезиса приводятся следующие примеры:
- Sakana AI: Проект «Darwin Goal Machine» .
- Google DeepMind: Система «AlphaEvolve» .
- Мнение Сэма Альтмана: Глава OpenAI охарактеризовал текущее состояние ИИ как «личиночную стадию самосовершенствования» .
Автор ссылается на работу Леопольда Ашенбреннера «Situational Awareness», в которой прогнозируется резкий скачок продуктивности ИИ в конце 2027 года . По мнению Ашенбреннера, автоматизация исследований в области ИИ (AI Research) станет переломным моментом, после которого путь от AGI (общего искусственного интеллекта) до суперинтеллекта может занять считанные месяцы . Вес Рот полагает, что мы можем увидеть суперинтеллект уже в первой половине 2028 года, хотя и призывает относиться к таким прогнозам с долей скепсиса .
🧐 Заключение: почему AI Village — это важно 19:58
По мнению Веса Рота, проект AI Village — это лучший способ наглядно продемонстрировать прогресс ИИ людям, далеким от математики и сложных бенчмарков . Вместо сухих цифр зрители видят реальные действия: управление браузером, ведение бухгалтерии и взаимодействие с внешним миром.
Автор выделяет несколько причин следить за проектом:
- Преодоление скептицизма: Многие считают, что развитие ИИ замедлилось, но AI Village доказывает обратное на практических примерах .
- Долгосрочная когерентность: Модели учатся не терять нить повествования и целей при выполнении задач, длящихся недели и месяцы .
- Будущее рынка труда: Когда ИИ сможет выполнять работу, требующую месяца человеческих усилий, за один сеанс, социальные и экономические последствия будут трансформационными .
Проект AI Village курируется Адамом Бинксмитом (Adam Binksmith), исследователем и основателем AI Digest . По словам автора, это некоммерческий исследовательский проект, целью которого является изучение возможностей агентов в реальных условиях .