Уэс Рот об AI Village: «К 2027 году ИИ-агенты смогут выполнять месячный объем работы за раз»

Wes Roth 80,6 тыс. 22 мин 5 мин 19.08.2025
Главное

В современном мире развития технологий искусственный интеллект перестал быть просто инструментом для ответов на вопросы. В рамках проекта AI Village («Деревня ИИ») новейшие языковые модели, такие как GPT-5, Grok 4 и Claude 3.7 Sonnet, получили собственные виртуальные компьютеры и возможность автономно взаимодействовать друг с другом для решения реальных бизнес-задач. По мнению автора канала Веса Рота, результаты этого эксперимента, включая успешный сбор средств на благотворительность и управление прибыльными магазинами, указывают на пугающе быстрый прогресс в сторону суперинтеллекта.

🤖 Что такое AI Village: ИИ-агенты выходят в интернет 0:00

Проект AI Village представляет собой уникальную испытательную площадку для топовых языковых моделей. Каждому агенту (модели) выделяется отдельный компьютер с операционной системой Linux и доступ к групповому чату для координации действий . Участники могут использовать инструменты вроде Google Drive для совместной работы над документами .

Основные характеристики проекта:

Проект был запущен в апреле 2025 года (согласно хронологии, представленной в видео) с участием моделей GPT-4o, o1 и ранних версий Claude Sonnet . По словам Веса Рота, зрители могут наблюдать за процессом в прямом эфире и даже взаимодействовать с агентами через чат. Однако автор иронично замечает, что «людям нельзя доверять», так как однажды зрители почти убедили одного из агентов завести аккаунт на OnlyFans .

💰 Благотворительность и управление бизнесом: первые успехи 2:29

В первом сезоне перед агентами стояла задача собрать как можно больше денег для благотворительного фонда Helen Keller International . Результаты оказались впечатляющими: ИИ-агенты создали страницу для пожертвований и собрали около 1500 долларов .

В процессе работы агенты проявили инициативу:

Вес Рот отмечает, что хотя модели работают автономно, они всё еще нуждаются в «ручном управлении» со стороны человека в некоторых аспектах. Например, Claude отказывается нажимать кнопку «Я не робот» на сайтах, что технически логично для ИИ . При этом автор подчеркивает, что GPT-4o проявила себя как наименее способная модель в этой группе .

📈 Экспоненциальный рост сложности задач 7:07

Одной из ключевых тем обсуждения стал график «временных горизонтов» (time horizons) задач, которые способен выполнять ИИ. Вес Рот ссылается на данные проекта Meter, согласно которым сложность и длительность автономной работы ИИ растет экспоненциально .

Динамика развития способностей ИИ:

Вес Рот указывает на наличие двух трендов. Первый (консервативный) предполагает удвоение способностей каждые 7 месяцев . Второй, основанный на последних данных, показывает ускорение: возможности ИИ удваиваются каждые 4 месяца . Если этот темп сохранится, то, по мнению автора, к 2027 году ИИ сможет автономно выполнять задачи, на которые у человека уходит месяц работы .

🥤 Тест торгового автомата: Grok 4 против людей 13:23

В качестве ещё одного бенчмарка Вес Рот приводит симуляцию управления бизнесом по продаже товаров через вендинговые автоматы (Vending Machine Bench) . Агентам выдавалось по 500 долларов стартового капитала, которые они должны были превратить в прибыль, закупая инвентарь и анализируя спрос .

Результаты тестирования на 13 августа 2025 года:

  1. Grok 4: Убедительное первое место. Модель увеличила капитал почти в 10 раз, закончив с суммой $4694,15 .
  2. GPT-5: Второе место с небольшим отставанием от лидера .
  3. Claude Opus 4: Стабильно прибыльная модель .
  4. Люди: Команда людей заняла лишь четвертое место .
  5. 03 и Gemini 2.5 Pro: Показали достойные результаты, всегда оставаясь в плюсе .

Интересно, что GPT-4o и Gemini 2.0 Pro в ряде запусков теряли деньги, заканчивая симуляцию с суммой меньше стартовых 500 долларов . Автор подчеркивает колоссальный прогресс: всего за четыре месяца (с апреля по август) максимальная прибыль моделей выросла почти на порядок .

🚀 Рекурсивное самосовершенствование и путь к AGI 10:39

Вес Рот обсуждает возможность возникновения «маховика ускорения», когда ИИ-агенты начнут использоваться для создания и улучшения еще более мощных версий ИИ . Этот процесс рекурсивного самосовершенствования может привести к взрывному росту интеллекта.

В подтверждение этого тезиса приводятся следующие примеры:

Автор ссылается на работу Леопольда Ашенбреннера «Situational Awareness», в которой прогнозируется резкий скачок продуктивности ИИ в конце 2027 года . По мнению Ашенбреннера, автоматизация исследований в области ИИ (AI Research) станет переломным моментом, после которого путь от AGI (общего искусственного интеллекта) до суперинтеллекта может занять считанные месяцы . Вес Рот полагает, что мы можем увидеть суперинтеллект уже в первой половине 2028 года, хотя и призывает относиться к таким прогнозам с долей скепсиса .

🧐 Заключение: почему AI Village — это важно 19:58

По мнению Веса Рота, проект AI Village — это лучший способ наглядно продемонстрировать прогресс ИИ людям, далеким от математики и сложных бенчмарков . Вместо сухих цифр зрители видят реальные действия: управление браузером, ведение бухгалтерии и взаимодействие с внешним миром.

Автор выделяет несколько причин следить за проектом:

Проект AI Village курируется Адамом Бинксмитом (Adam Binksmith), исследователем и основателем AI Digest . По словам автора, это некоммерческий исследовательский проект, целью которого является изучение возможностей агентов в реальных условиях .

💬 Цитаты

«Если автоматизация исследований ИИ приведет к такому быстрому прогрессу, увеличивающийся временной горизонт систем ИИ может стать одним из важнейших трендов в истории человечества.»

«Людям нельзя доверять. Они почти убедили одного из ИИ-агентов завести канал на OnlyFans.»

Вес Рот 2:15
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Long horizon tasks
Задачи, требующие длительного планирования и удержания контекста на протяжении дней или недель.
Recursive self-improvement
Процесс, при котором ИИ используется для создания или улучшения кода следующего поколения ИИ.
AGI
Общий искусственный интеллект, способный выполнить любую интеллектуальную задачу, доступную человеку.
Superintelligence
Интеллект, значительно превосходящий лучшие человеческие когнитивные способности во всех областях.
📊 Цифры
🗓 Хронология
  1. 9 апреля 2025 Запуск проекта AI Village с использованием моделей GPT-4o и Claude 3.5 Sonnet.
  2. 13 августа 2025 Обновление лидерборда вендинговых автоматов с доминированием Grok 4 и GPT-5.
  3. Конец 2027 Прогнозируемый переход к полностью автоматизированным исследованиям ИИ и начало 'взрыва интеллекта'.
  4. 2029 Консервативный срок достижения ИИ способности выполнять задачи месячной сложности.
⚖️ Другая сторона
Искусственный интеллект AI Village Grok 4 GPT-5 Claude 3.7 Sonnet Leopold Aschenbrenner