Уэс Рот тестирует OpenAI Operator: сможет ли ИИ заменить человека в браузере?

Wes Roth 35,4 тыс. 33 мин 3 мин 24.01.2025
Главное

Будущее автономных агентов: тестируем OpenAI Operator «в поле» 0:00

OpenAI представила Operator — ИИ-агента, способного самостоятельно управлять веб-браузером, выполнять многошаговые задачи в сети, резервировать столики, покупать билеты и делать покупки. В отличие от классических инструментов, работающих через API, Operator действует как человек: он «видит» экран через облачную виртуальную машину и использует виртуальную мышь и клавиатуру для взаимодействия с интерфейсом. Уэс Рот провел серию тестов, чтобы понять, насколько эта технология готова к реальному использованию.

🌐 Навигация и работа с контентом 0:53

В ходе тестирования выяснилось, что Operator успешно справляется с базовыми задачами, хотя и не лишен «детских болезней».

🛒 Автоматизация шопинга: успех на Instacart 8:59

Наиболее впечатляющие результаты Operator показал при выполнении сложной задачи: покупке продуктов на основе скриншота плана питания.

🧠 Технологическая основа: модель Kua 25:59

За работой Operator стоит новая модель под названием Kua. Она сочетает визуальные возможности GPT-4o с продвинутым обучением с подкреплением для работы с графическими интерфейсами.

⚖️ Вердикт: исследовательская демо или готовый продукт? 22:30

Уэс Рот подвел итог своим впечатлениям, разделив оценку на три уровня:

  1. Рассуждения и планирование (A+): Агент безупречно понимает намерения пользователя и строит верную последовательность действий.
  2. Управление браузером (A): Исключая редкие ошибки с прокруткой, точность кликов впечатляет.
  3. Инфраструктура и опыт пользователя (B): Слабым местом остаются блокировки со стороны сайтов и необходимость частой авторизации.

По мнению Уэса Рота, на текущий момент Operator — это «state-of-the-art» (передовая) разработка в мире ИИ-агентов. Однако он предупреждает: технология находится на стадии исследовательского превью, а не коммерческого продукта. Пользователям следует ожидать ошибок, но скорость прогресса позволяет предположить, что в будущем подобные агенты станут полноценными помощниками в рутинных задачах.

💬 Цитаты

«Это hands-down лучший компьютерный агент, доступный прямо сейчас.»

«В будущем он будет делать ваши налоги через год.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
ИИ-агент
Программа, способная самостоятельно ставить цели и выполнять действия в интерфейсах для их достижения.
AGI
Общий искусственный интеллект, способный выполнять любую интеллектуальную задачу на уровне человека.
Бенчмарк
Тест для сравнения производительности моделей на стандартизированных задачах.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект OpenAI Operator Kua ИИ-агенты Instacart