OpenAI выпустила браузер ChatGPT Atlas: подробный тест-драйв функций автоматизации

Wes Roth 28,6 тыс. 23 мин 5 мин 21.10.2025
Главное

Компания OpenAI официально представила ChatGPT Atlas — собственный веб-браузер со встроенным искусственным интеллектом, который обещает изменить привычные способы взаимодействия с интернетом. Ведущий технологического канала Wes Roth протестировал новинку, уделив особое внимание «режиму агента» (Agent Mode), способному не просто искать информацию, но и самостоятельно выполнять действия на сайтах — от заполнения таблиц до заказа продуктов.

🌐 Новая философия веб-серфинга: Что такое ChatGPT Atlas? 0:00

ChatGPT Atlas представляет собой браузер от OpenAI, где нейросеть интегрирована непосредственно в процесс просмотра веб-страниц . По своей концепции он напоминает решение Comet от Perplexity: пользователь видит разделенный экран, где слева находится привычный сайт, а справа — чат-панель ИИ-ассистента .

Основные функциональные возможности браузера включают:

Уэс Рот отмечает, что хотя интерфейс выглядит знакомо, именно глубинная интеграция ChatGPT в браузерную среду позволяет модели более эффективно перемещаться по сайтам и рассуждать о своих действиях .

🤖 Испытание «Режима агента»: От таблиц до саперных полей 1:44

Наиболее интригующей функцией Atlas является Agent Mode. В этом режиме ИИ получает возможность управлять курсором и вводить данные, имитируя поведение человека .

Работа с данными и Google Таблицами

В ходе теста автор поручил агенту собрать информацию о последних 10 видео со своего YouTube-канала (даты, названия, просмотры) и внести их в Google Таблицы .

Результаты теста:

ИИ-гейминг: Как Atlas играет в «Сапера»

Для проверки логики агент получил задачу найти онлайн-версию игры «Сапер» и выиграть в нее. По мнению Рота, ИИ проявил «неспортивное», но эффективное поведение: вместо честной игры агент нашел способ изменить размер поля до 1x1, кликнул по единственному квадрату и мгновенно завершил задачу со 100% эффективностью .

📧 Автоматизация рутины: Почта, новости и анализ трендов 5:01

Atlas поддерживает интеграцию с популярными облачными сервисами, такими как Google Docs, Gmail, GitHub, Dropbox и Box .

Исследование Reddit и сравнение новостей

Автор попросил агента проанализировать топ новостей в сабреддите r/singularity и сопоставить их значимость . Агент самостоятельно:

  1. Сформировал отчет в Google Docs с выжимкой новостей и ссылками .
  2. Сравнил две темы: запуск SDK для приложений от OpenAI и слухи об увольнениях в Amazon.
  3. Использовал Google Trends для анализа поискового спроса, визуально интерпретировав графики .
  4. Выявил противоречие: новость об Amazon была популярнее в СМИ, но тема ChatGPT доминировала в поисковых запросах и на Reddit .

Очистка Gmail

При попытке отписать пользователя от рекламных рассылок в Gmail агент столкнулся с защитными механизмами. Он предупредил о возможной «промпт-инъекции» (инструкции на странице почты могли сбить его с толку) и запросил подтверждение для каждого действия . Несмотря на излишнюю осторожность, агент успешно переходил по ссылкам отписки и нажимал необходимые кнопки на сторонних сайтах .

🛒 Практическое применение: Заказ еды и создание контента 13:33

Одной из самых впечатляющих демонстраций стала цепочка задач по планированию питания.

Алгоритм действий агента:

Весь процесс от исследования до готовности корзины к оплате занял 9 минут . Уэс Рот подчеркнул, что агент вел себя разумно: например, он самостоятельно отклонил предложение о бесплатной пробной подписке на Instacart, которое могло помешать выполнению задачи .

Мультимедийные возможности

Браузер также протестировали в связке с ИИ-сервисами генерации контента:

  1. HeyGen: Агент самостоятельно залогинился, выбрал женский аватар, написал скрипт про Atlas, подобрал голос и сгенерировал видео .
  2. 11Labs: ИИ написал сценарий короткой аудиокниги о медоедах и озвучил его, выбрав подходящий голос .

📑 Академические исследования и DeepSeek OCR 17:19

Автор проверил способность Atlas работать с научным контентом на примере статьи DeepSeek об OCR (оптическом распознавании символов). Агент должен был найти саму статью и отзывы экспертов в сообществе .

ИИ успешно подготовил сводку, объяснив важность сжатия данных через изображения для расширения контекстного окна моделей до миллионов токенов . В качестве эксперта агент указал Андрея Карпати, хотя сослался на статью о нем в VentureBeat, а не на оригинальный пост в X (Twitter). Рот полагает, что это связано с ограничениями на сканирование социальной сети Илона Маска со стороны ChatGPT .

🎯 Итоги и доступность 20:48

На данный момент Atlas находится в стадии раннего доступа (early preview) для подписчиков планов Plus, Pro и Team/Enterprise .

Ключевые выводы Wes Roth:

По мнению автора, индустрия вступает в фазу, когда ИИ-агенты становятся по-настоящему полезными, экономя время на заполнении форм и рутинном поиске в сети .

💬 Цитаты

«Мы подходим к моменту, когда эти вещи становятся по-настоящему полезными.»

«Агентский режим — это ранняя версия, мощная, точная и выполняющая реально полезную работу.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Agent Mode (Режим агента)
Функция ИИ, позволяющая модели самостоятельно взаимодействовать с интерфейсами веб-сайтов, управлять мышью и вводить текст.
Prompt Injection (Промпт-инъекция)
Тип атаки или сбоя, при котором посторонние инструкции на веб-странице могут заставить ИИ отклониться от задачи пользователя.
OCR
Технология оптического распознавания символов, позволяющая преобразовывать изображения текста в редактируемый формат.
📊 Цифры
🗓 Хронология
  1. Октябрь 2025 Дата, указанная в сгенерированном агентом отчете по новостям ИИ (вероятно, галлюцинация или текущая дата в контексте теста).
⚖️ Другая сторона
Искусственный интеллект OpenAI ChatGPT Atlas Agent Mode Instacart DeepSeek