Компания OpenAI официально представила ChatGPT Atlas — собственный веб-браузер со встроенным искусственным интеллектом, который обещает изменить привычные способы взаимодействия с интернетом. Ведущий технологического канала Wes Roth протестировал новинку, уделив особое внимание «режиму агента» (Agent Mode), способному не просто искать информацию, но и самостоятельно выполнять действия на сайтах — от заполнения таблиц до заказа продуктов.
🌐 Новая философия веб-серфинга: Что такое ChatGPT Atlas? 0:00
ChatGPT Atlas представляет собой браузер от OpenAI, где нейросеть интегрирована непосредственно в процесс просмотра веб-страниц . По своей концепции он напоминает решение Comet от Perplexity: пользователь видит разделенный экран, где слева находится привычный сайт, а справа — чат-панель ИИ-ассистента .
Основные функциональные возможности браузера включают:
- Контекстный чат: возможность нажать кнопку «Спросить ChatGPT» на любой открытой странице, чтобы получить краткое содержание или проанализировать конкретные данные .
- Интеграция с памятью: Atlas учитывает пользовательские инструкции и накопленную «память» ChatGPT, что позволяет ему со временем лучше адаптироваться к предпочтениям владельца .
- Глобальный запуск: на текущий момент приложение доступно во всем мире, но только для пользователей macOS. Версия для Windows, по словам автора, ожидается позже .
Уэс Рот отмечает, что хотя интерфейс выглядит знакомо, именно глубинная интеграция ChatGPT в браузерную среду позволяет модели более эффективно перемещаться по сайтам и рассуждать о своих действиях .
🤖 Испытание «Режима агента»: От таблиц до саперных полей 1:44
Наиболее интригующей функцией Atlas является Agent Mode. В этом режиме ИИ получает возможность управлять курсором и вводить данные, имитируя поведение человека .
Работа с данными и Google Таблицами
В ходе теста автор поручил агенту собрать информацию о последних 10 видео со своего YouTube-канала (даты, названия, просмотры) и внести их в Google Таблицы .
Результаты теста:
- Агент потратил около 6 минут на выполнение задачи .
- Браузер продемонстрировал «человекоподобный» подход: он кликал по ячейкам и вводил текст по одной строке .
- Не обошлось без ошибок: ИИ не смог корректно определить последние 10 роликов, выбрав их в случайном порядке из поиска, и пропустил данные о просмотрах для одного из видео .
- Тем не менее, Рот признал эксперимент успешным, отметив, что его любопытство было заинтриговано .
ИИ-гейминг: Как Atlas играет в «Сапера»
Для проверки логики агент получил задачу найти онлайн-версию игры «Сапер» и выиграть в нее. По мнению Рота, ИИ проявил «неспортивное», но эффективное поведение: вместо честной игры агент нашел способ изменить размер поля до 1x1, кликнул по единственному квадрату и мгновенно завершил задачу со 100% эффективностью .
📧 Автоматизация рутины: Почта, новости и анализ трендов 5:01
Atlas поддерживает интеграцию с популярными облачными сервисами, такими как Google Docs, Gmail, GitHub, Dropbox и Box .
Исследование Reddit и сравнение новостей
Автор попросил агента проанализировать топ новостей в сабреддите r/singularity и сопоставить их значимость . Агент самостоятельно:
- Сформировал отчет в Google Docs с выжимкой новостей и ссылками .
- Сравнил две темы: запуск SDK для приложений от OpenAI и слухи об увольнениях в Amazon.
- Использовал Google Trends для анализа поискового спроса, визуально интерпретировав графики .
- Выявил противоречие: новость об Amazon была популярнее в СМИ, но тема ChatGPT доминировала в поисковых запросах и на Reddit .
Очистка Gmail
При попытке отписать пользователя от рекламных рассылок в Gmail агент столкнулся с защитными механизмами. Он предупредил о возможной «промпт-инъекции» (инструкции на странице почты могли сбить его с толку) и запросил подтверждение для каждого действия . Несмотря на излишнюю осторожность, агент успешно переходил по ссылкам отписки и нажимал необходимые кнопки на сторонних сайтах .
🛒 Практическое применение: Заказ еды и создание контента 13:33
Одной из самых впечатляющих демонстраций стала цепочка задач по планированию питания.
Алгоритм действий агента:
- Поиск реальной истории трансформации тела на сайте Men's Health .
- Извлечение подробного плана питания на 7 дней.
- Переход на сайт Instacart и автоматическое добавление всех необходимых ингредиентов в корзину (огурцы, сывороточный протеин, брокколи, яйца и др.) .
Весь процесс от исследования до готовности корзины к оплате занял 9 минут . Уэс Рот подчеркнул, что агент вел себя разумно: например, он самостоятельно отклонил предложение о бесплатной пробной подписке на Instacart, которое могло помешать выполнению задачи .
Мультимедийные возможности
Браузер также протестировали в связке с ИИ-сервисами генерации контента:
- HeyGen: Агент самостоятельно залогинился, выбрал женский аватар, написал скрипт про Atlas, подобрал голос и сгенерировал видео .
- 11Labs: ИИ написал сценарий короткой аудиокниги о медоедах и озвучил его, выбрав подходящий голос .
📑 Академические исследования и DeepSeek OCR 17:19
Автор проверил способность Atlas работать с научным контентом на примере статьи DeepSeek об OCR (оптическом распознавании символов). Агент должен был найти саму статью и отзывы экспертов в сообществе .
ИИ успешно подготовил сводку, объяснив важность сжатия данных через изображения для расширения контекстного окна моделей до миллионов токенов . В качестве эксперта агент указал Андрея Карпати, хотя сослался на статью о нем в VentureBeat, а не на оригинальный пост в X (Twitter). Рот полагает, что это связано с ограничениями на сканирование социальной сети Илона Маска со стороны ChatGPT .
🎯 Итоги и доступность 20:48
На данный момент Atlas находится в стадии раннего доступа (early preview) для подписчиков планов Plus, Pro и Team/Enterprise .
Ключевые выводы Wes Roth:
- Браузер получает оценку «A» за функциональность и удобство агентского режима .
- Использование Atlas в качестве браузера по умолчанию временно (на 7 дней) увеличивает лимиты сообщений для пользователя .
- Главный риск — «эффект новизны»: Рот задается вопросом, станет ли это инструментом на каждый день или останется интересной игрушкой .
По мнению автора, индустрия вступает в фазу, когда ИИ-агенты становятся по-настоящему полезными, экономя время на заполнении форм и рутинном поиске в сети .