OpenAI представила Deep Research — революционный инструмент, превращающий ChatGPT в автономного «агента», способного проводить глубокие исследования в течение десятков минут. Разработчики и первые пользователи называют это долгожданным «моментом ощущения AGI» (сильного искусственного интеллекта), когда нейросеть берет на себя выполнение задач, на которые у экспертов-людей уходят часы и дни.
🚀 Прорыв в бенчмарках: Deep Research обходит экспертов 0:00
Новая технология OpenAI Deep Research — это не просто чат-бот, а многошаговый агентский инструмент, предназначенный для решения сложнейших запросов, требующих анализа десятков источников в интернете . В отличие от стандартных моделей, ориентированных на мгновенный ответ, Deep Research может «задуматься» на 5, 15 или даже 30 минут, чтобы выдать исчерпывающий отчет .
Результаты тестирования на новейшем бенчмарке Humanity's Last Exam («Последний экзамен человечества») продемонстрировали значительный скачок в возможностях ИИ :
- Тест включает более 3000 вопросов из 100 различных дисциплин — от ракетостроения до лингвистики .
- Предыдущий лидер, модель o3-mini, показывала точность в 13,3% .
- Deep Research достиг показателя в 26,6%, фактически удвоив эффективность в решении задач экспертного уровня .
Внутренние оценки OpenAI показывают, что инструмент экономит значительное время профильным специалистам . В области химии (анализ процессов сорбции газов) нейросеть сэкономила исследователю 4 часа работы . В лингвистике (анализ эргативно-абсолютивного строя языков) экономия составила 5 часов , а в здравоохранении (анализ одобренных методов генной терапии гемофилии) — 2 часа .
🏥 Личная история Филиппа: ИИ против рака 3:03
Филипп из команды OpenAI поделился глубоко личным опытом использования Deep Research, который, по его мнению, демонстрирует истинный потенциал технологии . В октябре его жене диагностировали билатеральный рак молочной железы. После двойной мастэктомии и химиотерапии семья столкнулась с «серой зоной» в принятии решения: стоит ли проводить лучевую терапию . Мнения врачей-специалистов разделились .
Используя ранний доступ к Deep Research, Филипп загрузил отчет о патологическом исследовании и поставил задачу проанализировать целесообразность радиации именно для этого случая, учитывая тип рака, генетические факторы и пройденную химиотерапию .
Результат оказался ошеломляющим:
- Модель не просто подтвердила слова онкологов, но и нашла специфические исследования, о которых врачи не упоминали .
- При добавлении личных факторов (возраст, генетика) ИИ мгновенно адаптировал рекомендации .
- Все приведенные нейросетью ссылки на научные работы оказались точными и проверяемыми (фактор галлюцинаций в этой модели минимизирован) .
По словам Филиппа, это был тот самый момент, когда «чувствуешь AGI» . Он утверждает, что инструмент дал семье уверенность и душевное спокойствие в критический момент, предоставив информацию уровня консилиума врачей за считанные минуты .
🌍 Экономическое влияние и конкуренция 6:49
Глава OpenAI Сэм Альтман, комментируя запуск, выдвинул смелое предположение. По его примерной оценке («vibe check»), текущая технология уже способна выполнять «однозначный процент» (single digit percentage) всех экономически значимых задач в мире . Уэс Рот отмечает, что даже 1% или 2% от мировой экономики — это ошеломляющая цифра, которая фундаментально изменит рынок труда .
Автор видео полагает, что этот запуск станет серьезным вызовом для таких компаний, как:
- Google (в сфере поиска и синтеза информации);
- Perplexity (конкурирующая поисковая ИИ-система) .
🇯🇵 Презентация из Токио: Как работает «Агент» 8:08
Команда OpenAI представила Deep Research в ходе трансляции из Токио. Руководитель отдела исследований Марк пояснил, что главная цель «агентских» систем — трансформация интеллектуального труда . Если предыдущие модели серии o1 умели рассуждать, но не имели доступа к инструментам, то Deep Research — это следующий шаг .
Ключевые особенности «глубокого исследования»:
- Отсутствие ограничений по задержке (latency): Модели разрешено «думать» долго, что OpenAI считает преимуществом, а не недостатком .
- Автономность: Модель самостоятельно открывает страницы, анализирует контент, таблицы, PDF-файлы и изображения .
- Адаптивность: ИИ корректирует свой план исследования по мере нахождения новой информации .
- Результат: Пользователь получает полноценный исследовательский отчет с точными цитатами и источниками .
🛠 Демонстрация: От бизнес-планов до покупки лыж 11:30
Нил, продакт-менеджер OpenAI, продемонстрировал работу инструмента на примере исследования рынка для мобильного приложения по переводу языков . Процесс взаимодействия выглядит следующим образом:
- Уточняющие вопросы: Модель не начинает работу сразу, а задает вопросы как опытный аналитик (например, какой уровень вовлеченности пользователей учитывать) .
- Прозрачность процесса: В боковой панели отображается ход мыслей ИИ — какие сайты он посещает и какие выводы делает в реальном времени .
- Итоговый отчет: Спустя 11 минут исследования 29 различных источников Deep Research выдал структурированный отчет с таблицами проникновения мобильной связи в разных странах и рекомендациями .
Джош, другой участник команды, показал «бытовой» сценарий использования — подбор лыж для поездки в Японию . Модель учла уровень катания (продвинутый), физические параметры (высокий рост), тип снега (пухляк) и даже предпочтения по цветовой палитре . В итоге ИИ выдал таблицу сравнения товаров, причем лучшей рекомендацией стала именно та модель лыж, которой Джош уже владеет, что подтвердило точность алгоритма .
🧠 Техническая база и борьба с галлюцинациями 17:23
Исса, исследователь OpenAI, рассказала, что Deep Research работает на базе дообученной версии будущей модели o3 . Обучение проводилось с помощью метода обучения с подкреплением (Reinforcement Learning) на сложных задачах по поиску информации и рассуждению .
Технические возможности модели:
- Анализ пользовательских файлов и использование Python для вычислений и построения графиков .
- Встраивание изображений с веб-сайтов и диаграмм прямо в текст отчета .
- Цитирование конкретных предложений и пассажей из источников .
Что касается точности, Deep Research показывает лучшие результаты в тестах на галлюцинации среди всех моделей OpenAI . Однако Исса предупреждает, что ИИ всё еще может ошибаться, поэтому пользователям необходимо самостоятельно проверять первоисточники .
📈 Будущее и доступность 27:20
Deep Research уже доступен пользователям плана Pro . В ближайшее время планируется запуск для подписчиков Plus, Team, Enterprise и Education, а также интеграция в десктопные и мобильные приложения .
Марк подчеркнул, что текущий запуск — это лишь верхушка айсберга. В будущем такие агенты смогут подключаться к внутренним базам данных предприятий (custom context) . Способность ИИ работать над одной задачей по 30 минут открывает путь к новым масштабам инвестиций в вычислительные мощности, так как результат оправдывает затраченные ресурсы .