OpenAI Deep Research: «Момент ощущения AGI» и прорыв в автономных исследованиях

OpenAI представила Deep Research — революционный инструмент, превращающий ChatGPT в автономного «агента», способного проводить глубокие исследования в течение десятков минут. Разработчики и первые пользователи называют это долгожданным «моментом ощущения AGI» (сильного искусственного интеллекта), когда нейросеть берет на себя выполнение задач, на которые у экспертов-людей уходят часы и дни.

🚀 Прорыв в бенчмарках: Deep Research обходит экспертов 0:00

Новая технология OpenAI Deep Research — это не просто чат-бот, а многошаговый агентский инструмент, предназначенный для решения сложнейших запросов, требующих анализа десятков источников в интернете . В отличие от стандартных моделей, ориентированных на мгновенный ответ, Deep Research может «задуматься» на 5, 15 или даже 30 минут, чтобы выдать исчерпывающий отчет .

Результаты тестирования на новейшем бенчмарке Humanity's Last Exam («Последний экзамен человечества») продемонстрировали значительный скачок в возможностях ИИ :

Тест включает более 3000 вопросов из 100 различных дисциплин — от ракетостроения до лингвистики .
Предыдущий лидер, модель o3-mini, показывала точность в 13,3% .
Deep Research достиг показателя в 26,6%, фактически удвоив эффективность в решении задач экспертного уровня .

Внутренние оценки OpenAI показывают, что инструмент экономит значительное время профильным специалистам . В области химии (анализ процессов сорбции газов) нейросеть сэкономила исследователю 4 часа работы . В лингвистике (анализ эргативно-абсолютивного строя языков) экономия составила 5 часов , а в здравоохранении (анализ одобренных методов генной терапии гемофилии) — 2 часа .

🏥 Личная история Филиппа: ИИ против рака 3:03

Филипп из команды OpenAI поделился глубоко личным опытом использования Deep Research, который, по его мнению, демонстрирует истинный потенциал технологии . В октябре его жене диагностировали билатеральный рак молочной железы. После двойной мастэктомии и химиотерапии семья столкнулась с «серой зоной» в принятии решения: стоит ли проводить лучевую терапию . Мнения врачей-специалистов разделились .

Используя ранний доступ к Deep Research, Филипп загрузил отчет о патологическом исследовании и поставил задачу проанализировать целесообразность радиации именно для этого случая, учитывая тип рака, генетические факторы и пройденную химиотерапию .

Результат оказался ошеломляющим:

Модель не просто подтвердила слова онкологов, но и нашла специфические исследования, о которых врачи не упоминали .
При добавлении личных факторов (возраст, генетика) ИИ мгновенно адаптировал рекомендации .
Все приведенные нейросетью ссылки на научные работы оказались точными и проверяемыми (фактор галлюцинаций в этой модели минимизирован) .

По словам Филиппа, это был тот самый момент, когда «чувствуешь AGI» . Он утверждает, что инструмент дал семье уверенность и душевное спокойствие в критический момент, предоставив информацию уровня консилиума врачей за считанные минуты .

🌍 Экономическое влияние и конкуренция 6:49

Глава OpenAI Сэм Альтман, комментируя запуск, выдвинул смелое предположение. По его примерной оценке («vibe check»), текущая технология уже способна выполнять «однозначный процент» (single digit percentage) всех экономически значимых задач в мире . Уэс Рот отмечает, что даже 1% или 2% от мировой экономики — это ошеломляющая цифра, которая фундаментально изменит рынок труда .

Автор видео полагает, что этот запуск станет серьезным вызовом для таких компаний, как:

Google (в сфере поиска и синтеза информации);
Perplexity (конкурирующая поисковая ИИ-система) .

🇯🇵 Презентация из Токио: Как работает «Агент» 8:08

Команда OpenAI представила Deep Research в ходе трансляции из Токио. Руководитель отдела исследований Марк пояснил, что главная цель «агентских» систем — трансформация интеллектуального труда . Если предыдущие модели серии o1 умели рассуждать, но не имели доступа к инструментам, то Deep Research — это следующий шаг .

Ключевые особенности «глубокого исследования»:

Отсутствие ограничений по задержке (latency): Модели разрешено «думать» долго, что OpenAI считает преимуществом, а не недостатком .
Автономность: Модель самостоятельно открывает страницы, анализирует контент, таблицы, PDF-файлы и изображения .
Адаптивность: ИИ корректирует свой план исследования по мере нахождения новой информации .
Результат: Пользователь получает полноценный исследовательский отчет с точными цитатами и источниками .

🛠 Демонстрация: От бизнес-планов до покупки лыж 11:30

Нил, продакт-менеджер OpenAI, продемонстрировал работу инструмента на примере исследования рынка для мобильного приложения по переводу языков . Процесс взаимодействия выглядит следующим образом:

Уточняющие вопросы: Модель не начинает работу сразу, а задает вопросы как опытный аналитик (например, какой уровень вовлеченности пользователей учитывать) .
Прозрачность процесса: В боковой панели отображается ход мыслей ИИ — какие сайты он посещает и какие выводы делает в реальном времени .
Итоговый отчет: Спустя 11 минут исследования 29 различных источников Deep Research выдал структурированный отчет с таблицами проникновения мобильной связи в разных странах и рекомендациями .

Джош, другой участник команды, показал «бытовой» сценарий использования — подбор лыж для поездки в Японию . Модель учла уровень катания (продвинутый), физические параметры (высокий рост), тип снега (пухляк) и даже предпочтения по цветовой палитре . В итоге ИИ выдал таблицу сравнения товаров, причем лучшей рекомендацией стала именно та модель лыж, которой Джош уже владеет, что подтвердило точность алгоритма .

🧠 Техническая база и борьба с галлюцинациями 17:23

Исса, исследователь OpenAI, рассказала, что Deep Research работает на базе дообученной версии будущей модели o3 . Обучение проводилось с помощью метода обучения с подкреплением (Reinforcement Learning) на сложных задачах по поиску информации и рассуждению .

Технические возможности модели:

Анализ пользовательских файлов и использование Python для вычислений и построения графиков .
Встраивание изображений с веб-сайтов и диаграмм прямо в текст отчета .
Цитирование конкретных предложений и пассажей из источников .

Что касается точности, Deep Research показывает лучшие результаты в тестах на галлюцинации среди всех моделей OpenAI . Однако Исса предупреждает, что ИИ всё еще может ошибаться, поэтому пользователям необходимо самостоятельно проверять первоисточники .

📈 Будущее и доступность 27:20

Deep Research уже доступен пользователям плана Pro . В ближайшее время планируется запуск для подписчиков Plus, Team, Enterprise и Education, а также интеграция в десктопные и мобильные приложения .

Марк подчеркнул, что текущий запуск — это лишь верхушка айсберга. В будущем такие агенты смогут подключаться к внутренним базам данных предприятий (custom context) . Способность ИИ работать над одной задачей по 30 минут открывает путь к новым масштабам инвестиций в вычислительные мощности, так как результат оправдывает затраченные ресурсы .