OpenAI Deep Research: «Момент ощущения AGI» и прорыв в автономных исследованиях

Wes Roth 99,5 тыс. 28 мин 5 мин 02.02.2025
Главное

OpenAI представила Deep Research — революционный инструмент, превращающий ChatGPT в автономного «агента», способного проводить глубокие исследования в течение десятков минут. Разработчики и первые пользователи называют это долгожданным «моментом ощущения AGI» (сильного искусственного интеллекта), когда нейросеть берет на себя выполнение задач, на которые у экспертов-людей уходят часы и дни.

🚀 Прорыв в бенчмарках: Deep Research обходит экспертов 0:00

Новая технология OpenAI Deep Research — это не просто чат-бот, а многошаговый агентский инструмент, предназначенный для решения сложнейших запросов, требующих анализа десятков источников в интернете . В отличие от стандартных моделей, ориентированных на мгновенный ответ, Deep Research может «задуматься» на 5, 15 или даже 30 минут, чтобы выдать исчерпывающий отчет .

Результаты тестирования на новейшем бенчмарке Humanity's Last Exam («Последний экзамен человечества») продемонстрировали значительный скачок в возможностях ИИ :

Внутренние оценки OpenAI показывают, что инструмент экономит значительное время профильным специалистам . В области химии (анализ процессов сорбции газов) нейросеть сэкономила исследователю 4 часа работы . В лингвистике (анализ эргативно-абсолютивного строя языков) экономия составила 5 часов , а в здравоохранении (анализ одобренных методов генной терапии гемофилии) — 2 часа .

🏥 Личная история Филиппа: ИИ против рака 3:03

Филипп из команды OpenAI поделился глубоко личным опытом использования Deep Research, который, по его мнению, демонстрирует истинный потенциал технологии . В октябре его жене диагностировали билатеральный рак молочной железы. После двойной мастэктомии и химиотерапии семья столкнулась с «серой зоной» в принятии решения: стоит ли проводить лучевую терапию . Мнения врачей-специалистов разделились .

Используя ранний доступ к Deep Research, Филипп загрузил отчет о патологическом исследовании и поставил задачу проанализировать целесообразность радиации именно для этого случая, учитывая тип рака, генетические факторы и пройденную химиотерапию .

Результат оказался ошеломляющим:

По словам Филиппа, это был тот самый момент, когда «чувствуешь AGI» . Он утверждает, что инструмент дал семье уверенность и душевное спокойствие в критический момент, предоставив информацию уровня консилиума врачей за считанные минуты .

🌍 Экономическое влияние и конкуренция 6:49

Глава OpenAI Сэм Альтман, комментируя запуск, выдвинул смелое предположение. По его примерной оценке («vibe check»), текущая технология уже способна выполнять «однозначный процент» (single digit percentage) всех экономически значимых задач в мире . Уэс Рот отмечает, что даже 1% или 2% от мировой экономики — это ошеломляющая цифра, которая фундаментально изменит рынок труда .

Автор видео полагает, что этот запуск станет серьезным вызовом для таких компаний, как:

  1. Google (в сфере поиска и синтеза информации);
  2. Perplexity (конкурирующая поисковая ИИ-система) .

🇯🇵 Презентация из Токио: Как работает «Агент» 8:08

Команда OpenAI представила Deep Research в ходе трансляции из Токио. Руководитель отдела исследований Марк пояснил, что главная цель «агентских» систем — трансформация интеллектуального труда . Если предыдущие модели серии o1 умели рассуждать, но не имели доступа к инструментам, то Deep Research — это следующий шаг .

Ключевые особенности «глубокого исследования»:

🛠 Демонстрация: От бизнес-планов до покупки лыж 11:30

Нил, продакт-менеджер OpenAI, продемонстрировал работу инструмента на примере исследования рынка для мобильного приложения по переводу языков . Процесс взаимодействия выглядит следующим образом:

  1. Уточняющие вопросы: Модель не начинает работу сразу, а задает вопросы как опытный аналитик (например, какой уровень вовлеченности пользователей учитывать) .
  2. Прозрачность процесса: В боковой панели отображается ход мыслей ИИ — какие сайты он посещает и какие выводы делает в реальном времени .
  3. Итоговый отчет: Спустя 11 минут исследования 29 различных источников Deep Research выдал структурированный отчет с таблицами проникновения мобильной связи в разных странах и рекомендациями .

Джош, другой участник команды, показал «бытовой» сценарий использования — подбор лыж для поездки в Японию . Модель учла уровень катания (продвинутый), физические параметры (высокий рост), тип снега (пухляк) и даже предпочтения по цветовой палитре . В итоге ИИ выдал таблицу сравнения товаров, причем лучшей рекомендацией стала именно та модель лыж, которой Джош уже владеет, что подтвердило точность алгоритма .

🧠 Техническая база и борьба с галлюцинациями 17:23

Исса, исследователь OpenAI, рассказала, что Deep Research работает на базе дообученной версии будущей модели o3 . Обучение проводилось с помощью метода обучения с подкреплением (Reinforcement Learning) на сложных задачах по поиску информации и рассуждению .

Технические возможности модели:

Что касается точности, Deep Research показывает лучшие результаты в тестах на галлюцинации среди всех моделей OpenAI . Однако Исса предупреждает, что ИИ всё еще может ошибаться, поэтому пользователям необходимо самостоятельно проверять первоисточники .

📈 Будущее и доступность 27:20

Deep Research уже доступен пользователям плана Pro . В ближайшее время планируется запуск для подписчиков Plus, Team, Enterprise и Education, а также интеграция в десктопные и мобильные приложения .

Марк подчеркнул, что текущий запуск — это лишь верхушка айсберга. В будущем такие агенты смогут подключаться к внутренним базам данных предприятий (custom context) . Способность ИИ работать над одной задачей по 30 минут открывает путь к новым масштабам инвестиций в вычислительные мощности, так как результат оправдывает затраченные ресурсы .

💬 Цитаты

«Мы часто говорим внутри OpenAI о моментах, когда вы чувствуете AGI, и это был один из них.»

Филипп (сотрудник OpenAI) 06:10

«Моя примерная оценка такова: ИИ может выполнять однозначный процент всех экономически ценных задач в мире, что является диким достижением.»

Сэм Альтман 07:16

«Deep Research — это модель, которая проводит многошаговое исследование в интернете... адаптируя свой план по мере обнаружения новой информации.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Сильный искусственный интеллект, способный выполнять любую интеллектуальную задачу на уровне человека или выше.
Бенчмарк
Стандартизированный тест для оценки производительности и знаний моделей ИИ.
Агент (Agentic ИИ)
ИИ-система, способная автономно использовать инструменты, планировать действия и достигать целей без постоянного контроля человека.
Humanity's Last Exam
Сложный тест для ИИ, состоящий из вопросов экспертного уровня в различных научных дисциплинах.
📊 Цифры
🗓 Хронология
  1. Октябрь 2024 Диагноз рака у жены Филиппа и начало использования Deep Research для личных исследований
  2. Декабрь 2024 Проведение операции и начало химиотерапии у пациента, упомянутого в кейсе
  3. Февраль 2025 Официальный запуск Deep Research для пользователей Pro и трансляция из Токио
⚖️ Другая сторона
Искусственный интеллект OpenAI Deep Research модель o3 AGI Humanity's Last Exam