В свежем интервью для канала венчурного фонда Andreessen Horowitz (a16z) ключевые научные руководители OpenAI обсудили радикальную смену парадигмы в разработке искусственного интеллекта. Марк Чен и Якуб Пахоцкий рассказали о возможностях новой модели GPT-5, философии преодоления исследовательских тупиков и переходе от эпохи интуитивного написания кода к автоматизации научных открытий. Центральной темой беседы стало создание полностью автономного ИИ-исследователя, способного решать сложнейшие задачи на долгосрочном горизонте планирования.
🧠 От GPT-5 к автономным агентам: новая эра рассуждений 1:05
По словам Марка Чена, выпуск модели GPT-5 стал ключевой попыткой OpenAI вывести продвинутые рассуждения (reasoning) в мейнстрим. До этого момента пользователи компании сталкивались с дилеммой выбора между двумя семействами моделей:
- Линейка GPT (от GPT-2 до GPT-4), ориентированная на мгновенные ответы (instant response).
- Серия O (включая O3), которая тратила значительное время на «размышления» ради выдачи максимально качественного результата.
Как утверждает Марк Чен, тактическая цель GPT-5 заключалась в том, чтобы избавить пользователей от необходимости самостоятельно решать, какой режим запускать под конкретную задачу. Исследовательская команда провела масштабную работу по автоматическому определению оптимального объема вычислений (thinking time) для каждого промпта.
Спикеры сошлись во мнении, что будущее технологий лежит в плоскости постоянного углубления рассуждений и развития агентного поведения по умолчанию, и GPT-5 является важнейшим шагом на пути к этой автономии. По оценке руководства, модель предлагает комплексные улучшения по сравнению с O3, однако именно доступность глубокого логического анализа для широкой аудитории стала главным тезисом релиза.
📊 Кризис классических метрик и новые бенчмарки 2:24
Якуб Пахоцкий обратил внимание на то, что традиционные тесты (evals), использовавшиеся индустрией последние несколько лет, практически исчерпали свой потенциал, достигнув насыщения. В современных реалиях прирост точности на условные 1–2% (например, с 96% до 98%) уже не отражает реального прогресса.
Главный ученый OpenAI выделил фундаментальное различие между прежними и текущими методами обучения:
- В эпоху GPT-2 и GPT-4 доминировал единый подход — предварительное обучение (pre-training) на гигантских массивах данных, где тесты служили лишь универсальной линейкой для оценки генерализации знаний.
- Внедрение обучения с подкреплением (RL) для сложных цепочек рассуждений позволило целенаправленно тренировать модель в конкретных доменах, превращая ее в узкопрофильного эксперта.
Однако такой метод таит в себе неочевидный нюанс: по словам Пахоцкого, модель может демонстрировать выдающиеся результаты в целевом тесте, но это больше не гарантирует ее способность так же успешно переносить навыки на другие задачи. На текущий момент ИИ-индустрия испытывает явный дефицит качественных систем оценки.
Марк Чен добавил, что наиболее объективными маркерами успеха для будущих исследований остаются реальные победы моделей на математических и программистских олимпиадах вроде AtCoder и IMO. В частности, модель OpenAI уже заняла второе место на соревнованиях AtCoder. Следующий рубеж оценки, по мнению авторов, сместится в сторону способности ИИ совершать подлинные научные открытия, имеющие прямую экономическую ценность.
🔬 Прорывы в фундаментальных науках и глубина автономии 5:16
Марк Чен поделился наблюдениями за тем, как GPT-5 показала себя на внутренних тестах в области сложных фундаментаческих наук. Эксперименты с привлечением профессиональных физиков и математиков продемонстрировали, что ИИ способен самостоятельно генерировать нетривиальные математические концепты. По словам Чена, для ученых это стало настоящим моментом озарения (light bulb moment): модель смогла автоматизировать работу, на которую у студентов магистратуры или аспирантов обычно уходят месяцы жесткого труда.
Якуб Пахоцкий признался, что для него лично переломным моментом стала модель O3, которая превратилась в надежный ежедневный инструмент для вывода математических формул. Однако текущие успехи в решении олимпиадных задач на коротких отрезках блекнут перед планами на ближайшие 1–5 лет.
Исследовательский тезис OpenAI, сформулированный спикерами, заключается в создании «автоматизированного исследователя» (automated researcher). Главная цель — полностью автоматизировать процесс генерации и верификации новых научных идей. Это применимо как к сфере машинного обучения (хотя авторы признают элемент самореференциальности), так и к другим дисциплинам.
Ключевой метрикой прогресса на этом пути Якуб Пахоцкий назвал временной горизонт автономной работы ИИ:
- Текущие модели способны удерживать фокус и логическую последовательность при решении задач в течение 1–5 часов.
- Основные инженерные усилия OpenAI сейчас сосредоточены на расширении этого окна — обучении моделей долгосрочному планированию и сохранению глубокой памяти (memory retention) без потери траектории.
При этом Якуб Пахоцкий прокомментировал наблюдаемый пользователями компромисс между автономностью (agency) и стабильностью систем. Существует риск того, что большое количество промежуточных шагов планирования или использование слишком широкого набора инструментов ведут к регрессии качества на условном десятом шаге.
По мнению Пахоцкого, секрет удержания глубины рассуждений кроется в обеспечении абсолютной внутренней согласованности модели на длинных дистанциях. Способность ИИ получать жесткую обратную связь от среды, признавать ошибки, анализировать неверные подходы и пробовать новые альтернативы — это и есть ядро настоящих рассуждений, дающее агентам устойчивость. Спикеры считают, что данный паттерн со временем удастся перенести и на менее верифицируемые, открытые (open-ended) гуманитарные и социальные сферы.
⚡ Сила обучения с подкреплением и построение reward-моделей 12:07
С момента релиза O1 в ИИ-сообществе регулярно звучат прогнозы о скором выходе технологии Reinforcement Learning (RL) на плато, насыщении тестов и коллапсе режимов из-за избытка синтетических данных. Тем не менее OpenAI продолжает выпускать регулярные обновления. Якуб Пахоцкий объясняет этот феномен высокой гибкостью метода RL.
Исторически OpenAI начинала заниматься обучением с подкреплением еще до эпохи больших языковых моделей. Долгое время главной проблемой оставалось отсутствие адекватной среды: ученым приходилось симулировать изолированные виртуальные миры, чтобы заставить агентов конкурировать и сотрудничать.
Ситуация радикально изменилась с прорывом в LLM. Предварительное обучение на естественном языке создало невероятно богатую, нюансированную среду, отражающую все человеческие знания. Комбинация двух парадигм — масштабирования глубокого обучения языку и RL — открыла бесконечный поток новых исследовательских направлений.
Для внешних компаний (например, в сфере биологии или физики), которые хотят внедрить методы рассуждений, но не знают, как подступиться к созданию правильной модели вознаграждения (reward model), Якуб Пахоцкий дал важную рекомендацию. По его прогнозу, этот процесс будет стремительно упрощаться.
Если два года назад индустрия спорила о лучших практиках тонкой настройки (fine-tuning) датасетов, то сегодня вектор смещается в сторону обучения, максимально похожего на человеческое. Главный совет от спикеров — сохранять гибкость мышления и не предполагать, что текущие технологические ограничения останутся неизменными навсегда.
💻 Революция в кодинге: GPT-5 Codex и феномен Vibe Coding 15:55
В день записи подкаста состоялся релиз GPT-5 Codex. Марк Чен пояснил, что миссия команды Codex заключается в том, чтобы взять «сырой» интеллект моделей рассуждения и адаптировать его под хаотичную реальность коммерческой разработки. Продукт научили справляться с нечеткими спецификациями, стилистическими особенностями кода и тонкими поведенческими нюансами (например, контролировать уровень «проактивности» или «лени» ИИ при написании функций).
Важным инженерным решением стало динамическое распределение задержки (latency пресеты):
- Для простых задач модель работает с минимальным временем отклика, выдавая моментальный результат.
- Для архитектурно сложных проблем ИИ намеренно берет долгую паузу (высокий latency), чтобы сгенерировать выверенное и надежное решение.
По признанию Марка Чена, предыдущие поколения Codex страдали от дисбаланса: они тратили слишком много времени на тривиальные задачи и слишком мало — на хардкорные вызовы.
Будучи в прошлом профессиональными олимпиадными программистами, Якуб и Марк поделились личной трансформацией. Долгое время Пахоцкий категорически отказывался от ИИ-ассистентов, предпочитая классический текстовый редактор Vim. Однако возможности GPT-5 заставили его изменить привычки. Способность модели безупречно провести рефакторинг тридцати файлов проекта всего за 15 минут делает игнорирование таких инструментов нерациональным. Тем не менее Якуб отмечает, что технология все еще находится в своеобразной «зловещей долине» (uncanny valley) — она невероятно ускоряет процессы, но пока не дотягивает до уровня идеального коллеги-человека. Главный приоритет OpenAI в этом направлении — преодоление этого барьера.
Марк Чен вспомнил исторический триумф AlphaGo, который когда-то вдохновил его прийти в сферу ИИ. Сегодня скорость прогресса поражает: путь от решения школьных математических задач до доминирования в олимпиадном кодинге занял у моделей всего около года.
Чен привел в пример современное поколение старшеклассников, для которых дефолтным подходом к разработке стал так называемый «vibe coding» (интуитивное программирование, когда человек лишь задает вектор и оценивает результат, а всю механическую работу выполняет нейросеть). Написание кода с нуля руками кажется им странным и архаичным концептом. Спикеры выразили надежду, что в обозримом будущем аналогичным образом сформируется и культура «vibe researching» — высокоуровневого управления научными исследованиями через ИИ.
🎯 Философия исследователя: вера против честного поиска истины 21:44
Отвечая на вопрос о качествах великого ученого, Якуб Пахоцкий выделил упорство (persistence) как абсолютный фундамент успеха. Специфика настоящей науки в том, что исследователь всегда пытается нащупать неизвестное, заведомо находясь в ситуации, где большинство гипотез окажутся ошибочными. Для этого необходима ментальная готовность к постоянным неудачам и способность извлекать из них уроки.
Самой опасной ловушкой для ума Пахоцкий считает подсознательное стремление подтасовать факты или эксперименты, чтобы во что бы то ни стало доказать жизнеспособность своей идеи (force-proving). Настоящий исследователь должен балансировать между глубокой верой в значимость своей концепции (conviction) и максимальной честностью перед самим собой в моменты, когда она объективно не работает (truth-seeking). Спикер подчеркнул, что эти два понятия не находятся в состоянии жесткого конфликта — они должны дополнять друг друга.
Марк Чен добавил, что важным элементом является управление собственным эмоциональным состоянием на долгой дистанции. Опыт помогает понять, за какие неподъемные задачи браться еще рано, а какие слишком просты, чтобы приносить удовлетворение.
В процессе обучения GPT-5 команда регулярно сталкивалась с кризисными моментами. По свидетельству спикеров, главным невидимым врагом прогресса остаются скрытые программные ошибки (bugs). Глупый баг в кодовой базе может месяцами незаметно искажать результаты сотен экспериментов. Обнаружение такой системной ошибки зачастую оборачивается куда более важным прорывом, чем создание новой теоретической модели.
Не менее опасны и ментальные баги — искаженные базовые предпосылки, из-за которых команда изначально идет по неверному пути. Преодоление таких концептуальных тупиков требует готовности пересобирать фреймворки с чистого листа.
🏢 Культура OpenAI: защита фундаментальной науки от давления рынка 27:12
В условиях жесткой «войны за таланты» в Кремниевой долине Марк Чен сформулировал стратегический тезис OpenAI по удержанию лучших умов: компания сфокусирована исключительно на первопроходческих, фундаментальных исследованиях (fundamental research). Руководство принципиально отказывается от копирования чужих решений или оглядки на то, какие модели выпустили конкуренты.
Для сохранения темпов и устойчивости организации OpenAI выстроила внутреннюю систему институтов:
- Глубокая скамейка запасных (deep bench) и долгосрочная программа подготовки кадров, позволяющая выращивать сильных исследователей из специалистов смежных областей (физики, финансов, классического Computer Science). При найме компания ценит умение решать сверхсложные задачи и доводить их до конца, игнорируя медийную активность кандидатов в соцсетях.
- Диверсифицированный подход к типам исследователей. В команде успешно уживаются как чистые «генераторы идей» (генерирующие высокую альфу концептов, но не склонные к рутинной имплементации), так и системные экспериментаторы, способные педантично протестировать тысячи вариаций одной задумки.
Марк Чен видит свою ключевую задачу в том, чтобы оберегать ученых от давления со стороны продуктовых команд и рыночного хайпа. В условиях колоссального внимания к ИИ легко скатиться в бесконечную гонку за краткосрочными релизами ради выполнения планов. Исследователям необходимо давать ментальный комфорт и свободное пространство для размышлений о том, какими технологии станут через год или два.
Чтобы сбалансировать эти процессы, OpenAI четко разделяет полномочия: часть ученых напрямую отвечает за успех коммерческих продуктов и координирует свои действия с лидерами бизнеса, в то время как ядро лаборатории сосредоточено на долгосрочных алгоритмических прорывах.
Что касается управления ресурсами, Пахоцкий и Чен осуществляют гибкий портфельный менеджмент. На вопрос ведущих о том, куда бы они направили дополнительные 10% ресурсов, оба руководителя без колебаний выбрали закупку вычислительных мощностей (compute). Якуб Пахоцкий выразил скепсис по поводу модной теории о скором наступлении «дефицита данных» (data constraint). По его опыту, объемы доступных вычислений по-прежнему остаются главным определяющим фактором и «судьбой» любого ИИ-института.
🤝 Химия соавторства: история доверия лидеров OpenAI 48:58
Успех исследовательской экосистемы OpenAI во многом держится на уникальном синергетическом эффекте взаимодействия Марка Чена и Якуба Пахоцкого. Их личное доверие и рабочая химия давно стали константой для сотрудников компании.
История их плотного сотрудничества началась в период, когда направление логических рассуждений (reasoning) в ИИ еще не было популярным трендом в Долине и воспринималось многими скептически. Обнаружив первые «проблески надежды» в экспериментах, они вдвоем начали развивать это направление, превратив со временем крошечную инициативу в масштабный технологический стек компании.
В завершение беседы спикеры обменялись профессиональными комплиментами:
- Марк Чен выделил феноменальную способность Якуба Пахоцкого лично изолироваться на две недели с тяжелейшей технической проблемой и полностью «раздавить» ее, сочетая невероятный кругозор с хирургической глубиной погружения.
- Якуб Пахоцкий, в свою очередь, восхитился талантом Марка Чена как организационного лидера. Чен сумел собрать разрозненные группы ученых, занимавшихся совершенно разными проектами, и выстроить из них команду с потрясающей внутренней химией, умудряясь удерживать фокус и идеальный баланс посреди хаоса разнонаправленных исследовательских векторов.
Ведущие резюмировали, что дуэт Чена и Пахоцкого продолжает классическую научную традицию великих парных коллабораций, которая на этот раз двигает вперед фронтир искусственного интеллекта.