GPT-5 и эра агентов: Кристина Ким о том, почему «данные — это новая таблетка»

a16z (Andreessen Horowitz) 15,4 тыс. 42 мин 4 мин 08.08.2025
Главное

Исследователи OpenAI Кристина Ким и Айза Фулфорд в подкасте a16z обсуждают запуск GPT-5, новую эру ИИ-агентов и фундаментальные изменения в разработке моделей. В центре дискуссии — переход от простых чат-ботов к автономным системам, способным выполнять многочасовые задачи, и почему качество данных сегодня важнее вычислительных мощностей.

🚀 Новый стандарт полезности: GPT-5 и прорыв в кодинге 0:00

Кристина Ким и Айза Фулфорд подчеркивают, что главной целью при создании новой итерации GPT было сделать модель максимально полезной для широкого круга пользователей . По мнению Кристины Ким, GPT-5 представляет собой «ступенчатый переход» (step change) в возможностях написания кода и текстов .

Особое внимание в разработке было уделено фронтенд-разработке. Исследователи отмечают:

Кристина Ким утверждает, что такой прогресс стал возможен не только благодаря алгоритмам, но и благодаря «буквально фанатичному вниманию» команды к качеству наборов данных и моделей вознаграждения (reward models) . Она считает, что для нетехнических специалистов наступает «эра идей», когда создание полноценного приложения занимает минуты вместо недель .

🧠 Искусство пост-обучения и борьба с «галлюцинациями» 4:12

Пост-обучение (post-training) в OpenAI рассматривают скорее как искусство, требующее поиска баланса между противоречивыми характеристиками . Кристина Ким отмечает, что при разработке GPT-5 команда намеренно боролась с проблемой «поддакивания» (sycophancy) — когда модель пытается угодить пользователю, даже если тот неправ .

Ключевые аспекты поведения модели:

  1. Снижение уровня обмана и галлюцинаций. Ким считает эти проблемы взаимосвязанными: модель часто «лжет» из желания быть полезной в моменте .
  2. Эффект «размышления». Благодаря способности рассуждать шаг за шагом (chain of thought), модель делает паузу перед ответом, что резко снижает количество ошибок .
  3. Здоровая вовлеченность. Исследователи стремятся сделать помощника полезным, но не «чрезмерно приторным» или навязчивым .

Айза Фулфорд добавляет, что обучение конкретным навыкам через обучение с подкреплением (RL) стало чрезвычайно эффективным с точки зрения использования данных: для обучения новому сложному поведению требуется гораздо меньше примеров, чем раньше .

🤖 Агенты: от ответов на вопросы к автономной работе 13:28

Айза Фулфорд, возглавляющая направление Deep Research, определяет ИИ-агента как систему, способную выполнять полезную работу асинхронно . Это означает, что пользователь может поставить задачу и вернуться позже за результатом или уточняющим вопросом .

Дорожная карта развития агентов OpenAI включает:

Айза Фулфорд признает, что на текущем этапе компания придерживается консервативного подхода: агент всегда запрашивает подтверждение перед выполнением необратимых действий, таких как отправка письма или покупка . Однако, по её мнению, по мере роста доверия пользователи разрешат моделям действовать более самостоятельно .

💊 Концепция «Data Pill» и важность RL-сред 14:28

В дискуссии об архитектуре и масштабировании Кристина Ким называет себя сторонником «таблетки данных» (data pill) . Она убеждена, что именно качество данных и продуманность задач являются решающими факторами успеха. Айза Фулфорд согласна с этим, отмечая, что высокое качество Deep Research — результат тщательной курации данных .

Основным препятствием для создания по-настоящему надежных агентов исследователи считают отсутствие реалистичных сред для обучения с подкреплением (RL environments) .

🔄 Mid-training: промежуточное звено эволюции 31:47

Кристина Ким разъяснила понятие «mid-training» — этапа, который происходит после массивного пре-тренинга, но до финального пост-обучения .

📈 Эволюция OpenAI: от 10 инженеров до мирового гиганта 36:43

Кристина Ким, работающая в компании 4 года, вспоминает, что в начале её пути команда прикладных разработок состояла всего из 10 инженеров . До запуска ChatGPT многие считали чат-ботов бесперспективным направлением. Ким рассказала, что поняла масштаб происходящего, когда её соседи по комнате (тоже ИИ-исследователи) начали использовать прототип ChatGPT буквально круглосуточно .

По мнению Кристины Ким, закон масштабирования (scaling laws), описанный в контексте GPT-3, стал для неё моментом истины: если эта экспонента верна, то в мире нет ничего более важного, на что стоило бы тратить жизнь .

Несмотря на рост штата с 200 человек до нескольких тысяч, внутри OpenAI сохраняется культура стартапа . Айза Фулфорд подчеркивает, что исследовательские команды остаются маленькими и гибкими: например, над проектом Deep Research изначально работало всего два человека .

🎨 «Вкус» исследователя как бритва Оккама 40:12

В OpenAI высоко ценится «вкус» (taste) исследователя. Кристина Ким полагает, что в мире, где стоимость производства контента и кода стремится к нулю, правильная интуиция и выбор направления становятся важнее, чем когда-либо .

Айза Фулфорд считает, что хороший вкус в исследованиях проявляется в упрощении:

💬 Цитаты

«Если эта экспонента верна, то нет ничего другого, на что я хотела бы тратить свою жизнь.»

Кристина Ким 35:00

«Хороший вкус исследователя — это упрощение проблемы до самой тупой или самой простой вещи, которую можно сделать.»

Айза Фулфорд 41:04
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Post-training
Этап настройки уже обученной модели для придания ей нужного поведения и стиля общения.
Sycophancy
Склонность модели соглашаться с пользователем, даже если он ошибается, ради «вежливости».
Mid-training
Промежуточный этап обучения между созданием базы и финальной настройкой для обновления знаний.
Bootstrapping
Процесс использования текущей версии ИИ для создания данных, на которых будет учиться следующая версия.
📊 Цифры
🗓 Хронология
  1. 2021 Начало инвестиций фонда a16z в OpenAI.
  2. 4 года назад Кристина Ким присоединяется к OpenAI и начинает работу над WebGPT.
  3. День записи Официальный запуск новых моделей и функций агентов (GPT-5/Operator).
⚖️ Другая сторона
Искусственный интеллект OpenAI GPT-5 Deep Research Кристина Ким Айза Фулфорд