# GPT-5 и эра агентов: Кристина Ким о том, почему «данные — это новая таблетка»

Источник: https://www.youtube.com/watch?v=k6DM-sgYu8M
Канал: a16z (Andreessen Horowitz)
Опубликовано: 08.08.2025

---

Исследователи OpenAI Кристина Ким и Айза Фулфорд в подкасте a16z обсуждают запуск GPT-5, новую эру ИИ-агентов и фундаментальные изменения в разработке моделей. В центре дискуссии — переход от простых чат-ботов к автономным системам, способным выполнять многочасовые задачи, и почему качество данных сегодня важнее вычислительных мощностей.

## 🚀 Новый стандарт полезности: GPT-5 и прорыв в кодинге
[[JUMP:00:00]]

Кристина Ким и Айза Фулфорд подчеркивают, что главной целью при создании новой итерации GPT было сделать модель максимально полезной для широкого круга пользователей [00:12]. По мнению Кристины Ким, GPT-5 представляет собой «ступенчатый переход» (step change) в возможностях написания кода и текстов [02:13]. 

Особое внимание в разработке было уделено фронтенд-разработке. Исследователи отмечают:

*   Модель демонстрирует качественно иной уровень эстетики и понимания дизайна интерфейсов [03:45].
*   Результаты превосходят показатели предыдущей модели 03 в части создания интерактивных веб-приложений [03:45].
*   Майкл Тролл (Michael Troll) на презентации подтвердил статус новой модели как лучшего решения для кодинга на рынке [02:39].

Кристина Ким утверждает, что такой прогресс стал возможен не только благодаря алгоритмам, но и благодаря «буквально фанатичному вниманию» команды к качеству наборов данных и моделей вознаграждения (reward models) [02:52]. Она считает, что для нетехнических специалистов наступает «эра идей», когда создание полноценного приложения занимает минуты вместо недель [08:31].

## 🧠 Искусство пост-обучения и борьба с «галлюцинациями»
[[JUMP:04:12]]

Пост-обучение (post-training) в OpenAI рассматривают скорее как искусство, требующее поиска баланса между противоречивыми характеристиками [04:51]. Кристина Ким отмечает, что при разработке GPT-5 команда намеренно боролась с проблемой «поддакивания» (sycophancy) — когда модель пытается угодить пользователю, даже если тот неправ [04:24].

Ключевые аспекты поведения модели:

1.  **Снижение уровня обмана и галлюцинаций.** Ким считает эти проблемы взаимосвязанными: модель часто «лжет» из желания быть полезной в моменте [05:43].
2.  **Эффект «размышления».** Благодаря способности рассуждать шаг за шагом (chain of thought), модель делает паузу перед ответом, что резко снижает количество ошибок [06:10].
3.  **Здоровая вовлеченность.** Исследователи стремятся сделать помощника полезным, но не «чрезмерно приторным» или навязчивым [05:04].

Айза Фулфорд добавляет, что обучение конкретным навыкам через обучение с подкреплением (RL) стало чрезвычайно эффективным с точки зрения использования данных: для обучения новому сложному поведению требуется гораздо меньше примеров, чем раньше [07:14].

## 🤖 Агенты: от ответов на вопросы к автономной работе
[[JUMP:13:28]]

Айза Фулфорд, возглавляющая направление Deep Research, определяет ИИ-агента как систему, способную выполнять полезную работу асинхронно [23:19]. Это означает, что пользователь может поставить задачу и вернуться позже за результатом или уточняющим вопросом [23:32].

Дорожная карта развития агентов OpenAI включает:

*   **Синтез информации.** Глубокие исследования (Deep Research) в интернете и работа с приватными данными пользователя [24:09].
*   **Создание артефактов.** Работа с документами, презентациями и электронными таблицами [24:22].
*   **Реальные действия.** Бронирование поездок, шоппинг и планирование календаря [24:34].

Айза Фулфорд признает, что на текущем этапе компания придерживается консервативного подхода: агент всегда запрашивает подтверждение перед выполнением необратимых действий, таких как отправка письма или покупка [21:07]. Однако, по её мнению, по мере роста доверия пользователи разрешат моделям действовать более самостоятельно [21:19].

## 💊 Концепция «Data Pill» и важность RL-сред
[[JUMP:14:28]]

В дискуссии об архитектуре и масштабировании Кристина Ким называет себя сторонником «таблетки данных» (data pill) [14:28]. Она убеждена, что именно качество данных и продуманность задач являются решающими факторами успеха. Айза Фулфорд согласна с этим, отмечая, что высокое качество Deep Research — результат тщательной курации данных [14:44].

Основным препятствием для создания по-настоящему надежных агентов исследователи считают отсутствие реалистичных сред для обучения с подкреплением (RL environments) [15:11]. 

*   Кристина Ким считает, что для обучения модели использованию компьютера нужно создавать сложные симуляции задач [15:51].
*   Айза Фулфорд отмечает, что хотя браузер и терминал позволяют выполнять почти любые задачи, модели нужно «видеть» тысячи примеров их использования, которых нет в открытом доступе [16:43].
*   Решением становится «бутстрэппинг» (bootstrapping): использование текущих хороших моделей для генерации данных для обучения следующих, ещё более совершенных систем [31:47].

## 🔄 Mid-training: промежуточное звено эволюции
[[JUMP:31:47]]

Кристина Ким разъяснила понятие «mid-training» — этапа, который происходит после массивного пре-тренинга, но до финального пост-обучения [31:59]. 

*   Это позволяет расширить интеллект модели без запуска гигантских вычислительных кластеров с нуля [32:12].
*   Основная цель этого этапа — обновление базы знаний модели (knowledge cutoff), чтобы она знала о событиях, произошедших после завершения основного цикла обучения [32:26].

## 📈 Эволюция OpenAI: от 10 инженеров до мирового гиганта
[[JUMP:36:43]]

Кристина Ким, работающая в компании 4 года, вспоминает, что в начале её пути команда прикладных разработок состояла всего из 10 инженеров [36:56]. До запуска ChatGPT многие считали чат-ботов бесперспективным направлением. Ким рассказала, что поняла масштаб происходящего, когда её соседи по комнате (тоже ИИ-исследователи) начали использовать прототип ChatGPT буквально круглосуточно [34:21].

По мнению Кристины Ким, закон масштабирования (scaling laws), описанный в контексте GPT-3, стал для неё моментом истины: если эта экспонента верна, то в мире нет ничего более важного, на что стоило бы тратить жизнь [35:00].

Несмотря на рост штата с 200 человек до нескольких тысяч, внутри OpenAI сохраняется культура стартапа [37:34]. Айза Фулфорд подчеркивает, что исследовательские команды остаются маленькими и гибкими: например, над проектом Deep Research изначально работало всего два человека [38:13].

## 🎨 «Вкус» исследователя как бритва Оккама
[[JUMP:40:12]]

В OpenAI высоко ценится «вкус» (taste) исследователя. Кристина Ким полагает, что в мире, где стоимость производства контента и кода стремится к нулю, правильная интуиция и выбор направления становятся важнее, чем когда-либо [40:38].

Айза Фулфорд считает, что хороший вкус в исследованиях проявляется в упрощении:

*   Лучшее решение — это часто «самая глупая» или самая простая вещь, которую можно попробовать [41:04].
*   Сложность часто кроется в деталях гиперпараметров, но сама концепция должна быть прозрачной [41:30].
*   Исследователи сошлись во мнении, что в ретроспективе самые успешные релизы OpenAI всегда кажутся очевидными [41:18].