# Шерман Ву: «Эпоха одной универсальной модели ИИ подошла к концу»

Источник: https://www.youtube.com/watch?v=3x0jhpEj_6o
Канал: a16z (Andreessen Horowitz)
Опубликовано: 28.11.2025

---

В новом эпизоде подкаста a16z Шерман Ву, руководитель инженерного направления платформы для разработчиков в OpenAI, делится инсайдами о внутренней кухне компании, управляющей одним из самых быстрорастущих продуктов в истории. В центре дискуссии — фундаментальный сдвиг в стратегии: переход от идеи «одной универсальной модели для всего» к экосистеме специализированных ИИ-инструментов. Ву объясняет, как OpenAI балансирует между развитием ChatGPT и поддержкой сторонних разработчиков, зачем компании понадобился Reinforcement Fine-Tuning и почему открытый исходный код не угрожает бизнес-модели технологического гиганта.

## 👨‍💻 Путь в OpenAI: от ранней Quora до оценки недвижимости
[[JUMP:00:40]]

Шерман Ву присоединился к OpenAI в 2022 году, чтобы возглавить разработку API — на тот момент единственного продукта компании [02:07]. Его карьера в Кремниевой долине началась в Quora, где он работал над ранжированием новостной ленты в команде, ставшей «кузницей кадров» для современной ИИ-индустрии [05:24]. По словам Ву, в то время в Quora работали будущие основатели Perplexity и Scale AI, а сам он попал в компанию благодаря оплачиваемой стажировке во время учебы в MIT [06:57].

До прихода в OpenAI Ву шесть лет провел в компании Open Door, где руководил командой по ML-ценообразованию [02:20].

*   Задачей Ву было определение стоимости жилых домов, которые компания покупала за наличные.
*   Это была сложная техническая проблема с высокими рисками: ошибка в модели могла привести к огромным убыткам из-за стоимости владения активами [03:53].
*   Ву отмечает огромный контраст между низкомаржинальным бизнесом в сфере недвижимости и работой в OpenAI [04:45].

## 📈 Масштаб 800 миллионов: стратегия двух фронтов
[[JUMP:08:40]]

OpenAI занимает уникальное положение на рынке, развиваясь одновременно в двух направлениях: как «горизонтальная» платформа (API для разработчиков) и как «вертикальный» потребительский сервис (ChatGPT) [09:07]. Хост подкаста отмечает, что это крайне необычно для компании на столь ранней стадии развития.

Шерман Ву приводит впечатляющую статистику:

*   Еженедельно ChatGPT пользуется около 10% населения земного шара — это примерно 800 миллионов человек [10:37].
*   Рост аудитории происходит невероятными темпами, что Ву называет «историческим событием» [10:24].

По мнению Ву, между API и ChatGPT существует определенное внутреннее напряжение, но основатели Сэм Альтман и Грег Брокман придерживаются принципа широкого распространения выгод от ИИ [09:46]. Ву утверждает, что компания не боится конкуренции со стороны разработчиков, использующих их API, поскольку быстрый рост рынка снимает большинство конфликтов интересов [12:06].

## 🧬 Конец эпохи «Единой Модели» и специализация
[[JUMP:17:32]]

Одним из главных откровений дискуссии стал отказ от концепции «одной модели, которая правит всеми» [17:58]. Всего три года назад внутри OpenAI считалось, что AGI (общий искусственный интеллект) будет представлен одной гигантской нейросетью, которая поглотит все частные случаи использования [18:11].

Сегодня позиция изменилась:

1.  **Пролиферация моделей.** Становится очевидным, что в будущем будет существовать множество специализированных моделей под конкретные задачи [18:23].
2.  **Удержание пользователей.** Вопреки ожиданиям, модели ИИ оказалось сложно заменить (дизинтермедиация). По мнению Ву, разработчики глубоко интегрируют конкретные модели (например, GPT-4o) в свои рабочие процессы, создавая уникальную «обвязку», которую трудно перенести на другую платформу [15:49].
3.  **Портфельный подход.** OpenAI уже предлагает разные инструменты: GPT-4, o1 (модель для рассуждений), Sora (видео) и специализированные модели для кодинга [18:36].

## 🛠️ Новая волна кастомизации: Reinforcement Fine-Tuning
[[JUMP:20:59]]

Шерман Ву считает, что компании сегодня сидят на «кладах данных», которые они хотят использовать для получения конкурентного преимущества в ИИ-гонке [21:25]. Если раньше дообучение (fine-tuning) ограничивалось изменением тона общения нейросети, то теперь OpenAI открывает доступ к более мощным инструментам.

Ключевым технологическим «разблокировщиком» стал **Reinforcement Fine-Tuning (RFT)** — дообучение с подкреплением [22:15].

*   В отличие от обычного обучения на примерах (SFT), RFT позволяет доводить модель до уровня SOTA (state-of-the-art) в конкретных узких областях [23:34].
*   OpenAI начала пилотировать модель ценообразования, при которой компании могут получить скидки на инференс или бесплатное обучение, если согласятся делиться данными для улучшения общих моделей (по желанию заказчика) [24:28].

Ву также отмечает эволюцию взглядов на промпт-инжиниринг. В 2022 году многие считали, что он исчезнет по мере совершенствования моделей [24:55]. Однако сегодня фокус сместился на «контекст-инжиниринг»: управление тем, какие инструменты и данные модель извлекает из контекстного окна для решения задачи [25:44].

## 🤖 Агенты и «Laundering» интеллекта
[[JUMP:27:03]]

Обсуждая будущее ИИ-агентов, Ву определяет их как системы, способные действовать от имени пользователя на длинных временных горизонтах [28:05]. В OpenAI не выделяют «агентов» в отдельную команду — это сквозная технология для всех интерфейсов: ChatGPT, API и нового Agent Builder [30:11].

Интересные наблюдения Ву о природе рынка ИИ:

*   Большая часть экономики ИИ сегодня — это «отмывание токенов» (token laundering): попытки превратить естественный язык на входе в полезное действие или интеллект на выходе [30:50].
*   По мнению Ву, ИИ-модели крайне устойчивы к созданию промежуточных программных слоев (layering). Прямой доступ к «мозгам» модели остается самой ценной частью продукта [31:02].

## 🧩 Философия Agent Builder и корпоративные стандарты
[[JUMP:45:48]]

Недавно запущенный OpenAI инструмент Agent Builder вызвал дискуссии из-за использования детерминированных «узлов» (nodes) вместо полной свободы действий модели [46:00]. Ву объясняет это прагматизмом.

Существует два типа работы, которые нужно автоматизировать:

1.  **Исследовательская работа.** Как у программистов: высокая неопределенность, движение к цели через пробы и ошибки [47:55].
2.  **Процедурная работа (SOP).** Клиентская поддержка, маркетинг, продажи. Здесь критически важно строгое соблюдение стандартных операционных процедур (СОП) [48:21].

Ву утверждает, что в регулируемых отраслях и корпоративном секторе «галлюцинации» и отклонения от сценария недопустимы. Инструмент с жесткой логикой позволяет гарантировать, что агент не выйдет за рамки дозволенного [52:37].

## 🔓 Open Source и экономика инференса
[[JUMP:36:36]]

Несмотря на репутацию закрытой компании, OpenAI выпустила в открытый доступ некоторые инструменты, например GPOSS [19:54]. Шерман Ву лично поддерживает open-source и утверждает, что Сэм Альтман также разделяет этот взгляд, а задержки были связаны с нехваткой вычислительных мощностей [37:38].

Ву выделяет несколько причин, почему открытые веса (open weights) не вредят бизнесу OpenAI:

*   **Отсутствие каннибализации.** Пользователи открытых моделей и API — это разные сегменты рынка с разными задачами [39:10].
*   **Сложность инференса.** Даже если OpenAI откроет веса GPT-5, поддерживать работу такой модели на скорости и в масштабе, доступном OpenAI, сторонним компаниям будет невероятно сложно [39:47].
*   **Сложные обратные связи.** Существует тесная связь между командами обучения и инференса, которая позволяет оптимизировать работу моделей способами, недоступными при простом скачивании весов [40:11].

## 💰 Эволюция ценообразования: от подписки к результату?
[[JUMP:31:55]]

Ву считает, что переход от оплаты за софт (SaaS) к оплате за использование (usage-based) в API — это «храповик с односторонним движением» (one-way ratchet) [34:29]. Раз попробовав платить за реальную пользу, компании не возвращаются к фиксированным лицензиям.

Перспективным направлением считается **Outcome-based pricing** (оплата за результат), но у этого подхода есть сложности:

*   По мнению Ву, использование вычислительных мощностей (test-time compute) в новых моделях рассуждений уже сильно коррелирует с ценностью результата [36:11].
*   Если модель «думает» дольше и потребляет больше токенов, чтобы выдать правильный ответ, оплата по факту использования фактически превращается в оплату за результат [36:23].