Шерман Ву: «Эпоха одной универсальной модели ИИ подошла к концу»

В новом эпизоде подкаста a16z Шерман Ву, руководитель инженерного направления платформы для разработчиков в OpenAI, делится инсайдами о внутренней кухне компании, управляющей одним из самых быстрорастущих продуктов в истории. В центре дискуссии — фундаментальный сдвиг в стратегии: переход от идеи «одной универсальной модели для всего» к экосистеме специализированных ИИ-инструментов. Ву объясняет, как OpenAI балансирует между развитием ChatGPT и поддержкой сторонних разработчиков, зачем компании понадобился Reinforcement Fine-Tuning и почему открытый исходный код не угрожает бизнес-модели технологического гиганта.

👨‍💻 Путь в OpenAI: от ранней Quora до оценки недвижимости 0:40

Шерман Ву присоединился к OpenAI в 2022 году, чтобы возглавить разработку API — на тот момент единственного продукта компании . Его карьера в Кремниевой долине началась в Quora, где он работал над ранжированием новостной ленты в команде, ставшей «кузницей кадров» для современной ИИ-индустрии . По словам Ву, в то время в Quora работали будущие основатели Perplexity и Scale AI, а сам он попал в компанию благодаря оплачиваемой стажировке во время учебы в MIT .

До прихода в OpenAI Ву шесть лет провел в компании Open Door, где руководил командой по ML-ценообразованию .

Задачей Ву было определение стоимости жилых домов, которые компания покупала за наличные.
Это была сложная техническая проблема с высокими рисками: ошибка в модели могла привести к огромным убыткам из-за стоимости владения активами .
Ву отмечает огромный контраст между низкомаржинальным бизнесом в сфере недвижимости и работой в OpenAI .

📈 Масштаб 800 миллионов: стратегия двух фронтов 8:40

OpenAI занимает уникальное положение на рынке, развиваясь одновременно в двух направлениях: как «горизонтальная» платформа (API для разработчиков) и как «вертикальный» потребительский сервис (ChatGPT) . Хост подкаста отмечает, что это крайне необычно для компании на столь ранней стадии развития.

Шерман Ву приводит впечатляющую статистику:

Еженедельно ChatGPT пользуется около 10% населения земного шара — это примерно 800 миллионов человек .
Рост аудитории происходит невероятными темпами, что Ву называет «историческим событием» .

По мнению Ву, между API и ChatGPT существует определенное внутреннее напряжение, но основатели Сэм Альтман и Грег Брокман придерживаются принципа широкого распространения выгод от ИИ . Ву утверждает, что компания не боится конкуренции со стороны разработчиков, использующих их API, поскольку быстрый рост рынка снимает большинство конфликтов интересов .

🧬 Конец эпохи «Единой Модели» и специализация 17:32

Одним из главных откровений дискуссии стал отказ от концепции «одной модели, которая правит всеми» . Всего три года назад внутри OpenAI считалось, что AGI (общий искусственный интеллект) будет представлен одной гигантской нейросетью, которая поглотит все частные случаи использования .

Сегодня позиция изменилась:

Пролиферация моделей. Становится очевидным, что в будущем будет существовать множество специализированных моделей под конкретные задачи .
Удержание пользователей. Вопреки ожиданиям, модели ИИ оказалось сложно заменить (дизинтермедиация). По мнению Ву, разработчики глубоко интегрируют конкретные модели (например, GPT-4o) в свои рабочие процессы, создавая уникальную «обвязку», которую трудно перенести на другую платформу .
Портфельный подход. OpenAI уже предлагает разные инструменты: GPT-4, o1 (модель для рассуждений), Sora (видео) и специализированные модели для кодинга .

🛠️ Новая волна кастомизации: Reinforcement Fine-Tuning 20:59

Шерман Ву считает, что компании сегодня сидят на «кладах данных», которые они хотят использовать для получения конкурентного преимущества в ИИ-гонке . Если раньше дообучение (fine-tuning) ограничивалось изменением тона общения нейросети, то теперь OpenAI открывает доступ к более мощным инструментам.

Ключевым технологическим «разблокировщиком» стал Reinforcement Fine-Tuning (RFT) — дообучение с подкреплением .

В отличие от обычного обучения на примерах (SFT), RFT позволяет доводить модель до уровня SOTA (state-of-the-art) в конкретных узких областях .
OpenAI начала пилотировать модель ценообразования, при которой компании могут получить скидки на инференс или бесплатное обучение, если согласятся делиться данными для улучшения общих моделей (по желанию заказчика) .

Ву также отмечает эволюцию взглядов на промпт-инжиниринг. В 2022 году многие считали, что он исчезнет по мере совершенствования моделей . Однако сегодня фокус сместился на «контекст-инжиниринг»: управление тем, какие инструменты и данные модель извлекает из контекстного окна для решения задачи .

🤖 Агенты и «Laundering» интеллекта 27:03

Обсуждая будущее ИИ-агентов, Ву определяет их как системы, способные действовать от имени пользователя на длинных временных горизонтах . В OpenAI не выделяют «агентов» в отдельную команду — это сквозная технология для всех интерфейсов: ChatGPT, API и нового Agent Builder .

Интересные наблюдения Ву о природе рынка ИИ:

Большая часть экономики ИИ сегодня — это «отмывание токенов» (token laundering): попытки превратить естественный язык на входе в полезное действие или интеллект на выходе .
По мнению Ву, ИИ-модели крайне устойчивы к созданию промежуточных программных слоев (layering). Прямой доступ к «мозгам» модели остается самой ценной частью продукта .

🧩 Философия Agent Builder и корпоративные стандарты 45:48

Недавно запущенный OpenAI инструмент Agent Builder вызвал дискуссии из-за использования детерминированных «узлов» (nodes) вместо полной свободы действий модели . Ву объясняет это прагматизмом.

Существует два типа работы, которые нужно автоматизировать:

Исследовательская работа. Как у программистов: высокая неопределенность, движение к цели через пробы и ошибки .
Процедурная работа (SOP). Клиентская поддержка, маркетинг, продажи. Здесь критически важно строгое соблюдение стандартных операционных процедур (СОП) .

Ву утверждает, что в регулируемых отраслях и корпоративном секторе «галлюцинации» и отклонения от сценария недопустимы. Инструмент с жесткой логикой позволяет гарантировать, что агент не выйдет за рамки дозволенного .

🔓 Open Source и экономика инференса 36:36

Несмотря на репутацию закрытой компании, OpenAI выпустила в открытый доступ некоторые инструменты, например GPOSS . Шерман Ву лично поддерживает open-source и утверждает, что Сэм Альтман также разделяет этот взгляд, а задержки были связаны с нехваткой вычислительных мощностей .

Ву выделяет несколько причин, почему открытые веса (open weights) не вредят бизнесу OpenAI:

Отсутствие каннибализации. Пользователи открытых моделей и API — это разные сегменты рынка с разными задачами .
Сложность инференса. Даже если OpenAI откроет веса GPT-5, поддерживать работу такой модели на скорости и в масштабе, доступном OpenAI, сторонним компаниям будет невероятно сложно .
Сложные обратные связи. Существует тесная связь между командами обучения и инференса, которая позволяет оптимизировать работу моделей способами, недоступными при простом скачивании весов .

💰 Эволюция ценообразования: от подписки к результату? 31:55

Ву считает, что переход от оплаты за софт (SaaS) к оплате за использование (usage-based) в API — это «храповик с односторонним движением» (one-way ratchet) . Раз попробовав платить за реальную пользу, компании не возвращаются к фиксированным лицензиям.

Перспективным направлением считается Outcome-based pricing (оплата за результат), но у этого подхода есть сложности:

По мнению Ву, использование вычислительных мощностей (test-time compute) в новых моделях рассуждений уже сильно коррелирует с ценностью результата .
Если модель «думает» дольше и потребляет больше токенов, чтобы выдать правильный ответ, оплата по факту использования фактически превращается в оплату за результат .