Шерман Ву: «Эпоха одной универсальной модели ИИ подошла к концу»

a16z (Andreessen Horowitz) 9,8 тыс. 53 мин 5 мин 28.11.2025
Главное

В новом эпизоде подкаста a16z Шерман Ву, руководитель инженерного направления платформы для разработчиков в OpenAI, делится инсайдами о внутренней кухне компании, управляющей одним из самых быстрорастущих продуктов в истории. В центре дискуссии — фундаментальный сдвиг в стратегии: переход от идеи «одной универсальной модели для всего» к экосистеме специализированных ИИ-инструментов. Ву объясняет, как OpenAI балансирует между развитием ChatGPT и поддержкой сторонних разработчиков, зачем компании понадобился Reinforcement Fine-Tuning и почему открытый исходный код не угрожает бизнес-модели технологического гиганта.

👨‍💻 Путь в OpenAI: от ранней Quora до оценки недвижимости 0:40

Шерман Ву присоединился к OpenAI в 2022 году, чтобы возглавить разработку API — на тот момент единственного продукта компании . Его карьера в Кремниевой долине началась в Quora, где он работал над ранжированием новостной ленты в команде, ставшей «кузницей кадров» для современной ИИ-индустрии . По словам Ву, в то время в Quora работали будущие основатели Perplexity и Scale AI, а сам он попал в компанию благодаря оплачиваемой стажировке во время учебы в MIT .

До прихода в OpenAI Ву шесть лет провел в компании Open Door, где руководил командой по ML-ценообразованию .

📈 Масштаб 800 миллионов: стратегия двух фронтов 8:40

OpenAI занимает уникальное положение на рынке, развиваясь одновременно в двух направлениях: как «горизонтальная» платформа (API для разработчиков) и как «вертикальный» потребительский сервис (ChatGPT) . Хост подкаста отмечает, что это крайне необычно для компании на столь ранней стадии развития.

Шерман Ву приводит впечатляющую статистику:

По мнению Ву, между API и ChatGPT существует определенное внутреннее напряжение, но основатели Сэм Альтман и Грег Брокман придерживаются принципа широкого распространения выгод от ИИ . Ву утверждает, что компания не боится конкуренции со стороны разработчиков, использующих их API, поскольку быстрый рост рынка снимает большинство конфликтов интересов .

🧬 Конец эпохи «Единой Модели» и специализация 17:32

Одним из главных откровений дискуссии стал отказ от концепции «одной модели, которая правит всеми» . Всего три года назад внутри OpenAI считалось, что AGI (общий искусственный интеллект) будет представлен одной гигантской нейросетью, которая поглотит все частные случаи использования .

Сегодня позиция изменилась:

  1. Пролиферация моделей. Становится очевидным, что в будущем будет существовать множество специализированных моделей под конкретные задачи .
  2. Удержание пользователей. Вопреки ожиданиям, модели ИИ оказалось сложно заменить (дизинтермедиация). По мнению Ву, разработчики глубоко интегрируют конкретные модели (например, GPT-4o) в свои рабочие процессы, создавая уникальную «обвязку», которую трудно перенести на другую платформу .
  3. Портфельный подход. OpenAI уже предлагает разные инструменты: GPT-4, o1 (модель для рассуждений), Sora (видео) и специализированные модели для кодинга .

🛠️ Новая волна кастомизации: Reinforcement Fine-Tuning 20:59

Шерман Ву считает, что компании сегодня сидят на «кладах данных», которые они хотят использовать для получения конкурентного преимущества в ИИ-гонке . Если раньше дообучение (fine-tuning) ограничивалось изменением тона общения нейросети, то теперь OpenAI открывает доступ к более мощным инструментам.

Ключевым технологическим «разблокировщиком» стал Reinforcement Fine-Tuning (RFT) — дообучение с подкреплением .

Ву также отмечает эволюцию взглядов на промпт-инжиниринг. В 2022 году многие считали, что он исчезнет по мере совершенствования моделей . Однако сегодня фокус сместился на «контекст-инжиниринг»: управление тем, какие инструменты и данные модель извлекает из контекстного окна для решения задачи .

🤖 Агенты и «Laundering» интеллекта 27:03

Обсуждая будущее ИИ-агентов, Ву определяет их как системы, способные действовать от имени пользователя на длинных временных горизонтах . В OpenAI не выделяют «агентов» в отдельную команду — это сквозная технология для всех интерфейсов: ChatGPT, API и нового Agent Builder .

Интересные наблюдения Ву о природе рынка ИИ:

🧩 Философия Agent Builder и корпоративные стандарты 45:48

Недавно запущенный OpenAI инструмент Agent Builder вызвал дискуссии из-за использования детерминированных «узлов» (nodes) вместо полной свободы действий модели . Ву объясняет это прагматизмом.

Существует два типа работы, которые нужно автоматизировать:

  1. Исследовательская работа. Как у программистов: высокая неопределенность, движение к цели через пробы и ошибки .
  2. Процедурная работа (SOP). Клиентская поддержка, маркетинг, продажи. Здесь критически важно строгое соблюдение стандартных операционных процедур (СОП) .

Ву утверждает, что в регулируемых отраслях и корпоративном секторе «галлюцинации» и отклонения от сценария недопустимы. Инструмент с жесткой логикой позволяет гарантировать, что агент не выйдет за рамки дозволенного .

🔓 Open Source и экономика инференса 36:36

Несмотря на репутацию закрытой компании, OpenAI выпустила в открытый доступ некоторые инструменты, например GPOSS . Шерман Ву лично поддерживает open-source и утверждает, что Сэм Альтман также разделяет этот взгляд, а задержки были связаны с нехваткой вычислительных мощностей .

Ву выделяет несколько причин, почему открытые веса (open weights) не вредят бизнесу OpenAI:

💰 Эволюция ценообразования: от подписки к результату? 31:55

Ву считает, что переход от оплаты за софт (SaaS) к оплате за использование (usage-based) в API — это «храповик с односторонним движением» (one-way ratchet) . Раз попробовав платить за реальную пользу, компании не возвращаются к фиксированным лицензиям.

Перспективным направлением считается Outcome-based pricing (оплата за результат), но у этого подхода есть сложности:

💬 Цитаты

«Внутри OpenAI считалось, что будет одна модель, которая правит всеми. Сейчас это полностью изменилось: очевидно, что будет множество специализированных моделей.»

Шерман Ву 18:11

«Ценообразование на основе использования — это храповик с односторонним движением: попробовав его, вы уже не вернетесь назад.»

Шерман Ву 34:29
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RFT (Reinforcement Fine-Tuning)
Метод дообучения модели с использованием обучения с подкреплением для достижения максимальной точности в узких задачах.
SOP (Standard Operating Procedure)
Стандартная операционная процедура — четкий набор инструкций для выполнения повторяющихся рабочих задач.
Инференс (Inference)
Процесс работы уже обученной нейросети по выдаче ответов на запросы пользователей.
SOTA (State-of-the-Art)
Наивысший уровень развития технологии или точности модели в конкретной области на текущий момент.
📊 Цифры
🗓 Хронология
  1. 2013 Шерман Ву проходит стажировку в Quora во время учебы в MIT.
  2. 2022 Ву присоединяется к OpenAI для работы над API.
  3. Октябрь 2024 Запуск OpenAI Agent Builder на конференции DevDay.
⚖️ Другая сторона
Искусственный интеллект OpenAI Sherman Woo ChatGPT Reinforcement Fine-Tuning API