CPO OpenAI и Anthropic о будущем ИИ: от чатов к проактивным агентам и модели o1

Lenny's Podcast 130 тыс. 40 мин 5 мин 06.11.2024
Главное

В новом выпуске Lenny’s Podcast встретились два ключевых игрока индустрии искусственного интеллекта: Кевин Вейл (Kevin Weil), CPO компании OpenAI, и Майк Кригер (Mike Krieger), CPO компании Anthropic. В беседе с инвестором Сарой Го (Sarah Guo) они обсудили, как меняются подходы к созданию продуктов в эпоху ИИ, почему традиционные навыки продакт-менеджмента требуют переосмысления и как «разумность» моделей становится новым инструментом проектирования интерфейсов.

🔄 От Instagram до ИИ: смена парадигмы в разработке 1:09

Для обоих гостей переход в ИИ-лаборатории стал новым этапом после работы над массовыми социальными продуктами. Кевин Вейл, имеющий опыт работы в Twitter и Instagram, отмечает, что нынешняя роль — самая сложная и «бессонная» в его карьере . По его словам, главная особенность работы в OpenAI заключается в том, что технологическая база не зафиксирована: каждые два месяца компьютеры начинают делать то, что никогда не могли делать в истории человечества .

Майк Кригер, сооснователь Instagram, признался, что его «полувыходной» статус после ухода из Meta продлился всего шесть недель. Его привлекла возможность работать в организациях, движимых фундаментальными исследованиями . Кригер подчеркивает разницу в обратной связи:

Кевин Вейл добавляет, что в корпоративном секторе (Enterprise) продукт не всегда является главным фактором успеха. По его словам, у покупателя (байера) есть свои цели, которые могут не совпадать с восторгами конечных пользователей . В качестве примера он привел запрос крупного клиента, который просил уведомлять о любых запусках за 60 дней — требование, которое практически невыполнимо в текущем темпе разработки OpenAI .

📈 «Линия Мендосы» для ИИ: как проектировать при 60% успеха 8:20

Одной из самых обсуждаемых тем стала работа с неидеальными моделями. Майк Кригер предложил использовать термин «линия Мендосы» (Mendoza Line — метафора из бейсбола, означающая минимально приемлемый уровень компетенции) для ИИ на уровне 60% точности выполнения задачи .

Кевин Вейл утверждает, что продукт может быть полезным, даже если модель ошибается в 40% случаев. Главное — правильно спроектировать опыт :

  1. Human-in-the-loop (Человек в цикле): Модель должна восприниматься как помощник, а не полная замена. Примером служит GitHub Copilot — даже если он не пишет идеальный код с первой попытки, он экономит время на наборе текста, а разработчик просто редактирует результат .
  2. Понимание уверенности: Важно, чтобы модель могла сама идентифицировать моменты, когда она не уверена, и возвращалась к пользователю за уточнением .
  3. Обработка длинных задач: Даже если экономится всего 5–10 минут на рутинной операции, это уже представляет огромную ценность для пользователя .

Майк Кригер отмечает, что успех часто распределяется неравномерно (bimodal nature): одна компания может заявить, что модель решила их проблему трехмесячной давности, а другая в тот же день скажет, что ИИ полностью бесполезен . По его мнению, это происходит из-за различий в кастомных наборах данных и способах составления промптов.

🛠 Написание «евалов» (Evals) как главный навык PM будущего 14:35

Оба CPO сошлись во мнении, что роль продакт-менеджера (PM) в 2024–2025 годах радикально трансформируется. Граница между PM по исследованиям (Research PM) и PM по интерфейсам стирается .

По словам Майка Кригера, в Anthropic ключевым этапом собеседования является задание на улучшение «евалов» (evaluations) — систем оценки качества ответов модели . Он считает, что современные модели ограничены не интеллектом, а качеством инструментов их оценки (eval-limited) . Кевин Вейл подтвердил, что в OpenAI создан специальный тренировочный лагерь (boot camp), где каждый PM обучается написанию евалов .

Рекомендации экспертов по развитию навыков в ИИ:

🧠 От системы 1 к системе 2: разбор модели o1 29:15

Кевин Вейл подробно объяснил концепцию новой модели OpenAI o1, которая представляет собой качественный сдвиг в развитии ИИ. Если предыдущие модели (GPT-4) работали по принципу «Системы 1» (быстрое, интуитивное, мгновенное предсказание следующего токена), то o1 реализует «Систему 2» — медленное, осознанное мышление .

Особенности работы o1 по мнению Вейла:

🔮 Прогнозы на 6–12 месяцев: проактивность и асинхронность 33:37

Обсуждая ближайшее будущее, спикеры выделили несколько ключевых направлений развития продуктов.

Майк Кригер ставит на два фактора:

  1. Проактивность: Модели перестанут быть только реактивными (отвечающими на вопрос). Они будут анализировать почту (с разрешения пользователя), замечать тренды, готовить резюме к утренним встречам и предлагать черновики презентаций до того, как их об этом попросят .
  2. Асинхронность: Мы уйдем от ожидания мгновенного ответа в чате. Пользователь сможет поставить задачу («исправь этот баг» или «подготовь проект планирования»), уйти по своим делам и получить результат через час, когда модель проведет необходимые исследования и проверку .

Кевин Вейл делает ставку на мультимодальность и стирание языковых барьеров. Он рассказал о своем опыте использования «продвинутого голосового режима» (Advanced Voice Mode) в Японии и Корее. Модель работала как переводчик в реальном времени, позволяя вести бизнес-переговоры людям, не имеющим общего языка . По его мнению, это скоро станет обыденностью и изменит подход к путешествиям и глобальным коммуникациям .

👨‍👩‍👧‍👦 Новые нормы: ИИ-нативные дети и личность моделей 37:43

В конце встречи участники обсудили, как ИИ меняет человеческое поведение. Кевин Вейл заметил, что его дети (8 и 10 лет) воспринимают общение с ChatGPT в машине как абсолютно нормальное явление, задавая модели самые причудливые вопросы . Сара Го поделилась, что её дети уже требуют от неё генерировать изображения и сказки в реальном времени, превращая потребление контента в интерактивное сотворчество .

Майк Кригер подчеркнул, что «поведение модели» (Model Behavior) становится полноценной продуктовой задачей. Пользователи начинают выстраивать с ИИ отношения, основанные на эмпатии. Когда выходит новая, более мощная модель, пользователи иногда чувствуют, что она стала «умнее, но холоднее», и им приходится заново адаптироваться к её «личности» .

💬 Цитаты

«Каждые два месяца компьютеры начинают делать то, что никогда не могли делать в истории человечества.»

Кевин Вейл 02:02

«Качество вашей функции теперь ограничено тем, насколько хорошо вы составили евалы и промпты.»

Майк Кригер 15:27

«Модель o1 — это новый способ масштабирования интеллекта за счет времени на раздумья (query time).»

Кевин Вейл 31:23
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Евалы (Evals)
Автоматизированные или ручные системы оценки точности и качества ответов ИИ-модели.
Mendoza Line (Линия Мендосы)
Метафора минимально приемлемого уровня качества, в контексте ИИ — около 60% успеха выполнения задачи.
System 2 Thinking
Концепция медленного, логического и осознанного мышления, в отличие от интуитивной 'Системы 1'.
Computer Use
Новая функция моделей Anthropic, позволяющая ИИ управлять интерфейсом компьютера как человеку.
Human-in-the-loop
Модель разработки, при которой человек проверяет и корректирует промежуточные результаты работы ИИ.
📊 Цифры
🗓 Хронология
  1. 2022 Запуск ChatGPT, вызвавший шок и удивление у пользователей по всему миру.
  2. 2024 Выход функций Computer Use (Anthropic) и моделей рассуждения o1 (OpenAI).
  3. 2025 Ожидаемый переход ИИ к проактивному поведению и выполнению долгосрочных асинхронных задач.
⚖️ Другая сторона
Искусственный интеллект OpenAI Anthropic Kevin Weil Mike Krieger o1 model