Пит Кумен из YC: «Мы строим ИИ-приложения как кареты с мотором вместо автомобилей»

В новом эпизоде подкаста «The Breakdown» от Y Combinator партнер фонда Пит Кумен, основатель компании Optimizely, обсуждает фундаментальные ошибки в проектировании современных ИИ-приложений. Вместе с Ричем Арчболдом и Томом Бломфилдом он анализирует, почему интеграция ИИ в такие продукты, как Gmail, часто кажется обузой, а не «суперсилой», и как разработчикам перейти от создания простых чат-ботов к проектированию автономных агентов, способных автоматизировать рутину.

🐎 Эффект «безлошадного экипажа» в разработке ИИ 0:00

По мнению Пита Кумена, современная индустрия программного обеспечения находится в фазе «безлошадных экипажей» — когда первые автомобили проектировались как обычные кареты, где лошадь просто заменили двигателем . Эта аналогия описывает попытки втиснуть возможности искусственного интеллекта в интерфейсы, созданные для эпохи ручного труда.

Кумен выделяет два радикально разных опыта использования ИИ сегодня:

Инструменты для разработчиков (Cursor, Windsurf): дают ощущение «суперсилы», позволяя материализовать любую идею из головы прямо в код .
Традиционные приложения (Gmail с Gemini): использование ИИ часто превращается в дополнительную работу, требующую больше усилий, чем выполнение задачи вручную .

В качестве примера Пит приводит функцию написания черновиков в Gmail. Когда пользователь просит ИИ сообщить боссу о болезни ребенка, система выдает сухой, официально-деловой текст, который совершенно не похож на стиль автора . Кумен утверждает, что здесь возникают две проблемы: ИИ звучит чуждо («как будто аккаунт взломали»), а написание промпта с инструкциями занимает столько же времени, сколько написание самого письма .

🛠 Системный промпт как «скрытый код» продукта 4:49

Проблема неудачных ИИ-интеграций, по словам Кумена, кроется в использовании устаревших методик разработки. Разработчики Gmail скрывают от пользователя «системный промпт» — набор инструкций, которые определяют поведение модели .

Основные тезисы Пита о системных промптах:

Усреднение (Lowest Common Denominator): Корпорации создают безопасные, вежливые и стерильные промпты, чтобы ИИ не сказал ничего лишнего или дискредитирующего компанию . В результате получается продукт, который «никого не уволит», но и не принесет реальной пользы .
Разделение труда: Десятилетиями в IT существовала стена между кодом (который пишет разработчик) и интерфейсом (которым пользуется юзер). В эпоху ИИ эта стена мешает, так как системный промпт — это, по сути, код на естественном языке, который пользователь должен иметь право редактировать .

Пит продемонстрировал демо, где он заменил стандартный промпт Gmail на персональный: «Ты Пит, тебе 43 года, ты партнер в YC, ты ценишь краткость» . С таким уточнением ИИ выдал идеальный короткий ответ: «Привет, Гэри, дочь заболела, сегодня не приду. Спасибо» .

🤖 От чат-ботов к автономным агентам: пример с почтой 12:33

Кумен считает, что ИИ не должен просто помогать писать тексты — он должен автоматизировать повторяющуюся «грязную работу» . Вместо «агента по написанию писем» (email writing agent) он предлагает концепцию «агента по чтению почты» (email reading agent).

Как работает предложенная Питом модель:

Пользователь пишет инструкции на естественном языке (своего рода алгоритм принятия решений) .
Агент получает доступ к инструментам: «повесить ярлык», «архивировать», «создать черновик», «выставить приоритет» .
ИИ обрабатывает входящий поток по правилам пользователя (например, письма от жены — приоритет 1, от фаундеров — ярлык «Founders») .

Том Бломфилд отмечает, что это превращает обычного пользователя в программиста, который пишет логику на английском языке . Кумен называет ИИ «умным выпускником колледжа», которому нужно просто объяснить, как именно вы хотите выполнять свою работу .

🚀 Будущее: «Vibe Coding» и протокол MCP 16:04

Обсуждая инструменты разработки, Пит признался, что создал свое демо с помощью «vibe coding» — описывая желаемый результат ИИ-агенту и наблюдая за тем, как код появляется сам собой . По мнению собеседников, скоро наступит «момент Cursor» для каждой профессии: бухгалтеры и юристы будут создавать своих собственных агентов для рутинных процессов .

Ключевым технологическим сдвигом станет использование инструментов (tooling). Кумен и Бломфилд упоминают MCP (Model Context Protocol) — способ, позволяющий ИИ-агентам вызывать функции других приложений .

Возможности «ракетного корабля для ума» (по аналогии со стивом джобсом):

Агент может сам зайти в Slack, забрать файл из Google Docs, отправить его юристам на проверку и опубликовать результат на GitHub .
Вместо бесконечных чат-интерфейсов, которые Кумен «терпеть не может», ИИ будет работать в фоне, выполняя транзакционные задачи (оплата счетов, интродукции, планирование календаря) .

💡 Советы фаундерам по созданию AI-native продуктов 29:14

В завершение беседы Пит Кумен дал рекомендации предпринимателям, строящим ИИ-стартапы:

Не вставляйте ИИ в старые дыры: Вместо вопроса «Как мне добавить чат в мой продукт?», спросите: «Как бы я спроектировал этот инструмент с нуля, чтобы максимально избавить пользователя от рутины?» .
Прозрачность инструкций: Разработчики не должны относиться к системным промптам как к «черным ящикам». Пользователь должен видеть, какие инструкции даны его агенту, и иметь возможность их корректировать .
Обучение через фидбек: В будущем ИИ будет анализировать историю действий пользователя за годы (например, 20 лет почты в Gmail) и автоматически предлагать черновик системного промпта, который пользователь сможет просто «подправлять» .

Кумен уверен, что хотя сейчас не все умеют писать промпты, этот навык станет таким же обыденным, как умение пользоваться файловой системой или мышкой .