В новом эпизоде подкаста «The Breakdown» от Y Combinator партнер фонда Пит Кумен, основатель компании Optimizely, обсуждает фундаментальные ошибки в проектировании современных ИИ-приложений. Вместе с Ричем Арчболдом и Томом Бломфилдом он анализирует, почему интеграция ИИ в такие продукты, как Gmail, часто кажется обузой, а не «суперсилой», и как разработчикам перейти от создания простых чат-ботов к проектированию автономных агентов, способных автоматизировать рутину.
🐎 Эффект «безлошадного экипажа» в разработке ИИ 0:00
По мнению Пита Кумена, современная индустрия программного обеспечения находится в фазе «безлошадных экипажей» — когда первые автомобили проектировались как обычные кареты, где лошадь просто заменили двигателем . Эта аналогия описывает попытки втиснуть возможности искусственного интеллекта в интерфейсы, созданные для эпохи ручного труда.
Кумен выделяет два радикально разных опыта использования ИИ сегодня:
- Инструменты для разработчиков (Cursor, Windsurf): дают ощущение «суперсилы», позволяя материализовать любую идею из головы прямо в код .
- Традиционные приложения (Gmail с Gemini): использование ИИ часто превращается в дополнительную работу, требующую больше усилий, чем выполнение задачи вручную .
В качестве примера Пит приводит функцию написания черновиков в Gmail. Когда пользователь просит ИИ сообщить боссу о болезни ребенка, система выдает сухой, официально-деловой текст, который совершенно не похож на стиль автора . Кумен утверждает, что здесь возникают две проблемы: ИИ звучит чуждо («как будто аккаунт взломали»), а написание промпта с инструкциями занимает столько же времени, сколько написание самого письма .
🛠 Системный промпт как «скрытый код» продукта 4:49
Проблема неудачных ИИ-интеграций, по словам Кумена, кроется в использовании устаревших методик разработки. Разработчики Gmail скрывают от пользователя «системный промпт» — набор инструкций, которые определяют поведение модели .
Основные тезисы Пита о системных промптах:
- Усреднение (Lowest Common Denominator): Корпорации создают безопасные, вежливые и стерильные промпты, чтобы ИИ не сказал ничего лишнего или дискредитирующего компанию . В результате получается продукт, который «никого не уволит», но и не принесет реальной пользы .
- Разделение труда: Десятилетиями в IT существовала стена между кодом (который пишет разработчик) и интерфейсом (которым пользуется юзер). В эпоху ИИ эта стена мешает, так как системный промпт — это, по сути, код на естественном языке, который пользователь должен иметь право редактировать .
Пит продемонстрировал демо, где он заменил стандартный промпт Gmail на персональный: «Ты Пит, тебе 43 года, ты партнер в YC, ты ценишь краткость» . С таким уточнением ИИ выдал идеальный короткий ответ: «Привет, Гэри, дочь заболела, сегодня не приду. Спасибо» .
🤖 От чат-ботов к автономным агентам: пример с почтой 12:33
Кумен считает, что ИИ не должен просто помогать писать тексты — он должен автоматизировать повторяющуюся «грязную работу» . Вместо «агента по написанию писем» (email writing agent) он предлагает концепцию «агента по чтению почты» (email reading agent).
Как работает предложенная Питом модель:
- Пользователь пишет инструкции на естественном языке (своего рода алгоритм принятия решений) .
- Агент получает доступ к инструментам: «повесить ярлык», «архивировать», «создать черновик», «выставить приоритет» .
- ИИ обрабатывает входящий поток по правилам пользователя (например, письма от жены — приоритет 1, от фаундеров — ярлык «Founders») .
Том Бломфилд отмечает, что это превращает обычного пользователя в программиста, который пишет логику на английском языке . Кумен называет ИИ «умным выпускником колледжа», которому нужно просто объяснить, как именно вы хотите выполнять свою работу .
🚀 Будущее: «Vibe Coding» и протокол MCP 16:04
Обсуждая инструменты разработки, Пит признался, что создал свое демо с помощью «vibe coding» — описывая желаемый результат ИИ-агенту и наблюдая за тем, как код появляется сам собой . По мнению собеседников, скоро наступит «момент Cursor» для каждой профессии: бухгалтеры и юристы будут создавать своих собственных агентов для рутинных процессов .
Ключевым технологическим сдвигом станет использование инструментов (tooling). Кумен и Бломфилд упоминают MCP (Model Context Protocol) — способ, позволяющий ИИ-агентам вызывать функции других приложений .
Возможности «ракетного корабля для ума» (по аналогии со стивом джобсом):
- Агент может сам зайти в Slack, забрать файл из Google Docs, отправить его юристам на проверку и опубликовать результат на GitHub .
- Вместо бесконечных чат-интерфейсов, которые Кумен «терпеть не может», ИИ будет работать в фоне, выполняя транзакционные задачи (оплата счетов, интродукции, планирование календаря) .
💡 Советы фаундерам по созданию AI-native продуктов 29:14
В завершение беседы Пит Кумен дал рекомендации предпринимателям, строящим ИИ-стартапы:
- Не вставляйте ИИ в старые дыры: Вместо вопроса «Как мне добавить чат в мой продукт?», спросите: «Как бы я спроектировал этот инструмент с нуля, чтобы максимально избавить пользователя от рутины?» .
- Прозрачность инструкций: Разработчики не должны относиться к системным промптам как к «черным ящикам». Пользователь должен видеть, какие инструкции даны его агенту, и иметь возможность их корректировать .
- Обучение через фидбек: В будущем ИИ будет анализировать историю действий пользователя за годы (например, 20 лет почты в Gmail) и автоматически предлагать черновик системного промпта, который пользователь сможет просто «подправлять» .
Кумен уверен, что хотя сейчас не все умеют писать промпты, этот навык станет таким же обыденным, как умение пользоваться файловой системой или мышкой .