GStack: новый стандарт разработки ПО от президента Y Combinator

Как превратить ИИ-агента в полноценную инженерную команду: опыт Гарри Тана и GStack.

🚀 Рассвет эры агентов: от написания кода к управлению командой 0:09

Гарри Тан, президент и CEO Y Combinator, открывает новую главу в истории разработки ПО. Имея за плечами десятилетия опыта — от десятого сотрудника Palantir до кофаундера Posterous и создателя внутренней платформы YC Bookface — он утверждает: мы вступили в «эру агентов» . Главный инсайт этого периода заключается в том, что ИИ-агенты эффективны лишь тогда, когда они работают по тем же принципам, что и люди: с четкими ролями, процессами и многоуровневым ревью .

Три недели назад Гарри представил GStack — опенсорсный инструментарий, который превращает Claude Code из простого чат-бота в сплоченный коллектив «узких специалистов». Популярность решения оказалась взрывной: проект набрал на GitHub больше звезд, чем легендарный Ruby on Rails за аналогичный период . По словам Тана, за последние два месяца он написал больше кода, чем за весь 2013 год, который считал пиком своей инженерной активности . С помощью GStack он в одиночку воссоздал функционал Posterous — проекта, на который в прошлом ушло 2 года работы, 10 миллионов долларов инвестиций и команда из 10 человек .

🧠 Навык «Office Hours»: Фильтрация идей по методологии Y Combinator 2:22

Одной из фундаментальных проблем современных LLM является их склонность к «галлюцинациям» из-за недостатка контекста. Модели часто угадывают данные, что ведет к созданию внешне корректного, но нерабочего кода . Тан уверен, что проблема не в интеллекте моделей, а в отсутствии правильной «оснастки» (scaffolding). GStack реализует подход «тонкая обвязка — жирные навыки» (thin harness, fat skills) .

Ключевой навык системы — office hours. Это дистиллированная на 10% версия реальных консультаций, которые партнеры YC проводят со стартапами . Процесс начинается не с написания кода, а с шести «принуждающих» вопросов, которые заставляют фаундера пересмотреть продукт:

Какое самое сильное доказательство того, что это кому-то нужно?
В чем заключается реальная боль пользователя (например, раздражение бухгалтера или страх штрафов)?
Почему существующие решения (вроде TurboTax или Plaid) не справляются?

В режиме реального времени Гарри демонстрирует создание приложения для сбора налоговых форм 1099 из Gmail. Инструмент анализирует бизнес-модель и предлагает «стратегию клина» (wedge strategy): начать с бесплатного агрегатора документов, чтобы затем стать площадкой для подбора налоговых консультантов, где комиссия с транзакции в 10 раз выше прямой платы за софт .

🛡️ От проектирования к реализации: Adversarial Review и дизайн 12:39

После того как идея прошла проверку на жизнеспособность, GStack запускает многоэтапное «враждебное ревью» (adversarial review) . Модель Opus 4.6 (которую Гарри в шутку называет «гендиректором с СДВГ, с которым круто выпить пива») критикует документ на предмет уязвимостей . В демо-примере система автоматически обнаружила и исправила 16 проблем, включая отсутствие обработки ошибок 2FA и секции приватности, подняв оценку проекта с 6 до 8 баллов из 10 .

Для визуализации используется инструмент design shotgun. Он делегирует создание интерфейсов модели OpenAI CodeX, способной генерировать изображения . Система предлагает три варианта:

Command Center — лаконичный интерфейс для продвинутых пользователей .
Friendly Progress — карточный дизайн с прогресс-барами для массового рынка .
Split View — усложненный вариант, который Гарри сразу отвергает как избыточный .

🏗️ Автоматизация QA и масштабирование до «Софтверной фабрики» 17:26

Когда планирование завершено, Claude Code приступает к написанию кода, а затем в дело вступает навык review — автоматизированная проверка на уровне Staff Engineer для поиска багов, которые могли быть упущены на этапе планирования .

Самым сложным этапом автоматизации Гарри называет тестирование (QA). Будучи недовольным существующими решениями (такими как Chrome MCP для Claude, которые он назвал «одним из худших кусков софта» из-за медлительности), он создал CLI-обертку вокруг Playwright и Chromium . Это позволяет агентам:

Делать скриншоты и выполнять сложные клики .
Проводить полные регрессионные тесты.
Исправлять визуальные баги в CSS и ошибки JavaScript в реальном браузере .

Тан описывает свою работу как «софтверную фабрику 7-го уровня» . Вместо одного окна терминала он открывает 10–15 параллельных сессий в Conductor на разных ветках проекта. Это позволяет обрабатывать сотни входящих PR от опенсорс-сообщества и внедрять до 50 исправлений в день, сохраняя при этом параноидальную бдительность в отношении атак на цепочку поставок (supply chain attacks) .

«Барьер для строительства программного обеспечения рухнул,— заключает Гарри Тан. — Единственный оставшийся вопрос: что именно вы построите?» .