Как превратить ИИ-агента в полноценную инженерную команду: опыт Гарри Тана и GStack.
🚀 Рассвет эры агентов: от написания кода к управлению командой 0:09
Гарри Тан, президент и CEO Y Combinator, открывает новую главу в истории разработки ПО. Имея за плечами десятилетия опыта — от десятого сотрудника Palantir до кофаундера Posterous и создателя внутренней платформы YC Bookface — он утверждает: мы вступили в «эру агентов» . Главный инсайт этого периода заключается в том, что ИИ-агенты эффективны лишь тогда, когда они работают по тем же принципам, что и люди: с четкими ролями, процессами и многоуровневым ревью .
Три недели назад Гарри представил GStack — опенсорсный инструментарий, который превращает Claude Code из простого чат-бота в сплоченный коллектив «узких специалистов». Популярность решения оказалась взрывной: проект набрал на GitHub больше звезд, чем легендарный Ruby on Rails за аналогичный период . По словам Тана, за последние два месяца он написал больше кода, чем за весь 2013 год, который считал пиком своей инженерной активности . С помощью GStack он в одиночку воссоздал функционал Posterous — проекта, на который в прошлом ушло 2 года работы, 10 миллионов долларов инвестиций и команда из 10 человек .
🧠 Навык «Office Hours»: Фильтрация идей по методологии Y Combinator 2:22
Одной из фундаментальных проблем современных LLM является их склонность к «галлюцинациям» из-за недостатка контекста. Модели часто угадывают данные, что ведет к созданию внешне корректного, но нерабочего кода . Тан уверен, что проблема не в интеллекте моделей, а в отсутствии правильной «оснастки» (scaffolding). GStack реализует подход «тонкая обвязка — жирные навыки» (thin harness, fat skills) .
Ключевой навык системы — office hours. Это дистиллированная на 10% версия реальных консультаций, которые партнеры YC проводят со стартапами . Процесс начинается не с написания кода, а с шести «принуждающих» вопросов, которые заставляют фаундера пересмотреть продукт:
- Какое самое сильное доказательство того, что это кому-то нужно?
- В чем заключается реальная боль пользователя (например, раздражение бухгалтера или страх штрафов)?
- Почему существующие решения (вроде TurboTax или Plaid) не справляются?
В режиме реального времени Гарри демонстрирует создание приложения для сбора налоговых форм 1099 из Gmail. Инструмент анализирует бизнес-модель и предлагает «стратегию клина» (wedge strategy): начать с бесплатного агрегатора документов, чтобы затем стать площадкой для подбора налоговых консультантов, где комиссия с транзакции в 10 раз выше прямой платы за софт .
🛡️ От проектирования к реализации: Adversarial Review и дизайн 12:39
После того как идея прошла проверку на жизнеспособность, GStack запускает многоэтапное «враждебное ревью» (adversarial review) . Модель Opus 4.6 (которую Гарри в шутку называет «гендиректором с СДВГ, с которым круто выпить пива») критикует документ на предмет уязвимостей . В демо-примере система автоматически обнаружила и исправила 16 проблем, включая отсутствие обработки ошибок 2FA и секции приватности, подняв оценку проекта с 6 до 8 баллов из 10 .
Для визуализации используется инструмент design shotgun. Он делегирует создание интерфейсов модели OpenAI CodeX, способной генерировать изображения . Система предлагает три варианта:
- Command Center — лаконичный интерфейс для продвинутых пользователей .
- Friendly Progress — карточный дизайн с прогресс-барами для массового рынка .
- Split View — усложненный вариант, который Гарри сразу отвергает как избыточный .
🏗️ Автоматизация QA и масштабирование до «Софтверной фабрики» 17:26
Когда планирование завершено, Claude Code приступает к написанию кода, а затем в дело вступает навык review — автоматизированная проверка на уровне Staff Engineer для поиска багов, которые могли быть упущены на этапе планирования .
Самым сложным этапом автоматизации Гарри называет тестирование (QA). Будучи недовольным существующими решениями (такими как Chrome MCP для Claude, которые он назвал «одним из худших кусков софта» из-за медлительности), он создал CLI-обертку вокруг Playwright и Chromium . Это позволяет агентам:
- Делать скриншоты и выполнять сложные клики .
- Проводить полные регрессионные тесты.
- Исправлять визуальные баги в CSS и ошибки JavaScript в реальном браузере .
Тан описывает свою работу как «софтверную фабрику 7-го уровня» . Вместо одного окна терминала он открывает 10–15 параллельных сессий в Conductor на разных ветках проекта. Это позволяет обрабатывать сотни входящих PR от опенсорс-сообщества и внедрять до 50 исправлений в день, сохраняя при этом параноидальную бдительность в отношении атак на цепочку поставок (supply chain attacks) .
«Барьер для строительства программного обеспечения рухнул,— заключает Гарри Тан. — Единственный оставшийся вопрос: что именно вы построите?» .