Гай Гур-Ари об автоматизации разработки: «ИИ-агенты заменят ручное написание кода»

Революция в написании кода: как Augment трансформирует работу профессиональных разработчиков 4:35

В эпоху, когда ИИ-платформы обещают создание приложений с нуля по одной текстовой команде, компания Augment выбрала принципиально иной, более сложный путь. Ее основатель и главный научный сотрудник Гай Гур-Ари (Guy Gur-Ari) поставил перед собой задачу повысить производительность профессиональных инженеров, работающих с колоссальными по объему и запутанности корпоративными кодовыми базами. В интервью для канала The Cognitive Revolution Гур-Ари объясняет, почему традиционные подходы к ИИ-ассистентам буксуют на сложных проектах и как глубокая интеграция контекстного понимания меняет правила игры для энтерпрайза.

🧩 Проблема контекста: почему «размера» ИИ уже недостаточно 8:13

Хотя современные языковые модели (LLM) обладают впечатляющими окнами контекста, их недостаточно для работы с реальным промышленным кодом. Гур-Ари отмечает, что даже при миллионном контекстном окне, из-за соотношения токенов к строкам кода, в память модели помещается лишь около 100 000 строк, что для крупного бизнеса — лишь малая часть проекта.

Основные сложности при работе с большими кодовыми базами:

Соблюдение конвенций: В крупных проектах существуют специфические способы вызова API и написания кода, которые необходимо строго соблюдать.
Сложность выбора: Часто существует несколько способов решения задачи, и ИИ без глубокого понимания контекста репозитория будет предлагать неоптимальные или противоречащие стандартам решения.
Устаревание кода: В больших системах легко найти примеры кода, которые уже не используются или являются устаревшими, что сбивает модель с толку.

По мнению Гур-Ари, Augment выигрывает за счет «retrieval-heavy» (ориентированного на поиск) подхода, где глубокое понимание контекста встроено в каждую функцию ассистента — от автодополнения до чата и автономных агентов.

🛠 Технологический стек и «секретный соус» Augment 13:12

Augment не просто использует стандартные инструменты, а разрабатывает собственные решения для специфических задач инженерии:

Кастомная векторная база данных: Разработана с нуля, так как существующие решения не могли обеспечить работу в режиме реального времени для множества независимых веток разработки (feature branches) внутри одной команды.
Специализированные модели поиска: Обучены непосредственно на кодовых базах, а не на общих данных, что критически важно для качества предсказаний.
Гибридный подход: Система объединяет RAG (Retrieval-Augmented Generation), статический анализ кода и несколько моделей для предоставления максимально точного контекста.

Гур-Ари подчеркивает: для достижения высокой производительности система обязана обрабатывать запрос за доли секунды (порядка 300 мс), включая поиск и генерацию ответа.

🧠 Обучение на поведении разработчиков 53:11

Одним из самых мощных инструментов Augment является подкрепление на основе действий разработчиков (reinforcement learning from developer behaviors). Гур-Ари объясняет, что в отличие от чат-интерфейсов, где трудно извлечь «истину», в среде IDE система видит конечный результат труда инженера.

Принцип контраста: Модели обучаются не просто на примерах, а на противопоставлении: «лучший» вариант против «худшего» (или менее удачного).
Аксиомы предпочтений: ИИ учится улавливать не только корректность алгоритма, но и стиль написания кода, соответствующий стандартам конкретной компании.

По словам Гур-Ари, этот метод позволил значительно улучшить качество модели автодополнения, делая ее предсказания более «человечными» и подходящими для профессиональной среды.

📉 Экономика ИИ-ассистентов: будущее без фиксированных цен 1:06:53

Одной из самых дискуссионных тем стала стоимость обслуживания ИИ. Гур-Ари признает, что работа с «тяжелыми» пользователями, потребляющими огромное количество вычислительных мощностей, стоит компании дорого.

Модель потребления: Augment перешла на продажу кредитов, что ближе к модели потребления, чем к традиционной «подписке на кресло» (seat-based pricing).
Рост сложности: Переход от чата к автономным агентам увеличивает стоимость одного запроса в 10+ раз, так как один запуск агента может включать множество вызовов модели для редактирования файлов и запуска тестов.

Гур-Ари полагает, что рынок движется в сторону агентных систем, которые будут выполнять задачи в фоновом режиме (ночью или в течение нескольких дней), что потребует совершенно новых моделей ценообразования, не привязанных к количеству пользователей.

💡 Советы для создателей ИИ-продуктов 37:28

Гур-Ари дает практические рекомендации тем, кто строит свои RAG-системы или ИИ-инструменты:

Начинайте с малого: Не пытайтесь сразу обучить что-то грандиозное. Соберите 10–20 примеров задач, размеченных вручную, которые вы досконально понимаете.
Приоритизация итераций: Скорость эксперимента важнее сложности архитектуры. Если вы можете прогнать 100 экспериментов вместо 10, шансы найти работающее решение возрастают кратно.
Гиперпараметры: По мнению Гур-Ари, разработчики слишком боятся шума в контексте. Современные модели отлично справляются с большими объемами данных, поэтому он советует «выкручивать» параметры поиска вверх, даже если это увеличивает латентность.