Революция в написании кода: как Augment трансформирует работу профессиональных разработчиков 4:35
В эпоху, когда ИИ-платформы обещают создание приложений с нуля по одной текстовой команде, компания Augment выбрала принципиально иной, более сложный путь. Ее основатель и главный научный сотрудник Гай Гур-Ари (Guy Gur-Ari) поставил перед собой задачу повысить производительность профессиональных инженеров, работающих с колоссальными по объему и запутанности корпоративными кодовыми базами. В интервью для канала The Cognitive Revolution Гур-Ари объясняет, почему традиционные подходы к ИИ-ассистентам буксуют на сложных проектах и как глубокая интеграция контекстного понимания меняет правила игры для энтерпрайза.
🧩 Проблема контекста: почему «размера» ИИ уже недостаточно 8:13
Хотя современные языковые модели (LLM) обладают впечатляющими окнами контекста, их недостаточно для работы с реальным промышленным кодом. Гур-Ари отмечает, что даже при миллионном контекстном окне, из-за соотношения токенов к строкам кода, в память модели помещается лишь около 100 000 строк, что для крупного бизнеса — лишь малая часть проекта.
Основные сложности при работе с большими кодовыми базами:
- Соблюдение конвенций: В крупных проектах существуют специфические способы вызова API и написания кода, которые необходимо строго соблюдать.
- Сложность выбора: Часто существует несколько способов решения задачи, и ИИ без глубокого понимания контекста репозитория будет предлагать неоптимальные или противоречащие стандартам решения.
- Устаревание кода: В больших системах легко найти примеры кода, которые уже не используются или являются устаревшими, что сбивает модель с толку.
По мнению Гур-Ари, Augment выигрывает за счет «retrieval-heavy» (ориентированного на поиск) подхода, где глубокое понимание контекста встроено в каждую функцию ассистента — от автодополнения до чата и автономных агентов.
🛠 Технологический стек и «секретный соус» Augment 13:12
Augment не просто использует стандартные инструменты, а разрабатывает собственные решения для специфических задач инженерии:
- Кастомная векторная база данных: Разработана с нуля, так как существующие решения не могли обеспечить работу в режиме реального времени для множества независимых веток разработки (feature branches) внутри одной команды.
- Специализированные модели поиска: Обучены непосредственно на кодовых базах, а не на общих данных, что критически важно для качества предсказаний.
- Гибридный подход: Система объединяет RAG (Retrieval-Augmented Generation), статический анализ кода и несколько моделей для предоставления максимально точного контекста.
Гур-Ари подчеркивает: для достижения высокой производительности система обязана обрабатывать запрос за доли секунды (порядка 300 мс), включая поиск и генерацию ответа.
🧠 Обучение на поведении разработчиков 53:11
Одним из самых мощных инструментов Augment является подкрепление на основе действий разработчиков (reinforcement learning from developer behaviors). Гур-Ари объясняет, что в отличие от чат-интерфейсов, где трудно извлечь «истину», в среде IDE система видит конечный результат труда инженера.
- Принцип контраста: Модели обучаются не просто на примерах, а на противопоставлении: «лучший» вариант против «худшего» (или менее удачного).
- Аксиомы предпочтений: ИИ учится улавливать не только корректность алгоритма, но и стиль написания кода, соответствующий стандартам конкретной компании.
По словам Гур-Ари, этот метод позволил значительно улучшить качество модели автодополнения, делая ее предсказания более «человечными» и подходящими для профессиональной среды.
📉 Экономика ИИ-ассистентов: будущее без фиксированных цен 1:06:53
Одной из самых дискуссионных тем стала стоимость обслуживания ИИ. Гур-Ари признает, что работа с «тяжелыми» пользователями, потребляющими огромное количество вычислительных мощностей, стоит компании дорого.
- Модель потребления: Augment перешла на продажу кредитов, что ближе к модели потребления, чем к традиционной «подписке на кресло» (seat-based pricing).
- Рост сложности: Переход от чата к автономным агентам увеличивает стоимость одного запроса в 10+ раз, так как один запуск агента может включать множество вызовов модели для редактирования файлов и запуска тестов.
Гур-Ари полагает, что рынок движется в сторону агентных систем, которые будут выполнять задачи в фоновом режиме (ночью или в течение нескольких дней), что потребует совершенно новых моделей ценообразования, не привязанных к количеству пользователей.
💡 Советы для создателей ИИ-продуктов 37:28
Гур-Ари дает практические рекомендации тем, кто строит свои RAG-системы или ИИ-инструменты:
- Начинайте с малого: Не пытайтесь сразу обучить что-то грандиозное. Соберите 10–20 примеров задач, размеченных вручную, которые вы досконально понимаете.
- Приоритизация итераций: Скорость эксперимента важнее сложности архитектуры. Если вы можете прогнать 100 экспериментов вместо 10, шансы найти работающее решение возрастают кратно.
- Гиперпараметры: По мнению Гур-Ари, разработчики слишком боятся шума в контексте. Современные модели отлично справляются с большими объемами данных, поэтому он советует «выкручивать» параметры поиска вверх, даже если это увеличивает латентность.