Гай Гур-Ари об автоматизации разработки: «ИИ-агенты заменят ручное написание кода»

The Cognitive Revolution 18,9 тыс. 1 ч 25 мин 3 мин 27.03.2025
Главное

Революция в написании кода: как Augment трансформирует работу профессиональных разработчиков 4:35

В эпоху, когда ИИ-платформы обещают создание приложений с нуля по одной текстовой команде, компания Augment выбрала принципиально иной, более сложный путь. Ее основатель и главный научный сотрудник Гай Гур-Ари (Guy Gur-Ari) поставил перед собой задачу повысить производительность профессиональных инженеров, работающих с колоссальными по объему и запутанности корпоративными кодовыми базами. В интервью для канала The Cognitive Revolution Гур-Ари объясняет, почему традиционные подходы к ИИ-ассистентам буксуют на сложных проектах и как глубокая интеграция контекстного понимания меняет правила игры для энтерпрайза.

🧩 Проблема контекста: почему «размера» ИИ уже недостаточно 8:13

Хотя современные языковые модели (LLM) обладают впечатляющими окнами контекста, их недостаточно для работы с реальным промышленным кодом. Гур-Ари отмечает, что даже при миллионном контекстном окне, из-за соотношения токенов к строкам кода, в память модели помещается лишь около 100 000 строк, что для крупного бизнеса — лишь малая часть проекта.

Основные сложности при работе с большими кодовыми базами:

По мнению Гур-Ари, Augment выигрывает за счет «retrieval-heavy» (ориентированного на поиск) подхода, где глубокое понимание контекста встроено в каждую функцию ассистента — от автодополнения до чата и автономных агентов.

🛠 Технологический стек и «секретный соус» Augment 13:12

Augment не просто использует стандартные инструменты, а разрабатывает собственные решения для специфических задач инженерии:

  1. Кастомная векторная база данных: Разработана с нуля, так как существующие решения не могли обеспечить работу в режиме реального времени для множества независимых веток разработки (feature branches) внутри одной команды.
  2. Специализированные модели поиска: Обучены непосредственно на кодовых базах, а не на общих данных, что критически важно для качества предсказаний.
  3. Гибридный подход: Система объединяет RAG (Retrieval-Augmented Generation), статический анализ кода и несколько моделей для предоставления максимально точного контекста.

Гур-Ари подчеркивает: для достижения высокой производительности система обязана обрабатывать запрос за доли секунды (порядка 300 мс), включая поиск и генерацию ответа.

🧠 Обучение на поведении разработчиков 53:11

Одним из самых мощных инструментов Augment является подкрепление на основе действий разработчиков (reinforcement learning from developer behaviors). Гур-Ари объясняет, что в отличие от чат-интерфейсов, где трудно извлечь «истину», в среде IDE система видит конечный результат труда инженера.

По словам Гур-Ари, этот метод позволил значительно улучшить качество модели автодополнения, делая ее предсказания более «человечными» и подходящими для профессиональной среды.

📉 Экономика ИИ-ассистентов: будущее без фиксированных цен 1:06:53

Одной из самых дискуссионных тем стала стоимость обслуживания ИИ. Гур-Ари признает, что работа с «тяжелыми» пользователями, потребляющими огромное количество вычислительных мощностей, стоит компании дорого.

Гур-Ари полагает, что рынок движется в сторону агентных систем, которые будут выполнять задачи в фоновом режиме (ночью или в течение нескольких дней), что потребует совершенно новых моделей ценообразования, не привязанных к количеству пользователей.

💡 Советы для создателей ИИ-продуктов 37:28

Гур-Ари дает практические рекомендации тем, кто строит свои RAG-системы или ИИ-инструменты:

💬 Цитаты

«Для нас скорость — это важнейшая функция продукта.»

Гай Гур-Ари 14:43

«ИИ — это не просто чат-бот, это способность агента выполнять реальную работу.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
RAG (Retrieval-Augmented Generation)
Техника, при которой модель ИИ перед генерацией ответа ищет релевантную информацию во внешней базе данных.
Кодовая база (Codebase)
Полная совокупность исходного кода, составляющая программное обеспечение.
Векторная база данных
Тип базы данных, хранящий информацию в виде векторов (числовых представлений), что позволяет эффективно искать похожие объекты.
RLHF/RL
Методы обучения с подкреплением, позволяющие настраивать поведение модели на основе человеческих оценок или действий.
📊 Цифры
🗓 Хронология
  1. 2022 Основание компании Augment.
  2. 2026 Выпуск функции агентского режима для публичного использования.
⚖️ Другая сторона
Технологии и IT Augment Guy Gur-Ari RAG AI coding agents enterprise software