Стартап Factory AI представил амбициозный проект по полной автономизации жизненного цикла разработки программного обеспечения. Используя систему так называемых «дроидов» (droids), компания обещает автоматизировать всё: от первичного исследования идеи до написания кода, тестирования и поддержки документации. Ведущий канала Уэс Рот (Wes Roth) проанализировал технологию, которая претендует на роль «машины, создающей машину».
🤖 Factory AI: экосистема автономных «дроидов» 0:00
Factory AI предлагает не просто ИИ-ассистента, а полноценную автономную систему, где специализированные агенты — «дроиды» — берут на себя рутинные и сложные задачи разработки . Уэс Рот подчеркивает, что это решение нацелено на Enterprise-сектор, позволяя крупным организациям системно планировать функции, писать код и генерировать тесты без прямого участия человека в каждом шаге .
Основные направления работы дроидов включают:
- Делегирование рутины: автоматизация миграций, рефакторинга и интеграций .
- Тестирование: автоматическая генерация юнит-тестов на основе анализа пробелов в покрытии кода .
- Ревью кода: создание описаний к Pull Request (PR) и суммаризация изменений .
- Самозаживление CI: автоматический откат к стабильным версиям при обнаружении сбоев и управление зависимостями .
Уэс Рот поясняет важность автоматизации юнит-тестов на примере кнопки «добавить в корзину»: ИИ может проверить граничные случаи (ввод отрицательных чисел, букв или триллионов единиц товара), которые человек может упустить из-за когнитивной нагрузки и скуки .
📈 Превосходство в бенчмарках: Factory AI против Devin 12:35
Одним из ключевых моментов обзора стало сравнение Factory AI с конкурентами на тесте SWE-bench — фреймворке, оценивающем способность языковых моделей решать реальные проблемы из GitHub-репозиториев . Этот бенчмарк требует не просто написания кода, а понимания изменений во множестве функций, классов и файлов одновременно .
Согласно данным, представленным в видео:
- Factory Code Droid показал результат в 19,27% решенных задач (а по более свежим данным — до 31%), заняв первое место в рейтинге .
- Devin (от Cognition AI), вызвавший ранее большой резонанс, показал результат 13,86% .
- GPT-4 в связке со специализированным агентом (swe-agent) решает около 12,47% задач .
Уэс Рот отмечает, что Factory AI уже имеет в портфеле таких клиентов, как стартапы Bubble, Podium и Stored . Инвесторами проекта выступают крупнейшие венчурные фонды, включая Sequoia Capital, в то время как конкуренты из Cognition AI поддерживаются фондом a16z .
🧠 Личности за кодом: от теории струн к ИИ 19:06
Основатель Factory AI Матан Гринберг олицетворяет новый тренд перехода лучших умов науки в сферу искусственного интеллекта. Гринберг — бывший аспирант, изучавший теорию струн, который оставил академическую карьеру ради стартапа, ныне оцениваемого инвесторами более чем в $100 млн .
Уэс Рот сравнивает нынешнюю концентрацию талантов в ИИ с великими научными проектами прошлого:
- 70–80 лет назад: Манхэттенский проект, ядерная физика (Оппенгеймер, фон Нейман, Фейнман) .
- Позже: Ракетная техника и космос.
- Недавнее прошлое: Финансы, SaaS и общее ПО.
- Сегодня: Лучшие программисты и ученые (такие как Матан Гринберг или Скотт Ву из Cognition) уходят в ИИ-разработку .
🚀 Прогноз на 2027 год: интеллектуальный взрыв 20:53
В статье Леопольда Ашенбреннера «Situational Awareness», которую цитирует Уэс Рот, высказывается мнение, что к 2027 году ИИ станет способен полностью автоматизировать исследования в области самого ИИ . По мнению Ашенбреннера, это приведет к «интеллектуальному взрыву».
Аргументы в пользу этого сценария:
- Автоматизированный исследователь сможет прочитать каждую научную работу по машинному обучению, когда-либо написанную .
- ИИ-агенты смогут работать миллионами копий параллельно, обмениваясь опытом мгновенно .
- Отсутствие «человеческих» факторов: политики, культурной акклиматизации и усталости .
- Эффект масштаба: при выходе новых моделей (GPT-5, 6, 7) вся архитектура Factory AI автоматически «прыгает» на следующий уровень эффективности .
🎼 Дирижер вместо рок-звезды: будущее профессии 24:36
Вопрос о том, исчезнет ли профессия программиста, остается открытым, но Уэс Рот уверен в изменении её характера. По его мнению, если раньше элитный программист был «рок-звездой», виртуозно пишущей код строка за строкой, то в будущем он станет «дирижером оркестра» .
Трансформация профессии по Уэсу Роту:
- Снижение значимости ручного ввода кода и написания документации .
- Рост роли естественного языка в программировании (общение с ИИ на английском вместо Python) .
- Необходимость глубокого понимания архитектуры и логики для управления «оркестром» ИИ-агентов, у каждого из которых есть свои «причуды» .
В качестве примера Уэс Рот приводит методику «LLM-as-a-judge», когда для оценки качества работы ИИ используется другой ИИ, проверяющий результат пошагово (логика, грамматика, простота чтения), что оказывается гораздо эффективнее простой просьбы «оценить по 100-балльной шкале» .
🏠 ИИ в быту: от кода до чистки стоков 10:37
Уэс Рот экстраполирует модель Factory AI на повседневную жизнь. Он предполагает, что аналогичные системы «дроидов» скоро появятся для управления домом и финансами .
Гипотетический «бытовой дроид» мог бы:
- Сам заказывать и напоминать о замене воздушных фильтров .
- Оптимизировать использование кондиционера .
- Хранить все документы на дом, чеки на ремонт и разрешения от города, чтобы при продаже дома мгновенно предоставить их ИИ-покупателю .
В сфере финансов и налогов Уэс Рот предвидит появление систем, которые автоматически собирают все транзакции, сканируют чеки, находят лучшие налоговые вычеты и подают декларации, предоставляя владельцу лишь итоговые красивые графики прибыли и убытков .