Уэс Рот о Factory AI: «Эра программистов-рок-звезд уходит в прошлое»

Wes Roth 43,1 тыс. 30 мин 4 мин 19.06.2024
Главное

Стартап Factory AI представил амбициозный проект по полной автономизации жизненного цикла разработки программного обеспечения. Используя систему так называемых «дроидов» (droids), компания обещает автоматизировать всё: от первичного исследования идеи до написания кода, тестирования и поддержки документации. Ведущий канала Уэс Рот (Wes Roth) проанализировал технологию, которая претендует на роль «машины, создающей машину».

🤖 Factory AI: экосистема автономных «дроидов» 0:00

Factory AI предлагает не просто ИИ-ассистента, а полноценную автономную систему, где специализированные агенты — «дроиды» — берут на себя рутинные и сложные задачи разработки . Уэс Рот подчеркивает, что это решение нацелено на Enterprise-сектор, позволяя крупным организациям системно планировать функции, писать код и генерировать тесты без прямого участия человека в каждом шаге .

Основные направления работы дроидов включают:

Уэс Рот поясняет важность автоматизации юнит-тестов на примере кнопки «добавить в корзину»: ИИ может проверить граничные случаи (ввод отрицательных чисел, букв или триллионов единиц товара), которые человек может упустить из-за когнитивной нагрузки и скуки .

📈 Превосходство в бенчмарках: Factory AI против Devin 12:35

Одним из ключевых моментов обзора стало сравнение Factory AI с конкурентами на тесте SWE-bench — фреймворке, оценивающем способность языковых моделей решать реальные проблемы из GitHub-репозиториев . Этот бенчмарк требует не просто написания кода, а понимания изменений во множестве функций, классов и файлов одновременно .

Согласно данным, представленным в видео:

Уэс Рот отмечает, что Factory AI уже имеет в портфеле таких клиентов, как стартапы Bubble, Podium и Stored . Инвесторами проекта выступают крупнейшие венчурные фонды, включая Sequoia Capital, в то время как конкуренты из Cognition AI поддерживаются фондом a16z .

🧠 Личности за кодом: от теории струн к ИИ 19:06

Основатель Factory AI Матан Гринберг олицетворяет новый тренд перехода лучших умов науки в сферу искусственного интеллекта. Гринберг — бывший аспирант, изучавший теорию струн, который оставил академическую карьеру ради стартапа, ныне оцениваемого инвесторами более чем в $100 млн .

Уэс Рот сравнивает нынешнюю концентрацию талантов в ИИ с великими научными проектами прошлого:

  1. 70–80 лет назад: Манхэттенский проект, ядерная физика (Оппенгеймер, фон Нейман, Фейнман) .
  2. Позже: Ракетная техника и космос.
  3. Недавнее прошлое: Финансы, SaaS и общее ПО.
  4. Сегодня: Лучшие программисты и ученые (такие как Матан Гринберг или Скотт Ву из Cognition) уходят в ИИ-разработку .

🚀 Прогноз на 2027 год: интеллектуальный взрыв 20:53

В статье Леопольда Ашенбреннера «Situational Awareness», которую цитирует Уэс Рот, высказывается мнение, что к 2027 году ИИ станет способен полностью автоматизировать исследования в области самого ИИ . По мнению Ашенбреннера, это приведет к «интеллектуальному взрыву».

Аргументы в пользу этого сценария:

🎼 Дирижер вместо рок-звезды: будущее профессии 24:36

Вопрос о том, исчезнет ли профессия программиста, остается открытым, но Уэс Рот уверен в изменении её характера. По его мнению, если раньше элитный программист был «рок-звездой», виртуозно пишущей код строка за строкой, то в будущем он станет «дирижером оркестра» .

Трансформация профессии по Уэсу Роту:

В качестве примера Уэс Рот приводит методику «LLM-as-a-judge», когда для оценки качества работы ИИ используется другой ИИ, проверяющий результат пошагово (логика, грамматика, простота чтения), что оказывается гораздо эффективнее простой просьбы «оценить по 100-балльной шкале» .

🏠 ИИ в быту: от кода до чистки стоков 10:37

Уэс Рот экстраполирует модель Factory AI на повседневную жизнь. Он предполагает, что аналогичные системы «дроидов» скоро появятся для управления домом и финансами .

Гипотетический «бытовой дроид» мог бы:

В сфере финансов и налогов Уэс Рот предвидит появление систем, которые автоматически собирают все транзакции, сканируют чеки, находят лучшие налоговые вычеты и подают декларации, предоставляя владельцу лишь итоговые красивые графики прибыли и убытков .


💬 Цитаты

«Прошлые великие программисты были рок-звездами... Теперь мы движемся к тому, что ведущий инженер станет дирижером оркестра.»

Уэс Рот (Wes Roth) 25:44

«ИИ-дроиды будут поддерживать документацию актуальной до секунды... В ту же секунду, когда что-то меняется, они переписывают инструкции.»

Уэс Рот (Wes Roth) 6:36
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
SWE-bench
Тест для оценки ИИ-моделей в решении реальных задач программной инженерии на основе данных GitHub.
Unit test (юнит-тест)
Тестирование отдельных небольших блоков кода на корректность работы.
CI self-healing
Способность системы непрерывной интеграции автоматически исправлять ошибки или откатываться к стабильному состоянию.
LLM-as-a-judge
Метод, при котором одна нейросеть оценивает качество ответов другой нейросети по заданным критериям.
📊 Цифры
🗓 Хронология
  1. 2014 Матан Гринберг выигрывает золотую медаль на Международной олимпиаде по информатике.
  2. Начало 2024 Factory AI начинает продажу продуктов первым корпоративным клиентам.
  3. Май 2024 Уэс Рот публикует обзор достижений Factory AI и их лидерства в SWE-bench.
  4. 2027 (прогноз) Ожидаемый момент полной автономизации ИИ-исследований согласно модели Ашенбреннера.
⚖️ Другая сторона
Искусственный интеллект Factory AI Wes Roth Matan Greenberg SWE-bench Leopold Aschenbrenner