Команда Cognition Labs объявила о начале постепенного допуска пользователей из списка ожидания к техническому превью своего самого обсуждаемого продукта — Devin AI, который позиционируется как первый в мире «автономный ИИ-инженер». Несмотря на недавнюю волну критики и обвинения в фальсификации демонстрационных роликов, автор канала Wes Roth анализирует потенциал технологии, опираясь на уникальный бэкграунд создателей проекта и их реакцию на скептицизм сообщества.
🚀 Новый этап: Devin выходит в публичное поле 0:00
Разработчики из Cognition Labs официально подтвердили расширение инфраструктуры для предоставления доступа к Devin в формате технического превью . Примечательным фактом стало то, что для автоматизации процесса рассылки приглашений команда использовала сам ИИ: Девину поручили написать скрипт, который обрабатывает список пользователей и отправляет инвайты .
По своей структуре Devin — это не просто чат-бот, а автономный агент со следующими инструментами :
- Асинхронное окно чата для постановки задач.
- Динамический список дел (to-do list), который ИИ разбивает на подзадачи.
- Собственный браузер и терминал для выполнения кода.
- Возможность самостоятельно исправлять ошибки в процессе работы .
Руководство компании признает, что продукт находится на ранней стадии и «далек от совершенства», поэтому техническое превью нацелено на сбор конструктивной критики и проверку ИИ в реальных инженерных сценариях .
⚖️ Скандал с «разоблачением»: был ли обман на Upwork? 1:43
В последнее время вокруг Devin возникли серьезные споры. Поводом послужило видео с YouTube-канала «Internet of Bugs» под названием «Debunking Devin» . Автор ролика утверждает, что рекламные заявления Cognition Labs о том, как ИИ зарабатывает деньги на платформе Upwork, являются ложью.
Основные претензии критиков:
- Несоответствие задаче: По мнению автора «Internet of Bugs», ИИ не выполнял работу так, как это показано в демо .
- Обвинения в «Vaporware»: В социальных сетях, особенно в Twitter, проект начали называть «пустышкой», созданной лишь для привлечения инвестиций .
- Мнение скептиков: Многие профессиональные программисты считают, что возможности Devin сильно преувеличены и он не способен заменить реального разработчика .
Ведущий Wes Roth отмечает, что пока не готов выносить окончательный вердикт, так как ждет возможности протестировать инструмент лично, но упоминает, что профессор Итан Моллик (Ethan Mollick) уже публиковал примеры успешного использования Devin для создания различных проектов .
🔍 Версия клиента: что на самом деле произошло на Upwork 3:30
Ситуация получила продолжение, когда в дискуссию вступил реальный заказчик того самого задания на Upwork — эксперт по компьютерному зрению по имени Филипе . Он подтвердил, что именно его пост был использован в демонстрации Cognition Labs.
Филипе выделил несколько ключевых моментов:
- Разница в запросах: В оригинальном объявлении Филипе просил предоставить «подробные инструкции», как запустить модель на инстансе AWS EC2, а не просто выполнить код .
- Изменение промпта: Команда Cognition Labs дала Девину упрощенную команду «разберись с этим», вместо того чтобы попросить его составить туториал для клиента .
- Результат: Филипе считает, что итоговый результат ИИ не соответствовал его ожиданиям как клиента, хотя признает, что технически Devin смог запустить проект, что само по себе впечатляет .
Уэс Рот, анализируя это, полагает, что ошибка скорее заключалась в интерпретации задачи людьми (промпт-инжиниринге), а не в неспособности самого ИИ программировать. По словам Рота, Devin — это не «строитель туториалов», а исполнитель кода, и в этом качестве он справился .
🧠 Феномен Скотта Ву: гений за кулисами Devin 8:30
Ключевым аргументом в пользу реальности технологий Cognition Labs Уэс Рот считает личность генерального директора компании — Скотта Ву (Scott Wu). Его называют легендой в мире спортивного программирования.
Факты биографии Скотта Ву:
- Вундеркинд: Видео 2010 года показывает, как Скотт, будучи семиклассником, с легкостью побеждает в национальном математическом конкурсе Mathcounts, отвечая на сложнейшие вопросы быстрее, чем ведущий успевает их дочитать .
- Гроссмейстер кода: На платформе Codeforces Скотт Ву имеет рейтинг 3297 (максимальный 3350), что ставит его в топ-20 лучших программистов мира за всю историю .
- Образование: Изучал экономику в Гарварде, после чего переехал в Сан-Франциско для запуска стартапов .
Брат Скотта, Нил Ву (Neil Wu), также участвует в проекте. Он — победитель Mathcounts прошлых лет и ветеран таких компаний, как Facebook и Google Brain . В общей сложности небольшая команда основателей Cognition Labs обладает 10 золотыми медалями Международной олимпиады по информатике (IOI) .
💰 Инвестиции и будущее: «Шарлатанство» или «Стенобитное орудие»? 11:34
Проект получил 21 миллион долларов инвестиций от Founders Fund Питера Тиля . Список компаний, в которые ранее инвестировал этот фонд (SpaceX, Palantir, Facebook, OpenAI), по мнению Рота, говорит о высоком уровне проверки (due diligence) перед вложением средств .
В финале обсуждения автор выделяет два возможных сценария:
- Вариант А: Группа гениальных программистов объединилась, чтобы обмануть Питера Тиля и фонд Andreessen Horowitz (A16Z), создав фейковое демо .
- Вариант Б: Devin действительно является первым работающим примером автономного агента, способного на долгосрочное планирование и выполнение сложных задач, пусть и с периодическими ошибками .
Сам Уэс Рот заявляет, что делает ставку на «вариант Б» (Wrecking Ball), считая, что потенциал команды и уже продемонстрированные возможности перевешивают текущие недоработки интерфейса и коммуникации .