Кевин Вейл из OpenAI: «В 2025 году ИИ превзойдет человека в программировании навсегда»

В недавнем выпуске подкаста Overpowered Кевин Вейл, директор по продукту (CPO) OpenAI, озвучил амбициозные прогнозы относительно будущего разработки программного обеспечения. Ведущий канала Wes Roth анализирует эти заявления, сопоставляя их с текущими успехами моделей рассуждения (reasoning models) и планами конкурентов, таких как Anthropic и Google. Главная идея дискуссии — 2025 год может стать переломным моментом, когда искусственный интеллект окончательно и бесповоротно превзойдет человека в искусстве написания кода.

📅 Сроки революции: 2025 против 2027 года 0:00

Кевин Вейл вступил в заочную полемику с основателем Anthropic Дарио Амодеи . По словам ведущего, в Anthropic ориентируются на 2027 год как на дату, когда написание кода будет автоматизировано на 99% — включая фронтенд и бэкенд . Однако Вейл считает этот прогноз излишне консервативным. По мнению CPO OpenAI, при текущих темпах развития прогресс наступит значительно раньше — уже в 2025 или 2026 году .

Вейл аргументирует свою позицию качественным скачком в технологиях:

Переход от простых LLM к моделям рассуждения (Large Reasoning Models).
Использование обучения с подкреплением (Reinforcement Learning) для решения сложных логических задач .
Способность моделей разбивать большие проблемы на мелкие, выдвигать гипотезы и проверять их, подобно тому, как человек решает кроссворды или судоку .

📊 Бенчмарки и «сверхчеловеческий» уровень 1:53

Прогресс OpenAI в области кодинга демонстрируется через позиции моделей в мировых рейтингах спортивного программирования (например, Codeforces). Вейл приводит впечатляющую динамику развития линейки моделей o1 и её преемников:

GPT-4o: была хороша для автодополнения (как в GitHub Copilot), но не обладала глубоким рассуждением .
o1-preview: по уровню навыков соответствовала примерно миллионному по счету программисту в мире (топ 2–3% из 40 млн разработчиков) .
o1 (релизная версия): поднялась до уровня тысячного лучшего инженера в мире .
o3 (готовится к выходу): занимает 175-е место в мировом рейтинге .
Внутренние модели OpenAI: Сэм Альтман утверждает, что у компании уже есть модель, входящая в топ-50 лучших кодеров планеты .

По мнению Вейла, 2025 год станет моментом, когда ИИ превзойдет людей в программировании навсегда, точно так же, как компьютеры превзошли человека в арифметике 70 лет назад или в шахматах 15 лет назад .

🏗️ Стэк ИИ-агентов: от чата к автономным действиям 8:24

Wes Roth отмечает, что индустрия переходит от простых интерфейсов вроде Cursor к полноценным «агентским стэкам». В качестве примера он приводит систему Manus AI, которая использует уникальную архитектуру :

Виртуальная машина: Агент работает внутри изолированной ОС Ubuntu (Linux), что дает ему доступ к терминалу и файловой системе .
Автономность: ИИ может самостоятельно клонировать репозитории с GitHub, устанавливать зависимости, исправлять ошибки компиляции и запускать проекты .
Зрение (Vision): Использование систем вроде Browser Use или нового OpenAI Operator позволяет агенту буквально «видеть» браузер и взаимодействовать с элементами интерфейса как человек .

Ведущий подчеркивает, что хотя Claude Code от Anthropic очень силен, он всё еще ощущается как «второй пилот» (co-pilot), требующий постоянного диалога, в то время как Manus AI или будущие системы на базе OpenAI Operator стремятся к полной автономности «удаленного сотрудника» .

🧪 Эксперимент со змеями: возможности и преграды 14:42

Чтобы проверить границы возможностей современных агентов, Wes Roth поручил Manus AI сложную задачу: создать игру «Змейка», где две змеи соревнуются друг с другом, используя разные алгоритмы обучения с подкреплением (RL), написанные на PyTorch .

Результаты эксперимента оказались неоднозначными:

Интеллект: Агент успешно спроектировал архитектуру, создал пайплайны обучения и провел симуляции, выявив более эффективный подход .
Технические проблемы: Проект оказался слишком объемным. Агент создал все файлы внутри своей виртуальной машины, но не смог передать автору готовый ZIP-архив из-за ограничений интерфейса и перегрузки серверов .
Отсутствие обратной связи: Современным моделям (как Claude Code) часто не хватает возможности взглянуть на результат своей работы. Например, ИИ может написать код игры, но не видеть, что графика не рендерится, пока пользователь не скажет об этом .

🌍 Демократизация софта и будущее профессии 3:14

Кевин Вейл считает, что автоматизация кодинга окажет колоссальный «демократизирующий эффект» на мир . Он приводит пример из времен пандемии COVID-19, когда инициативная группа граждан не смогла создать сайт для отслеживания данных в своем городе, потому что все инженеры были заняты. В будущем, по мнению Вейла, любой человек сможет создать сложное ПО без специальных навыков .

Относительно будущего профессиональных разработчиков мнения разделились:

Позиция Вейла: Автоматизация избавит инженеров от рутины («typing ahead») и «бессмысленной работы», позволяя сосредоточиться на творческих и действительно сложных задачах .
Скептический взгляд: Существует риск появления огромного количества «ИИ-шлака» (AI slop). В этом случае ценность будут иметь только те эксперты, которые глубоко понимают устройство систем и способны исправлять ошибки за нейросетями .
Прогноз Wes Roth: Ведущий ожидает масштабных сокращений или смещения рабочих мест. По его мнению, работа, не требующая гениальности, а лишь «когнитивных усилий среднего уровня и большого объема печати», окажется под угрозой в первую очередь .

🔮 Новые горизонты: Blender и MCP 19:17

Развитие ИИ не ограничивается только текстом кода. Roth упоминает протокол Model Context Protocol (MCP) от Anthropic, который позволяет языковым моделям подключаться к любым внешним инструментам .

В качестве примера приводится интеграция Claude с Blender (ПО для 3D-моделирования). Теперь ИИ может напрямую создавать сложные 3D-объекты, например, «лоу-поли дракона, охраняющего сокровища», просто выполняя команды в профессиональном софте . Это подтверждает тезис о том, что автоматизация кодинга — лишь часть более масштабного процесса автоматизации цифрового производства.