OpenAI Codex: революция в разработке или продвинутая поисковая машина по GitHub?

Machine Learning Street Talk 7,9 тыс. 53 мин 4 мин 01.09.2021
Главное

OpenAI Codex вызвал волну восторженных отзывов в сети, однако за виральными роликами скрывается сложная реальность: от 90% ошибок при генерации до споров о том, является ли это настоящим интеллектом или просто продвинутой поисковой машиной. В рамках дискуссии на канале Machine Learning Street Talk эксперты Янник Килчер, Коннор Лихи и Валид Саба разобрали технические возможности и фундаментальные ограничения новой модели.

🕹️ Испытание в «песочнице»: первые впечатления и подводные камни 0:00

Первое знакомство с OpenAI Codex часто вызывает восторженную реакцию, сравнимую с детским азартом . В ходе демонстрации участники пытались создавать простые игры и интерфейсы с помощью текстовых команд. Однако ведущий Machine Learning Street Talk отмечает критическую проблему — «предвзятость выбора» (selection bias) в видеороликах о Codex .

По словам ведущего, около 90% времени при работе с моделью уходит на исправление ошибок, которые остаются за кадром в большинстве демонстраций .

В процессе тестирования были получены следующие результаты:

Ведущий подчеркивает, что Codex генерирует код, подходящий скорее для «одноразового использования», и пока не способен помочь в написании ПО корпоративного уровня .

🛠️ Мнение Коннора Лихи: Копилот как инструмент для «рутинной работы» 18:50

Коннор Лихи охарактеризовал Codex как «ожидаемый», но впечатляющий прогресс по сравнению с GPT-3 . Он отметил, что GPT-3 изначально имела крайне неэффективный токенизатор для кода (например, каждый пробел в отступе мог считаться отдельным токеном), поэтому создание специализированной модели было логичным шагом .

Ключевые тезисы Коннора Лихи:

Лихи также высказал спорную мысль: «Достаточно сложная интерполяция или достаточно сложное запоминание неотличимы от интеллекта» . Он считает, что многие критики используют слово «просто» (например, «просто запоминание»), чтобы обесценить возможности нейросетей, хотя люди часто ведут себя аналогично моделям .

⚖️ Янник Килчер о необходимости контроля и «судебном» программировании 35:47

Янник Килчер считает, что Codex пока не готов к полноценному использованию в том виде, в котором его рекламируют . По его мнению, пользователь всё ещё должен уметь программировать, чтобы:

  1. Читать и проверять сгенерированный код на наличие ошибок .
  2. Переформулировать запросы, когда модель не понимает контекст (например, зацикливание функции проверки столкновения шаров) .
  3. Вносить правки вручную .

Янник Килчер выделяет сильные стороны модели:

Килчер сравнил Codex с беспилотными автомобилями: со временем мы можем привыкнуть к тому, что машины совершают меньше ошибок, чем люди, даже если их промахи иногда будут выглядеть нелепо .

🔍 Валид Саба: Информационный поиск против абстрактного мышления 43:31

Валид Саба выразил восхищение техническим достижением OpenAI, назвав сопряжение естественного языка с кодом «очень крутым» . Однако он строго разделяет внешнюю эффектность и реальный ИИ.

Основные выводы Валида Сабы:

Саба видит будущее этой технологии в образовании: Codex может генерировать «скелеты» кода или примеры для новичков и студентов . Однако «автоматическое программирование» в полном смысле слова, по мнению учёного, всё ещё остаётся мечтой .

🏁 Резюме: Инструмент для чистого листа 50:55

Участники дискуссии сошлись на том, что на текущем этапе Codex наиболее полезен в режиме «старта с нуля» (blank slate), когда нужно быстро набросать структуру проекта . Использование модели в контексте жизненного цикла разработки крупного ПО на существующей кодовой базе пока видится затруднительным.

По мнению ведущего, несмотря на магические моменты «вау-эффекта», реальность такова, что инструмент пока не экономит время опытного инженера, так как требует постоянной проверки и отладки .

💬 Цитаты

«Сложное запоминание или достаточно сложная интерполяция неотличимы от интеллекта.»

Коннор Лихи 28:09

«Эта штука не генерирует новый код... автоматическое программирование — всё еще мечта.»

Валид Саба 50:41

«Я бы предпочел, чтобы мой компилятор писал ассемблер, а не человек.»

Янник Килчер 41:33
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Boilerplate code
Повторяющиеся фрагменты кода, которые необходимы для работы программы, но не несут основной логики.
Information Retrieval (IR)
Процесс поиска и извлечения релевантной информации из больших массивов данных.
SVM (Support Vector Machine)
Алгоритм машинного обучения, используемый для задач классификации и регрессии.
Tokenizer
Компонент нейросети, разбивающий входной текст на мелкие единицы (токены) для обработки.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект OpenAI Codex GitHub Copilot Yannic Kilcher Connor Leahy Walid Saba