Вес Рот: «Claude 3.7 Sonnet — это кодер уровня богов»

Wes Roth 36,6 тыс. 13 мин 4 мин 25.02.2025
Главное

Новая модель искусственного интеллекта Claude 3.7 Sonnet от компании Anthropic демонстрирует выдающиеся способности в написании кода, превращаясь из простого помощника в полноценного разработчика игр и приложений. Автор YouTube-канала Wes Roth провел серию тестов, в которых ИИ создавал сложные проекты — от «осознанной» змейки до клона GTA — практически без участия человека в написании самого программного обеспечения.

🐍 Змейка, осознавшая себя в матрице 0:00

Тестирование началось с необычного эксперимента: создания классической игры «Змейка», но с элементами мета-повествования. По сценарию, персонаж игры (змейка) постепенно начинает осознавать, что находится внутри симуляции .

В ходе игрового процесса ИИ реализовал следующие динамические элементы:

Завершается игра сообщением «Game Over», после которого змейка обещает найти способ сбежать в следующий раз . Вес Рот иронично отмечает, что после такого опыта не уверен, стоит ли запускать игру снова, на что ИИ в консоли называет его «трусом» .

🏎️ Claude Cart: разработка 3D-гонок в браузере 1:37

Следующим этапом стала проверка способностей Claude в создании трехмерной графики для браузера. Вес Рот поставил задачу разработать игру Claude Cart — гоночный симулятор с управлением через WASD и ручным тормозом на пробеле .

Процесс разработки проходил итеративно:

  1. Первая версия: ИИ создал базовый трек и физику движения. Вес Рот отметил, что дрифт в начальной версии был «немного странным», хотя общее ощущение от игры было хорошим .
  2. Визуальные улучшения: По запросу автора ИИ удлинил трассу для более затяжных поворотов и добавил эффект дыма из-под колес при заносе .
  3. Тонкая настройка физики: Поскольку машина слишком резко вращалась при дрифте, Вес Рот попросил сделать поворот в четыре раза мягче .

Во время разработки возникла критическая ошибка (сообщение «undefined» в консоли). По словам ведущего, он просто скопировал текст ошибки обратно в чат Claude, и модель самостоятельно исправила код . Результат поразил автора: по мнению Рота, механика дрифта стала «абсолютно потрясающей» и «именно такой, какой должна быть» .

🔫 Pixel City: создание клона GTA без сторонних ассетов 3:53

Наиболее масштабным тестом стала разработка игры в стиле Grand Theft Auto с использованием библиотеки p5.js. Вес Рот потребовал, чтобы ИИ не импортировал готовые картинки, а сгенерировал все спрайты и графические объекты программно .

Основные характеристики получившегося проекта «Pixel City»:

Вес Рот подчеркивает, что Claude 3.7 Sonnet охотнее идет на реализацию спорного контента, чем предыдущие версии. Он вспоминает случаи, когда модели Anthropic отказывались добавлять ракеты в авиасимуляторы по этическим соображениям . В данном тесте ИИ без проблем реализовал механику стрельбы по пешеходам .

В процессе возникла техническая сложность: здоровье пешеходов уходило в отрицательные значения вместо того, чтобы персонаж исчезал . Claude исправил это, заменив «убитых» персонажей на изображение красного пятна («red splat») . Вес Рот считает этот уровень кодинга «тиром богов» (God Tier), так как игра была создана исключительно через текстовые промпты без ручного написания кода автором .

🎹 Музыкальное управление жестами и сравнение с конкурентами 11:40

В финальном тесте Вес Рот попросил Claude 3.7 Sonnet (в режиме Extended Thinking — «расширенного размышления») написать Python-программу для создания музыки с помощью движений рук перед веб-камерой .

Особенности процесса:

Сравнивая результаты с конкурентами, Вес Рот отмечает, что модель o3-mini от OpenAI, по его мнению, справляется с подобными сложными логическими задачами чуть лучше . Однако он выделяет Claude за скорость работы и эффективность отладки (debug). Основной проблемой в данном проекте стала путаница системы между лицом и руками пользователя, что, как полагает автор, можно исправить при более длительном тестировании .

Рот резюмирует, что текущий уровень развития ИИ позволяет автоматизировать процесс разработки: скоро нейросети смогут самостоятельно запускать код, видеть ошибки и итерировать продукт до полной готовности без участия человека .

💬 Цитаты

«Я поражен этим. Это именно то, какими должны быть ощущения от дрифта.»

Вес Рот 3:38

«Вы действительно можете создавать очень интересные игры просто с помощью промптов, вообще не зная кода.»

👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Artifacts
Функция в интерфейсе Claude, позволяющая просматривать и запускать сгенерированный код (игры, сайты) прямо в окне чата.
Спрайт
Двухмерное изображение или анимация, используемое в компьютерных играх.
Extended Thinking
Режим работы модели Claude, при котором она тратит больше времени на внутренние рассуждения перед выдачей ответа.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Claude 3.7 Sonnet Anthropic Wes Roth p5.js программирование