Уэс Рот: «GPT-5 — это зверь, который создает симуляции в один клик»

Наступила новая эра в развитии искусственного интеллекта: компания OpenAI представила модель под кодовым названием Summit, которая официально стала GPT-5. В этом обзоре Уэс Рот (Wes Roth) анализирует возможности новой нейросети, которая уже возглавила мировые рейтинги, демонстрируя феноменальные способности к генерации сложного кода и 3D-симуляций за один запрос.

🏆 Новое слово в бенчмарках: GPT-5 против всех 0:12

По словам Уэса Рота, GPT-5 стала моделью номер один практически по всем ключевым метрикам. На текущий момент она удерживает самый высокий балл в LMSYS Chatbot Arena, опережая Gemini 1.5 Pro и другие ведущие разработки .

Ведущий отмечает следующие достижения модели:

Первенство в категориях: написание текста, веб-разработка, компьютерное зрение, работа со сложными промптами (hard prompts), программирование, математика и креативность.
Единственная сфера, где Gemini 1.5 Pro пока удерживает лидерство (в силу времени набора статистики) — это специфический тест на прохождение игры Pokemon, но, по мнению Рота, это лишь вопрос времени .
Модель теперь доступна более чем миллиарду пользователей, включая тех, кто находится на бесплатном тарифе OpenAI .

Рот подчеркивает важный концептуальный сдвиг: GPT-5 — это не просто модель, а целая система, способная анализировать потребности пользователя и самостоятельно выстраивать стратегию решения задачи .

🚁 Виртуальный полет: Дрон-симулятор «в один клик» 1:46

Первым серьезным испытанием для нейросети стало создание 3D-симулятора полета дрона на JavaScript с использованием библиотеки Three.js. Уэс Рот использовал предельно простой запрос: создать симуляцию с текстурированными дорогами, машинами и зданиями, а также управлением через клавиши WASD .

Результаты эксперимента:

Качество графики: Модель создала полноценный город, где у объектов есть тени, а машины выглядят как реальные автомобили .
Поведение объектов: Рот был особенно впечатлен тем, что машины самостоятельно поворачивают на перекрестках, следуя разметке дорог .
Управление и виды: GPT-5 реализовала несколько режимов камеры, включая вид от первого лица, вид сверху и следящую камеру «хвост в хвост» .

Ведущий утверждает, что это лучший результат «one-shot» (генерация с первого запроса) подобного рода, который он когда-либо видел . При этом изначально в коде отсутствовала система столкновений, но модель добавила её по первому короткому уточнению .

🏢 Брутализм и градостроительство: Генератор архитектуры 3:41

Вдохновившись примером Итана Моллика из «One Useful Thing», Уэс Рот протестировал возможности GPT-5 в процедурной генерации зданий в стиле архитектурного брутализма .

Модель сгенерировала комплексную систему за 52 секунды . Инструмент позволяет:

Размещать здания простым кликом мыши и перемещать их по координатной сетке.
Регулировать высоту (до 40 этажей), ширину и глубину фундамента.
Кастомизировать высоту этажей, «сужение» (taper) зданий и использовать генерацию через «seed» для создания уникальных форм .

Хотя Рот в шутку пожаловался на «унылый и серый» вид брутализма, он поставил модели оценку «A+», отметив, что нейросеть идеально поняла человеческое намерение (intent), несмотря на примитивность промпта .

🚂 Логистика и железные дороги: Управление ресурсами 6:45

Следующим тестом стала сложная задача по созданию симуляции железной дороги с элементами экономики. GPT-5 должна была воссоздать мир, где поезда перевозят дерево, металл и нефть между различными станциями .

Основные факты о работе системы:

Интерфейс: Модель реализовала панель мониторинга ресурсов на станциях Wood Bay, Steel Yard и Oil Depot .
Логика: Поезда отслеживают уровень наполненности ресурсов и имеют систему предпочтений. Например, поезд может игнорировать дерево, если в его настройках указан приоритет на перевозку металла .
Интеллект: Рот отмечает, что точность следования инструкциям (instruction following) у GPT-5 феноменальна. Несмотря на то, что пути имели странные углы в 90 градусов, вся внутренняя логика перемещения грузов работала безупречно .

🌖 Лунная миссия и «убийца» Minecraft 8:50

В блоке игровых тестов GPT-5 продемонстрировала навыки физического моделирования и попытки воссоздания легендарных игр.

Симулятор лунной посадки: За 1 минуту и 33 секунды нейросеть написала игру с низкой гравитацией, где игроку нужно аккуратно посадить модуль на поверхность Луны с помощью реактивной тяги . Модель добавила текстуры лунной поверхности и корректно реализовала эффект теней, меняющихся по мере приближения к почве .

Клон Minecraft: Рот попытался заставить нейросеть создать полноценный клон Minecraft за один запрос, включая систему крафта, добычу блоков и смену дня и ночи .

Что удалось: Базовая 3D-среда, передвижение прыжками, коллизии с деревьями и система инвентаря.
Что не сработало: В первой итерации возникла ошибка с захватом курсора в браузере (security error), из-за чего управление мышью работало некорректно .
Вердикт: По мнению Рота, хотя «ваншот» не получился идеальным, GPT-5 фактически создала эквивалент ранней бета-версии Minecraft с работающими системами добычи и строительства .

🛠 Доступность и перспективы 12:58

В завершение обзора Уэс Рот признает, что GPT-5 — это «настоящий зверь», возможности которого только предстоит изучить. Он акцентирует внимание на том, что модель теперь обладает способностью к длительному рассуждению (thinking at length) .

Интересные подробности о доступе:

В презентации OpenAI были замечены некоторые странности (Рот называет их «chart crimes» — некорректно оформленные графики), но это не умаляет прогресса самой модели .
В ближайшие дни GPT-5 будет доступна бесплатно пользователям редактора кода Cursor (вероятно, для обладателей платных аккаунтов), как сообщил основатель проекта, посетивший стрим OpenAI .