Уэс Рот: «GPT-5 — это зверь, который создает симуляции в один клик»

Wes Roth 58,9 тыс. 13 мин 4 мин 07.08.2025
Главное

Наступила новая эра в развитии искусственного интеллекта: компания OpenAI представила модель под кодовым названием Summit, которая официально стала GPT-5. В этом обзоре Уэс Рот (Wes Roth) анализирует возможности новой нейросети, которая уже возглавила мировые рейтинги, демонстрируя феноменальные способности к генерации сложного кода и 3D-симуляций за один запрос.

🏆 Новое слово в бенчмарках: GPT-5 против всех 0:12

По словам Уэса Рота, GPT-5 стала моделью номер один практически по всем ключевым метрикам. На текущий момент она удерживает самый высокий балл в LMSYS Chatbot Arena, опережая Gemini 1.5 Pro и другие ведущие разработки .

Ведущий отмечает следующие достижения модели:

Рот подчеркивает важный концептуальный сдвиг: GPT-5 — это не просто модель, а целая система, способная анализировать потребности пользователя и самостоятельно выстраивать стратегию решения задачи .

🚁 Виртуальный полет: Дрон-симулятор «в один клик» 1:46

Первым серьезным испытанием для нейросети стало создание 3D-симулятора полета дрона на JavaScript с использованием библиотеки Three.js. Уэс Рот использовал предельно простой запрос: создать симуляцию с текстурированными дорогами, машинами и зданиями, а также управлением через клавиши WASD .

Результаты эксперимента:

  1. Качество графики: Модель создала полноценный город, где у объектов есть тени, а машины выглядят как реальные автомобили .
  2. Поведение объектов: Рот был особенно впечатлен тем, что машины самостоятельно поворачивают на перекрестках, следуя разметке дорог .
  3. Управление и виды: GPT-5 реализовала несколько режимов камеры, включая вид от первого лица, вид сверху и следящую камеру «хвост в хвост» .

Ведущий утверждает, что это лучший результат «one-shot» (генерация с первого запроса) подобного рода, который он когда-либо видел . При этом изначально в коде отсутствовала система столкновений, но модель добавила её по первому короткому уточнению .

🏢 Брутализм и градостроительство: Генератор архитектуры 3:41

Вдохновившись примером Итана Моллика из «One Useful Thing», Уэс Рот протестировал возможности GPT-5 в процедурной генерации зданий в стиле архитектурного брутализма .

Модель сгенерировала комплексную систему за 52 секунды . Инструмент позволяет:

Хотя Рот в шутку пожаловался на «унылый и серый» вид брутализма, он поставил модели оценку «A+», отметив, что нейросеть идеально поняла человеческое намерение (intent), несмотря на примитивность промпта .

🚂 Логистика и железные дороги: Управление ресурсами 6:45

Следующим тестом стала сложная задача по созданию симуляции железной дороги с элементами экономики. GPT-5 должна была воссоздать мир, где поезда перевозят дерево, металл и нефть между различными станциями .

Основные факты о работе системы:

🌖 Лунная миссия и «убийца» Minecraft 8:50

В блоке игровых тестов GPT-5 продемонстрировала навыки физического моделирования и попытки воссоздания легендарных игр.

Симулятор лунной посадки: За 1 минуту и 33 секунды нейросеть написала игру с низкой гравитацией, где игроку нужно аккуратно посадить модуль на поверхность Луны с помощью реактивной тяги . Модель добавила текстуры лунной поверхности и корректно реализовала эффект теней, меняющихся по мере приближения к почве .

Клон Minecraft: Рот попытался заставить нейросеть создать полноценный клон Minecraft за один запрос, включая систему крафта, добычу блоков и смену дня и ночи .

🛠 Доступность и перспективы 12:58

В завершение обзора Уэс Рот признает, что GPT-5 — это «настоящий зверь», возможности которого только предстоит изучить. Он акцентирует внимание на том, что модель теперь обладает способностью к длительному рассуждению (thinking at length) .

Интересные подробности о доступе:

💬 Цитаты

«GPT5 — это самая умная модель, которую мы когда-либо создавали. Это не просто одна модель, это целая система.»

«Она почти уничтожила уровень беты Minecraft с первой попытки: добыча, строительство, цикл дня и ночи — все системы были на месте.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
One-shot (в контексте ИИ)
Способность модели решать задачу за одну итерацию без дополнительных уточнений.
Бенчмарк
Контрольный тест для оценки производительности алгоритма или модели.
LMSYS Chatbot Arena
Открытая платформа для сравнительного тестирования языковых моделей пользователями.
Брутализм
Архитектурный стиль, характеризующийся использованием массивных бетонных конструкций и простых геометрических форм.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект OpenAI GPT-5 Three.js LMSYS Arena Wes Roth