Наступила новая эра в развитии искусственного интеллекта: компания OpenAI представила модель под кодовым названием Summit, которая официально стала GPT-5. В этом обзоре Уэс Рот (Wes Roth) анализирует возможности новой нейросети, которая уже возглавила мировые рейтинги, демонстрируя феноменальные способности к генерации сложного кода и 3D-симуляций за один запрос.
🏆 Новое слово в бенчмарках: GPT-5 против всех 0:12
По словам Уэса Рота, GPT-5 стала моделью номер один практически по всем ключевым метрикам. На текущий момент она удерживает самый высокий балл в LMSYS Chatbot Arena, опережая Gemini 1.5 Pro и другие ведущие разработки .
Ведущий отмечает следующие достижения модели:
- Первенство в категориях: написание текста, веб-разработка, компьютерное зрение, работа со сложными промптами (hard prompts), программирование, математика и креативность.
- Единственная сфера, где Gemini 1.5 Pro пока удерживает лидерство (в силу времени набора статистики) — это специфический тест на прохождение игры Pokemon, но, по мнению Рота, это лишь вопрос времени .
- Модель теперь доступна более чем миллиарду пользователей, включая тех, кто находится на бесплатном тарифе OpenAI .
Рот подчеркивает важный концептуальный сдвиг: GPT-5 — это не просто модель, а целая система, способная анализировать потребности пользователя и самостоятельно выстраивать стратегию решения задачи .
🚁 Виртуальный полет: Дрон-симулятор «в один клик» 1:46
Первым серьезным испытанием для нейросети стало создание 3D-симулятора полета дрона на JavaScript с использованием библиотеки Three.js. Уэс Рот использовал предельно простой запрос: создать симуляцию с текстурированными дорогами, машинами и зданиями, а также управлением через клавиши WASD .
Результаты эксперимента:
- Качество графики: Модель создала полноценный город, где у объектов есть тени, а машины выглядят как реальные автомобили .
- Поведение объектов: Рот был особенно впечатлен тем, что машины самостоятельно поворачивают на перекрестках, следуя разметке дорог .
- Управление и виды: GPT-5 реализовала несколько режимов камеры, включая вид от первого лица, вид сверху и следящую камеру «хвост в хвост» .
Ведущий утверждает, что это лучший результат «one-shot» (генерация с первого запроса) подобного рода, который он когда-либо видел . При этом изначально в коде отсутствовала система столкновений, но модель добавила её по первому короткому уточнению .
🏢 Брутализм и градостроительство: Генератор архитектуры 3:41
Вдохновившись примером Итана Моллика из «One Useful Thing», Уэс Рот протестировал возможности GPT-5 в процедурной генерации зданий в стиле архитектурного брутализма .
Модель сгенерировала комплексную систему за 52 секунды . Инструмент позволяет:
- Размещать здания простым кликом мыши и перемещать их по координатной сетке.
- Регулировать высоту (до 40 этажей), ширину и глубину фундамента.
- Кастомизировать высоту этажей, «сужение» (taper) зданий и использовать генерацию через «seed» для создания уникальных форм .
Хотя Рот в шутку пожаловался на «унылый и серый» вид брутализма, он поставил модели оценку «A+», отметив, что нейросеть идеально поняла человеческое намерение (intent), несмотря на примитивность промпта .
🚂 Логистика и железные дороги: Управление ресурсами 6:45
Следующим тестом стала сложная задача по созданию симуляции железной дороги с элементами экономики. GPT-5 должна была воссоздать мир, где поезда перевозят дерево, металл и нефть между различными станциями .
Основные факты о работе системы:
- Интерфейс: Модель реализовала панель мониторинга ресурсов на станциях Wood Bay, Steel Yard и Oil Depot .
- Логика: Поезда отслеживают уровень наполненности ресурсов и имеют систему предпочтений. Например, поезд может игнорировать дерево, если в его настройках указан приоритет на перевозку металла .
- Интеллект: Рот отмечает, что точность следования инструкциям (instruction following) у GPT-5 феноменальна. Несмотря на то, что пути имели странные углы в 90 градусов, вся внутренняя логика перемещения грузов работала безупречно .
🌖 Лунная миссия и «убийца» Minecraft 8:50
В блоке игровых тестов GPT-5 продемонстрировала навыки физического моделирования и попытки воссоздания легендарных игр.
Симулятор лунной посадки: За 1 минуту и 33 секунды нейросеть написала игру с низкой гравитацией, где игроку нужно аккуратно посадить модуль на поверхность Луны с помощью реактивной тяги . Модель добавила текстуры лунной поверхности и корректно реализовала эффект теней, меняющихся по мере приближения к почве .
Клон Minecraft: Рот попытался заставить нейросеть создать полноценный клон Minecraft за один запрос, включая систему крафта, добычу блоков и смену дня и ночи .
- Что удалось: Базовая 3D-среда, передвижение прыжками, коллизии с деревьями и система инвентаря.
- Что не сработало: В первой итерации возникла ошибка с захватом курсора в браузере (security error), из-за чего управление мышью работало некорректно .
- Вердикт: По мнению Рота, хотя «ваншот» не получился идеальным, GPT-5 фактически создала эквивалент ранней бета-версии Minecraft с работающими системами добычи и строительства .
🛠 Доступность и перспективы 12:58
В завершение обзора Уэс Рот признает, что GPT-5 — это «настоящий зверь», возможности которого только предстоит изучить. Он акцентирует внимание на том, что модель теперь обладает способностью к длительному рассуждению (thinking at length) .
Интересные подробности о доступе:
- В презентации OpenAI были замечены некоторые странности (Рот называет их «chart crimes» — некорректно оформленные графики), но это не умаляет прогресса самой модели .
- В ближайшие дни GPT-5 будет доступна бесплатно пользователям редактора кода Cursor (вероятно, для обладателей платных аккаунтов), как сообщил основатель проекта, посетивший стрим OpenAI .