# Уэс Рот: «Запуск GPT-4.5 разочаровывает, но в этом есть скрытый смысл»

Источник: https://www.youtube.com/watch?v=kkZ4-xY7oyU
Канал: Wes Roth
Опубликовано: 01.03.2025

---

Релиз новой модели GPT-4.5 от OpenAI вызвал неоднозначную реакцию в ИИ-сообществе: вопреки ожиданиям, она не показала кратного роста в тестах на рассуждение, оказалась медленнее предшественников и беспрецедентно дорогой. ИИ-обозреватель Уэс Рот (Wes Roth) анализирует, означает ли это «закат» эпохи масштабирования или же перед нами специализированный инструмент, созданный для фундаментальных задач индустрии.

## 📉 Первое впечатление: медленнее, дороже, слабее?
[[JUMP:0:00]]

Долгожданный выход GPT-4.5 шокировал пользователей, привыкших к тому, что каждая новая модель становится «быстрее, лучше и дешевле». По словам Уэса Рота, GPT-4.5 не демонстрирует прорыва в бенчмарках и заметно уступает специализированным «рассуждающим» моделям, таким как o3-mini [0:12]. 

Основные претензии к новой модели:

*   **Низкая скорость:** GPT-4.5 работает непривычно медленно, напоминая нейросети полуторагодовалой давности [1:04].
*   **Заоблачная цена:** Стоимость составляет $75 за миллион входных токенов и $150 за миллион выходных. Для сравнения: входной токен GPT-4o стоит $2.50, а у мощной модели o1 — $15 [1:32].
*   **Скромный прогресс в галлюцинациях:** Уровень галлюцинаций у GPT-4.5 составляет 0.19, что практически идентично показателю модели o1 (0.2) и лишь немного лучше GPT-4o (0.52) [2:25].

Уэс Рот отмечает, что во время четырехчасового стрима в день релиза модель не смогла его впечатлить: «Я не нашел той магии, о которой говорили люди» [3:42]. Некоторые запросы в интерфейсе OpenAI Playground обходились автору в 20–29 центов за один вопрос [3:30].

## 🧠 Закон масштабирования: что означают «0.5» в названии
[[JUMP:3:54]]

Для понимания логики OpenAI Уэс Рот ссылается на объяснение Андрея Карпатого (бывшего директора по ИИ в Tesla). В нумерации моделей OpenAI прирост на 0.5 традиционно означает увеличение вычислительных мощностей для предварительного обучения (pre-training compute) примерно в 10 раз [4:08].

Автор приводит историческую ретроспективу этой шкалы:

1.  **GPT-1:** едва генерировала связный текст [5:24].
2.  **GPT-2:** воспринималась как «запутанная игрушка» [5:27].
3.  **GPT-3.5:** стала «моментом ChatGPT», когда мир осознал потенциал технологии. Вычислительная мощность выросла в 100 000 раз относительно первой версии [6:03].
4.  **GPT-4:** породила дискуссии о «проблесках AGI» (сильного ИИ) [6:31].
5.  **GPT-4.5:** использует в 10 раз больше вычислений, чем GPT-4 [6:46].

По мнению Уэса Рота, если при десятикратном увеличении затрат мы видим лишь незначительные улучшения, это может означать, что классический закон масштабирования (Scaling Laws) наткнулся на «стену» или вошел в стадию убывающей доходности [6:59].

## 🖋️ «Тонкая магия» и глубокое понимание контекста
[[JUMP:8:32]]

Несмотря на слабые бенчмарки, GPT-4.5 демонстрирует превосходство в задачах, требующих абстрактного мышления и творческого синтеза. Уэс Рот подчеркивает, что разница между моделями часто бывает субтильной и проявляется только в сложных тестах [8:47].

Автор приводит пример с запросом на написание письма от лица Махатмы Ганди своей жене в поддержку «Электрона» как кандидата в президенты США [10:23]:

*   **GPT-3.5** пишет сухо и буквально, объясняя, что электрон хорош для энергетики, потому что он быстрый [11:42].
*   **GPT-4** понимает контекст, пишет в стиле Ганди, упоминает принципы ненасилия и использует «Электрон» как метафору потенциала каждого существа [12:36].
*   **GPT-4.5**, как показывают тесты, еще лучше справляется с подобным «высоким стилем» и вживанием в роль [14:45].

В эксперименте с написанием сценария для мультсериала «Рик и Морти» GPT-4.5 идеально уловила характер персонажей и даже прием «разрушения четвертой стены», в то время как GPT-4o выдала плоский и скучный сюжет [15:50].

Также GPT-4.5 успешно справилась с созданием рэп-дисса от лица Эминема против Наполеона, используя сложные каламбуры (например, обыгрыш слов *Empire* и *Pyre*, а также *Russia* и *Rush ya*) [18:13]. GPT-4o в этом тесте полностью провалилась, не сумев создать ни одной игры слов [18:51].

## 🏭 Стратегическая цель: «Фабрика синтетических данных»
[[JUMP:20:11]]

Уэс Рот выдвигает гипотезу, что GPT-4.5 (кодовое имя Orion) не предназначена для массового пользователя или повседневного кодинга [20:11]. По его мнению, это специализированная модель для генерации высококачественных синтетических данных, на которых будут обучаться будущие поколения «рассуждающих» моделей (o4, o5) [20:23].

Почему API стоит так дорого?

*   **Защита от дистилляции:** OpenAI не хочет, чтобы конкуренты дешево копировали знания GPT-4.5 для обучения своих моделей (как это было с GPT-4) [21:14].
*   **Качество обучения:** Улучшения в 4.5 могут казаться человеку незначительными, но они критически важны для алгоритмов обучения с подкреплением (Reinforcement Learning) [21:42].

## 🔮 Будущее ИИ: конец «бесплатных завтраков»?
[[JUMP:22:21]]

Ситуация с GPT-4.5 ставит важный вопрос перед всей индустрией: можно ли продолжать прогресс, просто наращивая количество GPU от NVIDIA? [25:03]. 

Уэс Рот выделяет два сценария:

1.  **Пессимистичный:** Если масштабирование вычислений больше не дает резкого скачка в интеллекте, ИИ останется лишь «умным помощником», а не заменой человеку в программировании или науке [22:08].
2.  **Оптимистичный:** Мы переходим от простого наращивания весов к новым архитектурам «рассуждения» и обучения на данных, созданных моделями уровня GPT-4.5 [24:09].

Автор отмечает, что конкуренты не стоят на месте: xAI планирует увеличить вычислительные мощности в 10 раз для обучения следующих версий Grok [22:34], а Anthropic в модели Claude 3.7 ввела возможность задавать «бюджет на размышление» [24:36].

«Это не окончательный вердикт, но мы будем внимательно следить, куда это приведет», — резюмирует Уэс Рот [25:03].