OpenAI Strawberry: революция в рассуждениях или лишние 20 секунд ожидания?

Компания OpenAI готовится к выпуску своей новой модели под кодовым названием Strawberry, которая может изменить привычный формат взаимодействия с искусственным интеллектом. Ведущий канала Wes Roth анализирует последние утечки, технические особенности новой архитектуры и обсуждает, сможет ли этот релиз оправдать завышенные ожидания инвесторов или станет «ушатом холодной воды» для рынка ИИ.

🍓 Strawberry: релиз «модели-мыслителя» уже в сентябре 0:00

Согласно данным издания The Information, OpenAI планирует интегрировать модель Strawberry в сервис ChatGPT в ближайшие две недели . Пока неясно, будет ли это отдельная опция в выпадающем меню или самостоятельный продукт, но ключевое отличие модели уже известно: она берет паузу перед тем, как ответить.

По словам Уэса Рота, главные особенности Strawberry заключаются в следующем:

Этап «обдумывания»: модель тратит от 10 до 20 seconds на внутреннюю обработку запроса перед выдачей ответа .
Улучшенное рассуждение: архитектура ориентирована на решение сложных математических задач, написание кода и многошаговое планирование .
Встроенная цепочка мыслей (Chain of Thought): в отличие от текущих моделей, где пользователя просят добавлять промпт «думай шаг за шагом», в Strawberry этот механизм встроен на уровне системы .
«Черновик» (Scratchpad): предполагается, что модель использует невидимое для пользователя пространство для предварительных рассуждений, прежде чем выдать финальный результат .

🧠 От мгновенных ответов к агентскому поведению 2:09

Вес Рот подчеркивает, что Strawberry знаменует собой переход от модели «поисковика» к модели «сотрудника». Если на вопрос о погоде ответ нужен мгновенно, то для сложных бизнес-стратегий или разработки приложений ожидание вполне оправдано .

Автор приводит аналогию с офисной работой:

Модель-интерн: вы даете задание сотруднику и не ждете, что он выполнит его мгновенно. Он уходит, работает несколько часов или дней и возвращается с результатом .
Фоновое выполнение: Strawberry может стать важным шагом к созданию ИИ-агентов, которые самостоятельно проектируют код, проводят отладку и выдают готовое решение, пока пользователь занят другими делами .

⚖️ Скепсис тестеров и «угроза человечеству» 3:43

Несмотря на ажиотаж, первые отзывы тестеров, по сообщениям СМИ, оказались неоднозначными. Существует разрыв между слухами о «невероятной мощи» модели и реальностью.

Основные противоречия, которые отмечает блогер:

Сроки: Филипп Степс предполагает, что релиз может состояться до 24 сентября .
Уровень опасности: бывшие сотрудники OpenAI и агентство Reuters ранее заявляли, что проект (ранее известный как Q*) якобы представляет угрозу для человечества из-за способности к рассуждению человеческого уровня .
Реальная производительность: по данным Bloomberg, ранние тестеры считают, что незначительное улучшение качества ответов не стоит 20-секундного ожидания .
Скрытые возможности: существует мнение, что публике представят лишь «урезанную» (квантованную) версию Strawberry, в то время как полная модель останется в лабораториях .

📉 Риски для OpenAI и «пузырь» ожиданий 6:33

Вес Рот выражает опасение, что на OpenAI сейчас лежит колоссальная ответственность. Компанию воспринимают как обладателя «инопланетных технологий», что стимулирует огромные инвестиции в сектор .

По мнению автора, если Strawberry окажется лишь незначительным улучшением, это может привести к печальным последствиям:

Охлаждение хайпа: если следующая модель не продемонстрирует качественный скачок (на порядок лучше нынешних), это станет «ушатом холодной воды» для инвесторов .
Кадровый вопрос: уход ключевых фигур, таких как Андрей Карпати (Andrej Karpathy), который основал собственную образовательную компанию, вызывает вопросы о том, действительно ли OpenAI находится на пороге создания AGI .
Стагнация: если развитие моделей замедлится до 10–20% прироста эффективности вместо ожидаемых 10-кратных скачков, «поезд хайпа» можно будет считать официально остановившимся .

🚀 GPT Next: надежда на 100-кратный прогресс 9:47

В завершение Вес Рот упоминает новости из японского офиса OpenAI. Представители компании обсуждают следующую крупную модель под кодовым названием «GPT Next» .

Согласно этим заявлениям:

Ожидается, что эффективная вычислительная мощность новой модели будет в 100 раз превышать показатели GPT-4 .
Этот прогресс будет достигнут не только за счет «железа», но и благодаря алгоритмическим улучшениям .
Каждый переход (от GPT-2 к GPT-3 и далее к GPT-4) сопровождался подобным порядковым увеличением возможностей .

Забавное отступление: В середине ролика Рот упоминает виральное видео от Eckler by Design, в котором Apple якобы представляет «iPhone Skin Interface» — гаджеты, обтянутые человеческой кожей . Блогер подчеркивает, что это лишь качественная пародия, демонстрирующая возможности современного CGI и ИИ в создании тревожного контента.