Компания OpenAI готовится к выпуску своей новой модели под кодовым названием Strawberry, которая может изменить привычный формат взаимодействия с искусственным интеллектом. Ведущий канала Wes Roth анализирует последние утечки, технические особенности новой архитектуры и обсуждает, сможет ли этот релиз оправдать завышенные ожидания инвесторов или станет «ушатом холодной воды» для рынка ИИ.
🍓 Strawberry: релиз «модели-мыслителя» уже в сентябре 0:00
Согласно данным издания The Information, OpenAI планирует интегрировать модель Strawberry в сервис ChatGPT в ближайшие две недели . Пока неясно, будет ли это отдельная опция в выпадающем меню или самостоятельный продукт, но ключевое отличие модели уже известно: она берет паузу перед тем, как ответить.
По словам Уэса Рота, главные особенности Strawberry заключаются в следующем:
- Этап «обдумывания»: модель тратит от 10 до 20 seconds на внутреннюю обработку запроса перед выдачей ответа .
- Улучшенное рассуждение: архитектура ориентирована на решение сложных математических задач, написание кода и многошаговое планирование .
- Встроенная цепочка мыслей (Chain of Thought): в отличие от текущих моделей, где пользователя просят добавлять промпт «думай шаг за шагом», в Strawberry этот механизм встроен на уровне системы .
- «Черновик» (Scratchpad): предполагается, что модель использует невидимое для пользователя пространство для предварительных рассуждений, прежде чем выдать финальный результат .
🧠 От мгновенных ответов к агентскому поведению 2:09
Вес Рот подчеркивает, что Strawberry знаменует собой переход от модели «поисковика» к модели «сотрудника». Если на вопрос о погоде ответ нужен мгновенно, то для сложных бизнес-стратегий или разработки приложений ожидание вполне оправдано .
Автор приводит аналогию с офисной работой:
- Модель-интерн: вы даете задание сотруднику и не ждете, что он выполнит его мгновенно. Он уходит, работает несколько часов или дней и возвращается с результатом .
- Фоновое выполнение: Strawberry может стать важным шагом к созданию ИИ-агентов, которые самостоятельно проектируют код, проводят отладку и выдают готовое решение, пока пользователь занят другими делами .
⚖️ Скепсис тестеров и «угроза человечеству» 3:43
Несмотря на ажиотаж, первые отзывы тестеров, по сообщениям СМИ, оказались неоднозначными. Существует разрыв между слухами о «невероятной мощи» модели и реальностью.
Основные противоречия, которые отмечает блогер:
- Сроки: Филипп Степс предполагает, что релиз может состояться до 24 сентября .
- Уровень опасности: бывшие сотрудники OpenAI и агентство Reuters ранее заявляли, что проект (ранее известный как Q*) якобы представляет угрозу для человечества из-за способности к рассуждению человеческого уровня .
- Реальная производительность: по данным Bloomberg, ранние тестеры считают, что незначительное улучшение качества ответов не стоит 20-секундного ожидания .
- Скрытые возможности: существует мнение, что публике представят лишь «урезанную» (квантованную) версию Strawberry, в то время как полная модель останется в лабораториях .
📉 Риски для OpenAI и «пузырь» ожиданий 6:33
Вес Рот выражает опасение, что на OpenAI сейчас лежит колоссальная ответственность. Компанию воспринимают как обладателя «инопланетных технологий», что стимулирует огромные инвестиции в сектор .
По мнению автора, если Strawberry окажется лишь незначительным улучшением, это может привести к печальным последствиям:
- Охлаждение хайпа: если следующая модель не продемонстрирует качественный скачок (на порядок лучше нынешних), это станет «ушатом холодной воды» для инвесторов .
- Кадровый вопрос: уход ключевых фигур, таких как Андрей Карпати (Andrej Karpathy), который основал собственную образовательную компанию, вызывает вопросы о том, действительно ли OpenAI находится на пороге создания AGI .
- Стагнация: если развитие моделей замедлится до 10–20% прироста эффективности вместо ожидаемых 10-кратных скачков, «поезд хайпа» можно будет считать официально остановившимся .
🚀 GPT Next: надежда на 100-кратный прогресс 9:47
В завершение Вес Рот упоминает новости из японского офиса OpenAI. Представители компании обсуждают следующую крупную модель под кодовым названием «GPT Next» .
Согласно этим заявлениям:
- Ожидается, что эффективная вычислительная мощность новой модели будет в 100 раз превышать показатели GPT-4 .
- Этот прогресс будет достигнут не только за счет «железа», но и благодаря алгоритмическим улучшениям .
- Каждый переход (от GPT-2 к GPT-3 и далее к GPT-4) сопровождался подобным порядковым увеличением возможностей .
Забавное отступление: В середине ролика Рот упоминает виральное видео от Eckler by Design, в котором Apple якобы представляет «iPhone Skin Interface» — гаджеты, обтянутые человеческой кожей . Блогер подчеркивает, что это лишь качественная пародия, демонстрирующая возможности современного CGI и ИИ в создании тревожного контента.