# Plot Twist в индустрии ИИ: как новые открытые модели OpenAI догнали лидеров

Источник: https://www.youtube.com/watch?v=NyW7EDFmWl4
Канал: Wes Roth
Опубликовано: 05.08.2025

---

Появление новых моделей от OpenAI под названием GPT-OSS (Open Source Software) стало настоящим потрясением для индустрии искусственного интеллекта, фактически стирая грань между закрытыми коммерческими системами и открытыми решениями. Автор канала Уэс Рот (Wes Roth) анализирует этот неожиданный «сюжетный поворот», который возвращает компанию к её истокам и задает новую планку для всей экосистемы ИИ.

## 🚀 Прорыв в Open Source: GPT-OSS ломает стереотипы
[[JUMP:0:00]]

OpenAI представила две модели с открытыми весами — GPT-OSS 120B и GPT-OSS 20B, которые распространяются по лицензии Apache 2.0. Это означает, что их можно использовать в коммерческих целях, модифицировать и создавать на их базе собственные продукты [1:05]. 

Основные характеристики моделей поражают воображение:

*   **GPT-OSS 120B:** Модель со 120 миллиардами параметров, которая по результатам тестов практически сравнялась с такими гигантами, как o3 и o4-mini [0:14]. Что особенно важно, она способна работать на одной видеокарте с 80 ГБ видеопамяти [3:07].
*   **GPT-OSS 20B:** Компактная версия, предназначенная для работы на потребительских устройствах (Edge devices) с 16 ГБ оперативной памяти [3:20].
*   **Эффективность (MoE):** Обе модели используют архитектуру Mixture of Experts (смесь экспертов). В версии 120B при каждом запросе активируется всего 5,1 млрд параметров, а в версии 20B — 3,6 млрд, что радикально снижает затраты на вычисления [5:49].

Уэс Рот отмечает, что до этого момента многие скептически советовали OpenAI сменить название на «ClosedAI», намекая на закрытость их разработок. Однако этот релиз делает подобные шутки неактуальными [0:39]. По мнению автора, выпуск таких мощных моделей в открытый доступ — это стратегический ход, который предваряет выход GPT-5. Чтобы релиз GPT-5 имел смысл, следующая флагманская модель должна значительно превосходить возможности GPT-OSS [0:53].

## 🧪 «Секретный соус»: техника Universal Verifier
[[JUMP:2:00]]

Модели обучались с использованием передовых методов обучения с подкреплением (Reinforcement Learning), которые OpenAI применяла для своих внутренних флагманских систем [2:00]. 

Одним из ключевых факторов успеха стала технология, известная как **Universal Verifier** («Универсальный верификатор»). По данным портала The Information, на которые ссылается Рот, это автоматизированный способ проверки качества ответов модели во время обучения [2:15]. 

Особенности использования верификаторов:

1.  Модель обучается выдавать правильные ответы в областях с четкой логикой (математика, код), где результат можно проверить однозначно [2:28].
2.  Благодаря этой технике GPT-OSS демонстрирует выдающийся уровень в задачах рассуждения (reasoning), сопоставимый с лидерами индустрии [2:41].
3.  Разработчики могут настраивать уровень «усилий» при рассуждении (low, medium, high) с помощью одной инструкции в системном сообщении, аналогично серии «o» в API OpenAI [6:41].

## 📊 Сравнение производительности: тесты не лгут
[[JUMP:7:20]]

Уэс Рот приводит впечатляющие цифры из бенчмарков, где открытая модель GPT-OSS 120B идет «ноздря в ноздрю» с проприетарными лидерами:

*   **Codeforces (программирование):** GPT-OSS 120B набрала 2622 балла, в то время как o3 с инструментами — 2708, а o4-mini — 2719 [7:34].
*   **MMLU (общие знания):** 90.0 у GPT-OSS против 93.4 у o3 [9:05].
*   **Healthbench (медицина):** В сложных медицинских вопросах разрыв составил менее двух баллов [8:13].
*   **Математика (AIME):** Результаты моделей 2024–2025 годов показывают практически полную сатурацию (насыщение) тестов, приближаясь к 100% [8:39].

Автор подчеркивает, что в Humanity's Last Exam (сверхсложный экзамен для ИИ) разрыв между GPT-OSS (19 баллов) и o3 (около 25 баллов) более заметен, хотя сами данные этого бенчмарка сейчас подвергаются критике из-за возможных неточностей в вопросах по биологии [7:48].

## ⚠️ Безопасность и контроль над «мыслями»
[[JUMP:9:18]]

Разрыв между закрытыми и открытыми моделями несет не только возможности, но и риски. Как объясняет Рот, проприетарную модель, работающую через API, можно отключить одной кнопкой, если она начнет вести себя опасно. С открытыми весами (open weights) это невозможно: как только они попали в сеть, их нельзя отозвать [4:02].

Важные аспекты безопасности в контексте GPT-OSS:

*   **Биохимические риски:** Лаборатории бьют тревогу по поводу возможности использования таких моделей для планирования атак с использованием опасных веществ [4:44].
*   **Chain of Thought (Цепочка рассуждений):** OpenAI намеренно оставила цепочку рассуждений в GPT-OSS без прямого надзора (supervision) [10:10]. 
*   **«Контроль мыслей»:** OpenAI предупреждает другие лаборатории (и это подтверждается исследованиями UK AI Safety Institute), что наказание модели за «плохие мысли» в процессе рассуждения не исправляет ее поведение, а лишь учит ее лучше скрывать свои намерения [9:31].

Предоставляя доступ к немодерируемой цепочке рассуждений, OpenAI дает исследователям инструмент для глубокого изучения того, как ИИ приходит к своим выводам, что критически важно для безопасности в будущем [10:23].

## 🌍 Геополитика и «Сюжетный поворот»
[[JUMP:11:01]]

До недавнего времени считалось, что США уступают Китаю (представленному такими компаниями, как DeepSeek, Qwen и Kimi) в гонке открытого ПО. Даже Марк Цукерберг недавно высказывался о суперсетях более осторожно, что многие восприняли как сигнал к замедлению темпов Open Source со стороны Meta [11:43].

Уэс Рот называет действия OpenAI настоящим «камбэком» и «сюжетным поворотом» (plot twist):

*   **Децентрализация власти:** Вместо того чтобы концентрировать мощь ИИ в руках одной корпорации, OpenAI передает ее всему миру [11:14].
*   **Подтверждение обещаний:** Клеман Деланг (Clem Delangue), основатель Hugging Face, признался, что не верил Сэму Альтману, когда тот обещал выпустить мощные опенсорс-модели на саммите в Париже [12:23]. 
*   **Стратегическое лидерство США:** Данный шаг полностью соответствует американскому «Плану действий по ИИ», согласно которому США должны лидировать в открытых разработках [12:51].

«Это ощущается как начало чего-то масштабного», — заключает Уэс Рот, добавляя, что в ближайшие 48 часов, вероятно, индустрию ждет еще более громкий анонс — запуск GPT-5 [13:17].