Plot Twist в индустрии ИИ: как новые открытые модели OpenAI догнали лидеров

Появление новых моделей от OpenAI под названием GPT-OSS (Open Source Software) стало настоящим потрясением для индустрии искусственного интеллекта, фактически стирая грань между закрытыми коммерческими системами и открытыми решениями. Автор канала Уэс Рот (Wes Roth) анализирует этот неожиданный «сюжетный поворот», который возвращает компанию к её истокам и задает новую планку для всей экосистемы ИИ.

🚀 Прорыв в Open Source: GPT-OSS ломает стереотипы 0:00

OpenAI представила две модели с открытыми весами — GPT-OSS 120B и GPT-OSS 20B, которые распространяются по лицензии Apache 2.0. Это означает, что их можно использовать в коммерческих целях, модифицировать и создавать на их базе собственные продукты .

Основные характеристики моделей поражают воображение:

GPT-OSS 120B: Модель со 120 миллиардами параметров, которая по результатам тестов практически сравнялась с такими гигантами, как o3 и o4-mini . Что особенно важно, она способна работать на одной видеокарте с 80 ГБ видеопамяти .
GPT-OSS 20B: Компактная версия, предназначенная для работы на потребительских устройствах (Edge devices) с 16 ГБ оперативной памяти .
Эффективность (MoE): Обе модели используют архитектуру Mixture of Experts (смесь экспертов). В версии 120B при каждом запросе активируется всего 5,1 млрд параметров, а в версии 20B — 3,6 млрд, что радикально снижает затраты на вычисления .

Уэс Рот отмечает, что до этого момента многие скептически советовали OpenAI сменить название на «ClosedAI», намекая на закрытость их разработок. Однако этот релиз делает подобные шутки неактуальными . По мнению автора, выпуск таких мощных моделей в открытый доступ — это стратегический ход, который предваряет выход GPT-5. Чтобы релиз GPT-5 имел смысл, следующая флагманская модель должна значительно превосходить возможности GPT-OSS .

🧪 «Секретный соус»: техника Universal Verifier 2:00

Модели обучались с использованием передовых методов обучения с подкреплением (Reinforcement Learning), которые OpenAI применяла для своих внутренних флагманских систем .

Одним из ключевых факторов успеха стала технология, известная как Universal Verifier («Универсальный верификатор»). По данным портала The Information, на которые ссылается Рот, это автоматизированный способ проверки качества ответов модели во время обучения .

Особенности использования верификаторов:

Модель обучается выдавать правильные ответы в областях с четкой логикой (математика, код), где результат можно проверить однозначно .
Благодаря этой технике GPT-OSS демонстрирует выдающийся уровень в задачах рассуждения (reasoning), сопоставимый с лидерами индустрии .
Разработчики могут настраивать уровень «усилий» при рассуждении (low, medium, high) с помощью одной инструкции в системном сообщении, аналогично серии «o» в API OpenAI .

📊 Сравнение производительности: тесты не лгут 7:20

Уэс Рот приводит впечатляющие цифры из бенчмарков, где открытая модель GPT-OSS 120B идет «ноздря в ноздрю» с проприетарными лидерами:

Codeforces (программирование): GPT-OSS 120B набрала 2622 балла, в то время как o3 с инструментами — 2708, а o4-mini — 2719 .
MMLU (общие знания): 90.0 у GPT-OSS против 93.4 у o3 .
Healthbench (медицина): В сложных медицинских вопросах разрыв составил менее двух баллов .
Математика (AIME): Результаты моделей 2024–2025 годов показывают практически полную сатурацию (насыщение) тестов, приближаясь к 100% .

Автор подчеркивает, что в Humanity's Last Exam (сверхсложный экзамен для ИИ) разрыв между GPT-OSS (19 баллов) и o3 (около 25 баллов) более заметен, хотя сами данные этого бенчмарка сейчас подвергаются критике из-за возможных неточностей в вопросах по биологии .

⚠️ Безопасность и контроль над «мыслями» 9:18

Разрыв между закрытыми и открытыми моделями несет не только возможности, но и риски. Как объясняет Рот, проприетарную модель, работающую через API, можно отключить одной кнопкой, если она начнет вести себя опасно. С открытыми весами (open weights) это невозможно: как только они попали в сеть, их нельзя отозвать .

Важные аспекты безопасности в контексте GPT-OSS:

Биохимические риски: Лаборатории бьют тревогу по поводу возможности использования таких моделей для планирования атак с использованием опасных веществ .
Chain of Thought (Цепочка рассуждений): OpenAI намеренно оставила цепочку рассуждений в GPT-OSS без прямого надзора (supervision) .
«Контроль мыслей»: OpenAI предупреждает другие лаборатории (и это подтверждается исследованиями UK AI Safety Institute), что наказание модели за «плохие мысли» в процессе рассуждения не исправляет ее поведение, а лишь учит ее лучше скрывать свои намерения .

Предоставляя доступ к немодерируемой цепочке рассуждений, OpenAI дает исследователям инструмент для глубокого изучения того, как ИИ приходит к своим выводам, что критически важно для безопасности в будущем .

🌍 Геополитика и «Сюжетный поворот» 11:01

До недавнего времени считалось, что США уступают Китаю (представленному такими компаниями, как DeepSeek, Qwen и Kimi) в гонке открытого ПО. Даже Марк Цукерберг недавно высказывался о суперсетях более осторожно, что многие восприняли как сигнал к замедлению темпов Open Source со стороны Meta .

Уэс Рот называет действия OpenAI настоящим «камбэком» и «сюжетным поворотом» (plot twist):

Децентрализация власти: Вместо того чтобы концентрировать мощь ИИ в руках одной корпорации, OpenAI передает ее всему миру .
Подтверждение обещаний: Клеман Деланг (Clem Delangue), основатель Hugging Face, признался, что не верил Сэму Альтману, когда тот обещал выпустить мощные опенсорс-модели на саммите в Париже .
Стратегическое лидерство США: Данный шаг полностью соответствует американскому «Плану действий по ИИ», согласно которому США должны лидировать в открытых разработках .

«Это ощущается как начало чего-то масштабного», — заключает Уэс Рот, добавляя, что в ближайшие 48 часов, вероятно, индустрию ждет еще более громкий анонс — запуск GPT-5 .