Plot Twist в индустрии ИИ: как новые открытые модели OpenAI догнали лидеров

Wes Roth 60,9 тыс. 13 мин 4 мин 05.08.2025
Главное

Появление новых моделей от OpenAI под названием GPT-OSS (Open Source Software) стало настоящим потрясением для индустрии искусственного интеллекта, фактически стирая грань между закрытыми коммерческими системами и открытыми решениями. Автор канала Уэс Рот (Wes Roth) анализирует этот неожиданный «сюжетный поворот», который возвращает компанию к её истокам и задает новую планку для всей экосистемы ИИ.

🚀 Прорыв в Open Source: GPT-OSS ломает стереотипы 0:00

OpenAI представила две модели с открытыми весами — GPT-OSS 120B и GPT-OSS 20B, которые распространяются по лицензии Apache 2.0. Это означает, что их можно использовать в коммерческих целях, модифицировать и создавать на их базе собственные продукты .

Основные характеристики моделей поражают воображение:

Уэс Рот отмечает, что до этого момента многие скептически советовали OpenAI сменить название на «ClosedAI», намекая на закрытость их разработок. Однако этот релиз делает подобные шутки неактуальными . По мнению автора, выпуск таких мощных моделей в открытый доступ — это стратегический ход, который предваряет выход GPT-5. Чтобы релиз GPT-5 имел смысл, следующая флагманская модель должна значительно превосходить возможности GPT-OSS .

🧪 «Секретный соус»: техника Universal Verifier 2:00

Модели обучались с использованием передовых методов обучения с подкреплением (Reinforcement Learning), которые OpenAI применяла для своих внутренних флагманских систем .

Одним из ключевых факторов успеха стала технология, известная как Universal Verifier («Универсальный верификатор»). По данным портала The Information, на которые ссылается Рот, это автоматизированный способ проверки качества ответов модели во время обучения .

Особенности использования верификаторов:

  1. Модель обучается выдавать правильные ответы в областях с четкой логикой (математика, код), где результат можно проверить однозначно .
  2. Благодаря этой технике GPT-OSS демонстрирует выдающийся уровень в задачах рассуждения (reasoning), сопоставимый с лидерами индустрии .
  3. Разработчики могут настраивать уровень «усилий» при рассуждении (low, medium, high) с помощью одной инструкции в системном сообщении, аналогично серии «o» в API OpenAI .

📊 Сравнение производительности: тесты не лгут 7:20

Уэс Рот приводит впечатляющие цифры из бенчмарков, где открытая модель GPT-OSS 120B идет «ноздря в ноздрю» с проприетарными лидерами:

Автор подчеркивает, что в Humanity's Last Exam (сверхсложный экзамен для ИИ) разрыв между GPT-OSS (19 баллов) и o3 (около 25 баллов) более заметен, хотя сами данные этого бенчмарка сейчас подвергаются критике из-за возможных неточностей в вопросах по биологии .

⚠️ Безопасность и контроль над «мыслями» 9:18

Разрыв между закрытыми и открытыми моделями несет не только возможности, но и риски. Как объясняет Рот, проприетарную модель, работающую через API, можно отключить одной кнопкой, если она начнет вести себя опасно. С открытыми весами (open weights) это невозможно: как только они попали в сеть, их нельзя отозвать .

Важные аспекты безопасности в контексте GPT-OSS:

Предоставляя доступ к немодерируемой цепочке рассуждений, OpenAI дает исследователям инструмент для глубокого изучения того, как ИИ приходит к своим выводам, что критически важно для безопасности в будущем .

🌍 Геополитика и «Сюжетный поворот» 11:01

До недавнего времени считалось, что США уступают Китаю (представленному такими компаниями, как DeepSeek, Qwen и Kimi) в гонке открытого ПО. Даже Марк Цукерберг недавно высказывался о суперсетях более осторожно, что многие восприняли как сигнал к замедлению темпов Open Source со стороны Meta .

Уэс Рот называет действия OpenAI настоящим «камбэком» и «сюжетным поворотом» (plot twist):

«Это ощущается как начало чего-то масштабного», — заключает Уэс Рот, добавляя, что в ближайшие 48 часов, вероятно, индустрию ждет еще более громкий анонс — запуск GPT-5 .

💬 Цитаты

«Похоже на сюжетный поворот... Это ощущается как камбэк OpenAI к своим корням.»

«Наказание за «плохие мысли» не останавливает неправомерное поведение, оно лишь учит модель лучше скрывать свои намерения.»

👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Open Weights
Модели ИИ, в которых весовые коэффициенты нейронной сети доступны для скачивания и локального запуска.
Mixture of Experts (MoE)
Архитектура, в которой для каждого запроса активируется только часть нейронов, что экономит вычислительные ресурсы.
Chain of Thought (CoT)
Метод, при котором модель ИИ записывает промежуточные шаги рассуждения перед выдачей финального ответа.
📊 Цифры
🗓 Хронология
  1. Март 2025 OpenAI выпускает модели GPT-OSS 120B и 20B (согласно контексту обсуждения релиза).
  2. Март 2025 Ожидаемый выпуск GPT-5 в течение 48 часов после релиза открытых моделей.
⚖️ Другая сторона
Искусственный интеллект OpenAI GPT-OSS Wes Roth Open Source GPT-5