Уэс Рот: «OpenAI жертвует безопасностью ради скорости выпуска o3?»

Wes Roth 38,4 тыс. 13 мин 4 мин 11.04.2025
Главное

В мире искусственного интеллекта нарастает напряжение: пока ведущие лаборатории соревнуются в скорости выпуска новых продуктов, внутри индустрии всё громче звучат опасения по поводу безопасности. В новом обзоре блогер и ИИ-энтузиаст Уэс Рот (Wes Roth) анализирует появление загадочных «стелс-моделей» на платформе OpenRouter, планы OpenAI по масштабному обновлению линейки продуктов и этические дилеммы, с которыми сталкиваются сотрудники компании при попытке замедлить гонку вооружений ради тестов безопасности.

🥊 Гладиаторские бои роботов: Unitree выходит на ринг 0:00

Уэс Рот начинает обзор с демонстрации кадров, которые легко спутать с гиперреалистичной компьютерной графикой. На видео человекоподобный робот от китайской компании Unitree участвует в спарринге с человеком . Несмотря на то что машина весит всего около 45 килограммов, по мнению автора, она «бьёт выше своего веса» и демонстрирует поразительную устойчивость .

Компания Unitree, по словам Рота, достигла впечатляющего прогресса в робототехнике. Среди ключевых особенностей их подхода:

Автор анонсировал прямую трансляцию полноценного боя робота против человека, которая должна состояться в ближайший месяц . Рот в шутку замечает, что обычно ему жалко роботов, когда их пинают для проверки стабильности, но в контексте боксёрского поединка в защитном снаряжении это выглядит вполне приемлемо .

🕵️ Загадочные модели Quazar и Optimus Alpha 3:30

Особое внимание ИИ-сообщества привлекло появление на платформе OpenRouter двух «стелс-моделей» — Quazar и Optimus Alpha . Использование подобных площадок позволяет лабораториям проводить «слепое» тестирование своих продуктов в реальных условиях, получая отзывы пользователей без раскрытия бренда .

Основные характеристики модели Optimus Alpha, согласно данным из транскрипта:

Уэс Рот предполагает, что за этими моделями стоит OpenAI. Это подтверждается постом Сэма Альтмана, который отметил, что «квазары — очень яркие объекты» . В английском языке слово bright означает не только «яркий», но и «умный», что Рот расценивает как косвенное подтверждение авторства OpenAI . Существует вероятность, что под этими кодовыми именами скрываются будущие релизы o4-mini или o4-mini high .

📈 Дорожная карта OpenAI: конец эры GPT-4 6:08

По информации автора, OpenAI готовится к запуску сразу трёх новых моделей: o4 mini, o4 mini high и o3 . При этом эпоха GPT-4 подходит к концу — оригинальную модель постепенно выводят из эксплуатации, заменяя её более современными архитектурами .

В профессиональной среде уже обсуждаются бенчмарки новых моделей. Мэтт Берман (Matt Berman) сообщил в Twitter, что загадочная Quazar Alpha якобы превосходит Claude 3.7 Sonnet в тестах, работая при этом в четыре раза быстрее .

Рот выделяет две основные ветки развития моделей OpenAI:

  1. Не-рассуждающие модели: GPT-4o и ожидаемая GPT-4.5. Последняя, по мнению автора, будет отличаться высоким уровнем креативности и естественности языка .
  2. Reasoning-модели (рассуждающие): o1, o3 mini и o3 mini high .

⚠️ Безопасность или скорость: конфликт внутри OpenAI 8:03

Ссылаясь на инсайдеров и публикации, Уэс Рот поднимает вопрос о снижении приоритета тестов безопасности в OpenAI. По мнению источников, Сэм Альтман стремится выпускать продукты быстрее из-за высокого рыночного спроса, что идёт вразрез с более тщательными проверками, которые проводились ранее .

Важной фигурой в этом контексте стал Даниэль Кокотайло (Daniel Kokotajlo), бывший сотрудник OpenAI. Рот отмечает мужество Кокотайло, который пошёл на публичный конфликт с компанией, несмотря на риск потери опционов . По словам автора, Даниэль утверждал, что около 80–90% благосостояния его семьи зависело от акций OpenAI, но он всё равно решил выступить в защиту «осведомителей» (whistleblowers) и требовать более строгих мер безопасности .

Ключевые опасения связаны с «Протоколом готовности» (Preparedness Framework) OpenAI :

🧠 Память ChatGPT и феномен «Разделения» 11:45

В завершение Уэс Рот обсуждает новую функцию ChatGPT — долгосрочную память, которая позволяет боту запоминать детали прошлых диалогов для персонализации ответов .

Это нововведение вызвало неоднозначную реакцию. Эксперт Этан Моллик (Ethan Mollick) выразил мнение, что ИИ не должен смешивать рабочие задачи с личными деталями, и подчеркнул важность границ . Исследователь OpenAI Ноам Браун (Noam Brown), ранее работавший в Meta над дипломатическим ИИ Cicero, в шутку предложил реализовать концепцию из сериала «Разделение» (Severance) .

Суть предложения в том, чтобы у пользователя было два профиля ИИ:

Уэс Рот заключает, что, хотя новости об ИИ выглядят многообещающе, к каждой из них стоит относиться с долей здорового скептицизма .

💬 Цитаты

«Квазары — это очень яркие (умные) вещи.»

Сэм Альтман (цитируется Уэсом Ротом) 05:02

«Границы — это хорошо.»

Этан Моллик (цитируется Уэсом Ротом) 12:39

«o3 mini стала первой моделью, достигшей среднего уровня риска в категории автономности.»

👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Stealth models
Модели ИИ, которые выпускаются для тестирования на сторонних платформах без указания разработчика.
Reasoning models
Модели (как o1 или o3), способные к логическим рассуждениям и глубокому анализу перед выдачей ответа.
Preparedness Framework
Внутренний протокол безопасности OpenAI для оценки рисков новых моделей перед их выпуском.
Context Window
Объем данных (текста), который модель может удерживать в памяти одновременно во время обработки запроса.
📊 Цифры
🗓 Хронология
  1. Март 2025 (ориентировочно) Планируемый запуск стрима боя робота Unitree против человека.
  2. 2024 Увольнение Даниэля Кокотайло из OpenAI и его заявления о безопасности.
  3. Настоящее время Появление моделей Quazar и Optimus Alpha на OpenRouter.
⚖️ Другая сторона
Искусственный интеллект OpenAI Unitree OpenRouter Сэм Альтман Даниэль Кокотайло