Уэс Рот: «OpenAI жертвует безопасностью ради скорости выпуска o3?»

В мире искусственного интеллекта нарастает напряжение: пока ведущие лаборатории соревнуются в скорости выпуска новых продуктов, внутри индустрии всё громче звучат опасения по поводу безопасности. В новом обзоре блогер и ИИ-энтузиаст Уэс Рот (Wes Roth) анализирует появление загадочных «стелс-моделей» на платформе OpenRouter, планы OpenAI по масштабному обновлению линейки продуктов и этические дилеммы, с которыми сталкиваются сотрудники компании при попытке замедлить гонку вооружений ради тестов безопасности.

🥊 Гладиаторские бои роботов: Unitree выходит на ринг 0:00

Уэс Рот начинает обзор с демонстрации кадров, которые легко спутать с гиперреалистичной компьютерной графикой. На видео человекоподобный робот от китайской компании Unitree участвует в спарринге с человеком . Несмотря на то что машина весит всего около 45 килограммов, по мнению автора, она «бьёт выше своего веса» и демонстрирует поразительную устойчивость .

Компания Unitree, по словам Рота, достигла впечатляющего прогресса в робототехнике. Среди ключевых особенностей их подхода:

Открытость данных: Unitree делает ставку на open-source, создавая открытую экосистему для разработчиков .
Обучение в симуляции: Для тренировки навыков роботов используется платформа Nvidia Isaac Gym .
Прозрачность как фактор доверия: Уэс Рот отмечает, что на фоне напряжённых отношений между США и Китаем открытость исходного кода может несколько смягчить опасения пользователей по поводу безопасности и конфиденциальности при использовании китайских роботов в домашних условиях .

Автор анонсировал прямую трансляцию полноценного боя робота против человека, которая должна состояться в ближайший месяц . Рот в шутку замечает, что обычно ему жалко роботов, когда их пинают для проверки стабильности, но в контексте боксёрского поединка в защитном снаряжении это выглядит вполне приемлемо .

🕵️ Загадочные модели Quazar и Optimus Alpha 3:30

Особое внимание ИИ-сообщества привлекло появление на платформе OpenRouter двух «стелс-моделей» — Quazar и Optimus Alpha . Использование подобных площадок позволяет лабораториям проводить «слепое» тестирование своих продуктов в реальных условиях, получая отзывы пользователей без раскрытия бренда .

Основные характеристики модели Optimus Alpha, согласно данным из транскрипта:

Контекстное окно: 1 миллион токенов .
Специализация: Высокая эффективность в написании кода .
Скорость: Модель выдаёт результат практически мгновенно, без долгого «раздумья», что указывает на то, что это не специализированная reasoning-модель (модель для рассуждений) .

Уэс Рот предполагает, что за этими моделями стоит OpenAI. Это подтверждается постом Сэма Альтмана, который отметил, что «квазары — очень яркие объекты» . В английском языке слово bright означает не только «яркий», но и «умный», что Рот расценивает как косвенное подтверждение авторства OpenAI . Существует вероятность, что под этими кодовыми именами скрываются будущие релизы o4-mini или o4-mini high .

📈 Дорожная карта OpenAI: конец эры GPT-4 6:08

По информации автора, OpenAI готовится к запуску сразу трёх новых моделей: o4 mini, o4 mini high и o3 . При этом эпоха GPT-4 подходит к концу — оригинальную модель постепенно выводят из эксплуатации, заменяя её более современными архитектурами .

В профессиональной среде уже обсуждаются бенчмарки новых моделей. Мэтт Берман (Matt Berman) сообщил в Twitter, что загадочная Quazar Alpha якобы превосходит Claude 3.7 Sonnet в тестах, работая при этом в четыре раза быстрее .

Рот выделяет две основные ветки развития моделей OpenAI:

Не-рассуждающие модели: GPT-4o и ожидаемая GPT-4.5. Последняя, по мнению автора, будет отличаться высоким уровнем креативности и естественности языка .
Reasoning-модели (рассуждающие): o1, o3 mini и o3 mini high .

⚠️ Безопасность или скорость: конфликт внутри OpenAI 8:03

Ссылаясь на инсайдеров и публикации, Уэс Рот поднимает вопрос о снижении приоритета тестов безопасности в OpenAI. По мнению источников, Сэм Альтман стремится выпускать продукты быстрее из-за высокого рыночного спроса, что идёт вразрез с более тщательными проверками, которые проводились ранее .

Важной фигурой в этом контексте стал Даниэль Кокотайло (Daniel Kokotajlo), бывший сотрудник OpenAI. Рот отмечает мужество Кокотайло, который пошёл на публичный конфликт с компанией, несмотря на риск потери опционов . По словам автора, Даниэль утверждал, что около 80–90% благосостояния его семьи зависело от акций OpenAI, но он всё равно решил выступить в защиту «осведомителей» (whistleblowers) и требовать более строгих мер безопасности .

Ключевые опасения связаны с «Протоколом готовности» (Preparedness Framework) OpenAI :

Модель o3 mini: Стала первой моделью, достигшей «среднего» (Medium) уровня риска в категории автономности .
Уровень «High» (Высокий): По определению OpenAI, это уровень, при котором ИИ может выполнять задачи по самосовершенствованию (recursive self-improvement) и самостоятельно проводить исследования в области машинного обучения .
Опасность ускорения: Рот подчёркивает, что способность ИИ к автономным исследованиям может вызвать лавинообразный прогресс, к которому общество не готово .

🧠 Память ChatGPT и феномен «Разделения» 11:45

В завершение Уэс Рот обсуждает новую функцию ChatGPT — долгосрочную память, которая позволяет боту запоминать детали прошлых диалогов для персонализации ответов .

Это нововведение вызвало неоднозначную реакцию. Эксперт Этан Моллик (Ethan Mollick) выразил мнение, что ИИ не должен смешивать рабочие задачи с личными деталями, и подчеркнул важность границ . Исследователь OpenAI Ноам Браун (Noam Brown), ранее работавший в Meta над дипломатическим ИИ Cicero, в шутку предложил реализовать концепцию из сериала «Разделение» (Severance) .

Суть предложения в том, чтобы у пользователя было два профиля ИИ:

Innie (Внутренний): Для работы, знающий только профессиональный контекст.
Outie (Внешний): Для личной жизни, не пересекающийся с рабочими данными .

Уэс Рот заключает, что, хотя новости об ИИ выглядят многообещающе, к каждой из них стоит относиться с долей здорового скептицизма .