Уэс Рот: «Модель Orion никогда не будет выпущена публично»

Новое расследование авторитетного технологического издания The Information раскрыло подробности закрытых разработок компании OpenAI, связанных с секретным проектом Strawberry (ранее известным как Q*). Популярный ИТ-аналитик Уэс Рот подробно разбирает масштабные последствия этой утечки, включая демонстрацию новой технологии спецслужбам США и её ключевую роль в создании будущей флагманской ИИ-системы Orion. В центре внимания оказываются вопросы национальной безопасности, угроза со стороны Китая и фундаментальный сдвиг в том, как ИИ будет обучаться и распространяться в ближайшие годы.

🍓 Секретный проект Strawberry и визит в Вашингтон 0:00

Согласно данным расследования, слухи о секретной модели Strawberry от OpenAI полностью подтвердились. Проект, ранее упоминавшийся в утечках под именем Q*, привлек серьезный интерес со стороны американских агентств национальной безопасности. Сэм Альтман и команда разработчиков провели закрытую демонстрацию возможностей этой системы для высокопоставленных правительственных чиновников США.

По мнению Уэса Рота, демонстрация невыпущенной технологии оборонному аппарату может задать абсолютно новый стандарт для всей индустрии искусственного интеллекта. Ранее международные регуляторы, включая специализированные британские комитеты, пытались обязать технологические компании отчитываться перед релизами новых моделей, однако крупные ИТ-игроки, такие как Meta и OpenAI, фактически проигнорировали эти джентльменские соглашения. Добровольное обращение OpenAI к властям США подчеркивает, что Strawberry — это не просто маркетинговый ход, а критически важная технология.

Уэс Рот утверждает, что этот шаг преследует две ключевые цели:

Защита американских технологий: OpenAI стремится инициировать диалог о том, как обезопасить передовые алгоритмы от кражи иностранными противниками, в первую очередь Китаем.
Выпад в сторону конкурентов: это скрытая критика компании Meta и лично Марка Цукерберга за их стратегию выпуска моделей с открытыми весами (open weights), которые потенциально могут быть использованы враждебными государствами.

🇨🇳 Пророчества Леопольда Ашенбреннера и китайская угроза 6:44

В контексте взаимодействия OpenAI с правительством ведущий напоминает о резонансном манифесте «Ситуационная осведомленность» (Situational Awareness), который в июне 2024 года опубликовал бывший исследователь безопасности ИИ Леопольд Ашенбреннер. Ашенбреннер, уволенный из OpenAI из-за подозрений в утечке внутренней информации, подробно описал неизбежность жесткой геополитической гонки за AGI (общий искусственный интеллект).

По словам Ашенбреннера, ведущие американские лаборатории осознают, что создают самое мощное оружие в истории человечества, однако до сих пор относятся к его охране беспечно. Он сделал тревожный прогноз: в течение ближайших 12–14 месяцев ключевые прорывы США в сфере ИИ будут украдены спецслужбами КНР. По мнению исследователя, неспособность защитить эти секреты станет величайшим стратегическим сожалением оборонного ведомства США до конца текущего десятилетия.

С этой оценкой рисков согласны не все. В частности, глава Meta Марк Цукерберг в интервью подкасту Дваркеша Пателя выразил мнение, что Китай в любом случае получит доступ к технологиям, так как полностью предотвратить утечки невозможно. При этом Цукерберг убежден, что открытый исходный код (open source), напротив, усиливает американскую ИТ-сферу за счет коллективного поиска уязвимостей и ускорения инноваций. Уэс Рот подчеркивает: аргументы Цукерберга логичны, однако OpenAI умело использует страхи американского истеблишмента перед Китаем для укрепления своего эксклюзивного положения.

🔬 Технологический фундамент: от Stanford STAR к Quiet-STAr 1:17

Первые упоминания о закрытых разработках OpenAI под кодовым именем Q появились в прессе еще в конце 2023 года. Уэс Рот предполагает, что под всеми этими названиями — Q, Strawberry и будущие итерации — скрывается коммерческая реализация академического алгоритма STAR (Self-Taught Reasoner), разработанного в Стэнфордском университете в 2022 году.

Технология STAR строится на простом итеративном цикле:

Модели предлагается массив вопросов и несколько примеров детальных рассуждений (рационалов).
ИИ генерирует собственный логический путь к ответу, фактически «показывая свою работу», как ученик на уроке математики.
Если итоговый ответ оказывается неверным, система получает подсказку и пробует построить логическую цепочку заново.
В финале нейросеть дообучается (fine-tune) исключительно на тех рассуждениях, которые привели к правильному результату.

Один из авторов этого исследования, профессор Стэнфорда Ной Гудман, заявлял, что STAR позволяет языковым моделям буквально «вытягивать себя за волосы» (bootstrap) на более высокие уровни интеллекта без привлечения новых человеческих текстов. Гудман считает, что теоретически данный подход способен вывести ИИ за пределы человеческого уровня мышления.

Дальнейшим развитием этой концепции стала технология Quiet-STAr, которая учит ИИ «думать перед тем, как говорить». Вместо моментальной выдачи следующего слова модель генерирует скрытые цепочки мыслей, взвешивает альтернативы, отбрасывает тупиковые логические ветви и лишь затем выводит текст пользователю.

🛑 Борьба с галлюцинациями и успех синтетических данных 14:29

Главным барьером на пути к полноценному коммерческому ИИ остаются «галлюцинации» — ситуации, когда нейросеть уверенно генерирует вымышленные или ошибочные факты. Уэс Рот делится личным опытом, рассказывая, как одна из продвинутых моделей составила для него историческую викторину и упорно доказывала, что игра Quake (1996 год) вышла раньше, чем Doom (1993 год), полностью провалив простейшую временную логику.

Методология Strawberry призвана искоренить эту проблему. Происходит фундаментальный сдвиг: грань между обучением модели и инференсом (выдачей ответа) стирается. Ответ модели становится непрерывным процессом самообучения.

Многие ученые, включая известного физика и блогера Сабину Хоссенфельдер, предупреждают о риске «коллапса моделей» при попытке обучать ИИ на текстах, созданных другим ИИ. Однако Уэс Рот указывает на то, что этот пессимистичный сценарий уже опровергнут практикой. В качестве примера он приводит модель Orca 2 от Microsoft. Разработчики заставили огромную модель GPT-4 генерировать пошаговые логические рассуждения для сложных задач, а затем обучили на этих синтетических данных компактную нейросеть Orca 2. В итоге маленькая Orca 2, будучи в 5–10 раз меньше конкурентов, превзошла их в тестах на логику.

👑 Модель Orion и концепция «Королевы Чужих» 11:13

Самое важное технологическое откровение расследования The Information заключается в том, что OpenAI не планирует выпускать полноценную Strawberry как самостоятельный продукт. Ее главная задача — непрерывно генерировать колоссальные объемы высококачественных, очищенных синтетических данных для обучения следующей флагманской модели компании под кодовым названием Orion.

Уэс Рот строит смелый прогноз: сама модель Orion, скорее всего, вообще никогда не будет открыта для широкой публики. Она останется строго охраняемым внутренним ядром компании. Рот предлагает яркую аналогию с Королевой Чужих из знаменитой научно-фантастической кинофраншизы.

Концепция суперинтеллекта будущего, по мнению ведущего, выглядит так:

«Королева» (Orion) находится в изолированном цифровом бункере OpenAI, занимаясь исключительно «откладыванием яиц» — производством идеальных, кастомных обучающих датасетов.
Из этих датасетов «вылупляются дроны» — небольшие, узкоспециализированные модели, обученные под конкретные прикладные задачи.
Один «дрон» будет идеальным программистом, второй — экспертом в юриспруденции, третий — гениальным копирайтером.
Конечный пользователь через привычный интерфейс чат-ботов будет общаться со «смесью экспертов» (Mixture of Experts) — роем этих безопасных дронов.

Уэс Рот считает, что такая стратегия создает для OpenAI абсолютный экономический «ров» (moat), ведь архитектуру распределенного роя невозможно скопировать или подвергнуть реверс-инжинирингу. Кроме того, это решает проблему безопасности: специализированный ИИ-дрон, умеющий лишь разгадывать кроссворды или писать код для сайтов, физически не способен создать ретровирус или нанести ущерб государству, даже если попадет в руки хакеров или геополитических соперников. Обычным же пользователям в ближайшее время будет доступна лишь легкая чат-бот версия Strawberry, оптимизированная для решения многошаговых логических загадок вроде головоломки Connections от New York Times.