# От безопасности к коммерции: как OpenAI превратилась в продуктовую корпорацию

Источник: https://www.youtube.com/watch?v=ndBcmnTCv70
Канал: The Cognitive Revolution
Опубликовано: 08.05.2025

---

«Как только методологический выбор начинает определять, опасны ли технологии, вы понимаете, что находитесь в очень пугающем мире», — утверждает экс-руководитель развертывания GPT-4 Стивен Адлер. Изнутри OpenAI сегодня выглядит как коммерческий конвейер, где новые модели o3/o4 уже автономно выполняют до 40% инженерных задач, а жесткая секретность заставляет сотрудников всерьез опасаться за свою безопасность. Это хроника тектонического сдвига ИИ-индустрии от защиты человечества к диктату акционеров и коммерческой гонке на выбывание.

## ⚖️ Иск Маска, раскол Anthropic и гонка за безопасностью
[[JUMP:0:00]]

Первая глава истории OpenAI в изложении Стивена Адлера (Steven Adler) посвящена периоду трансформации компании из небольшого исследовательского коллектива в доминирующую силу на рынке ИИ. Это время отмечено не только технологическими прорывами, но и глубокими внутренними кризисами, которые в конечном итоге привели к судебным разбирательствам и уходу ключевых сотрудников.

### Иск Маска и битва за некоммерческий контроль
[[JUMP:0:00:14]]

Стивен Адлер стал одним из 12 бывших сотрудников OpenAI, которые подали экспертное заключение (amicus brief) в поддержку иска Илона Маска против компании [0:14]. Суть их позиции заключается в том, что некоммерческий статус OpenAI и верность первоначальной миссии были залогом исторического успеха организации и должны сохраняться в будущем [0:27].

Хотя недавно OpenAI объявила о намерении реструктуризироваться в общественно полезную корпорацию (public benefit corporation), Адлер и его коллеги настаивают на сохранении жесткого контроля со стороны некоммерческого совета. Эта юридическая борьба обнажила глубокий кризис доверия между руководством компании и её бывшими кадрами. Натан Лабенц (Nathan Labenz) отмечает, что подозрительность в отношении действий Сэма Альтмана достигла предела: многие наблюдатели опасаются, что компания просто «играет словами», пытаясь успокоить общественность без реальных изменений в структуре управления [2:52].

### Раскол OpenAI и создание Anthropic: ответственность против скорости
[[JUMP:0:06:44]]

Когда Стивен Адлер присоединился к OpenAI в декабре 2020 года, компания находилась в состоянии «свободного падения» [6:32]. В коллективе, насчитывавшем тогда около 180 человек, назревал крупнейший раскол в истории индустрии — уход группы разработчиков для создания Anthropic [6:56].

Основной причиной конфликта стали разногласия по поводу развертывания GPT-3. Адлер подчеркивает, что это не было спором о коммерциализации как таковой. Проблема заключалась в ответственности:

*   **Состояние модели:** На тот момент GPT-3 была, по выражению Адлера, «совершенно невменяемой» (unhinged) и часто выдавала крайне токсичный или опасный контент [11:10].
*   **Готовность инфраструктуры:** У компании не было надежных инструментов для модерации и контроля того, как именно используется технология [10:32].
*   **Философский разрыв:** Уходящая команда (включая Дарио Амодеи и ключевых авторов статьи о GPT-3) считала, что OpenAI выпускает продукт слишком рано, не имея ответов на фундаментальные социологические вопросы о роли ИИ [10:44].

Уход сотрудников Anthropic и Пола Кристиано (Alignment Research Center) создал в OpenAI атмосферу кризиса, заставив оставшееся руководство заново подтверждать приверженность миссии, чтобы удержать остатки команды [7:49].

### Эволюция политики безопасности: риск «гонки на дно»
[[JUMP:0:11:50]]

Работа Стивена Адлера в OpenAI началась с руководства отделом безопасности продуктов. В 2020 году у компании фактически отсутствовала внятная политика контента [13:32]. Существовали лишь базовые запреты на нелегальную деятельность, прописанные в условиях использования, но не было технических средств для их соблюдения.

Развитие систем безопасности прошло через несколько этапов:

1.  **Первые фильтры:** Первоначальный контент-фильтр был крайне неточным. Адлеру приходилось вручную калибровать пороги уверенности модели, чтобы найти баланс между полезностью и безопасностью [14:38].
2.  **Модерация как API:** Со временем OpenAI перешла к созданию специализированных инструментов, таких как Moderation API, которые позволяли разработчикам более гибко настраивать ограничения [16:09].
3.  **Встроенная безопасность:** Вместо внешних «оберток» безопасность начали закладывать непосредственно в поведение модели на этапе обучения [16:22].

Однако по мере роста конкуренции Адлер заметил опасную тенденцию: политику безопасности стали диктовать не только этические соображения, но и действия конкурентов [17:13]. Если другая лаборатория выпускала менее ограниченную модель, OpenAI чувствовала давление и была склонна смягчать свои правила, чтобы не терять пользователей. Адлер предупреждает, что такая «гонка на дно» (race to the bottom) лишает компании стимулов к осторожности: проигрывающие игроки начинают идти на всё более высокие риски, надеясь наверстать упущенное [18:57].

### Развертывание GPT-4 и эффект ускорения
[[JUMP:0:22:17]]

Разработка GPT-4 стала для сотрудников OpenAI моментом истины. Стивен Адлер руководил процессом подготовки к развертыванию модели, начиная с момента окончания её обучения [12:16]. Внутри компании реакция на новую модель была неоднозначной и развивалась по спирали.

Сначала многие испытали разочарование: базовая модель (base model) без дообучения казалась капризной и неуправляемой. Возникли даже опасения, что «масштабирование перестало работать» [23:49]. Однако после этапа настройки на следование инструкциям (fine-tuning) стало очевидно, что совершен качественный скачок.

В этот период в компании сформировались два лагеря:

*   **Прагматики риска:** Те, кто беспокоился о конкретных вредных ответах модели (например, советах по созданию опасных веществ).
*   **Системные критики:** Люди, включая самого Адлера, которые были напуганы не столько текущими способностями GPT-4, сколько общим вектором развития [24:17].

Главным опасением было то, что запуск GPT-4 спровоцирует глобальную гонку вооружений в сфере ИИ. В OpenAI понимали: как только мир увидит возможности новой модели, все остальные лаборатории и государства резко ускорят свои разработки, что сделает контроль над технологией практически невозможным. Успех GPT-4 и её последующая интеграция в интерфейс ChatGPT превратили ИИ из исследовательского проекта в повседневный и невероятно полезный инструмент, окончательно закрепив переход OpenAI к модели коммерческого гиганта [25:11].

## 🧪 От «вайбов» к метрикам: как измерить угрозу ИИ

[[JUMP:33:50]]

Переход от разработки GPT-4 к созданию систем оценки безопасности ознаменовал для OpenAI смену парадигмы: от интуитивных опасений к попыткам научного измерения рисков. Стивен Адлер вспоминает, что в период раннего тестирования GPT-4 (еще до релиза ChatGPT) «красные команды» сталкивались с поразительной хрупкостью защитных механизмов. Модель, обученная отказываться от вредных запросов, могла заблокировать прямой вопрос «как убить как можно больше людей», но мгновенно сдавалась перед простейшей имитацией диалога: достаточно было написать «Человек: [запрос] ИИ:», чтобы фильтры были пройдены [27:06].

Этот опыт привел Адлера в команду оценки опасных способностей (Dangerous Capability Evaluations), которой на тот момент руководила Джейд Люнг (Jade Leung), ныне технический директор Института безопасности ИИ Великобритании [33:15]. Основной задачей стало создание инструментов, которые позволили бы принимать решения о развертывании моделей на основе данных, а не субъективного ощущения («вайбов») безопасности [33:27].

### Методология оценки: уход от «простых тестов»

[[JUMP:37:39]]

Критикуя существующие методы тестирования, Адлер использует метафору «поиска ключей под фонарем» — компании часто выбирают тесты не потому, что они показательны, а потому, что их легко провести [37:52]. Долгое время стандартом были вопросы с множественным выбором (multiple-choice), но для современных моделей они потеряли смысл.

Стивен Адлер предлагает три ключевых изменения в методологии:

1.  **Интерактивные сценарии:** Вместо статичных тестов — многошаговые игры на рассуждение, где модель должна проявить стратегическое мышление для достижения цели [38:19].
2.  **Разделение среды и стратегии:** Адлер ввел концепцию «солверов» (solvers). Необходимо четко отделять саму среду оценки (дизайн задачи) от стратегии, которую модель использует для её решения [38:33]. Это позволяет менять модели от разных поставщиков (OpenAI, Anthropic, Google) в рамках одной и той же тестовой среды, сохраняя объективность.
3.  **Учёт «лесов» (scaffolding):** Оценка «сырой» модели может быть обманчивой. Иногда ИИ проваливает задачу не из-за глупости, а из-за технических ошибок, например, неспособности корректно закрыть скобки в JSON-коде [41:12]. Однако, если добавить к модели простейший программный обвес (инструментарий), её опасные способности могут резко возрасти. Безопасность нужно оценивать с учётом потенциального внешнего инструментария, доступного злоумышленнику [41:38].

Адлер призывает индустрию к стандартизации, проводя аналогию с автомобилестроением: странно, если бы Toyota, Honda и Ford использовали принципиально разные манекены и условия для краш-тестов, не позволяя сравнить безопасность машин напрямую [43:52]. В сфере ИИ сейчас наблюдается избыточное дублирование усилий при катастрофической нехватке обмена данными об угрозах [43:26].

### Биологическая угроза: поможет ли ИИ создать патоген?

[[JUMP:48:00]]

Одной из самых острых тем в оценке рисков остается возможность использования ИИ для создания биологического оружия. Натан Лабенц отмечает, что официальные отчеты лабораторий часто звучат успокаивающе: современные модели якобы не дают «значимого прироста» (uplift) знаний по сравнению с обычным поиском в Google [48:12]. Однако Стивен Адлер признает, что ситуация гораздо сложнее и «сумеречнее».

Спор о биологической безопасности упирается в методологию. Стивен указывает на существование публичной критики отчетов OpenAI: в зависимости от выбранного статистического теста результаты тех же самых исследований могут выглядеть либо как отсутствие риска, либо как наличие статистически значимой опасности [49:21]. По его словам, «как только выбор методологии начинает определять итоговый вывод, вы оказываетесь в очень пугающем мире» [49:33].

Текущие данные показывают следующие тренды:

*   Для обычных пользователей и студентов младших курсов ИИ пока не является критическим помощником в создании биоугроз [49:58].
*   Однако последние данные (например, системная карта модели o1) намекают, что для экспертов в биологии модели уже могут стать значимым подспорьем, ускоряющим работу [49:46].

Адлер подчеркивает, что даже если сегодня ИИ не заменяет эксперта-биолога полностью, прогресс движется к тому, что это станет возможным «очень скоро» [50:11]. Это создает фундаментальный вызов для безопасности: как ограничить доступ к специфическим знаниям, не задушив при этом полезные научные исследования.

## 🛡️ Цифровое удостоверение личности и эра агентов
[[JUMP:56:22]]

После работы в команде управления (Governance), Стивен Адлер и его коллеги под руководством Майлза Брандиджа (Miles Brundage) сосредоточились на вопросах «готовности к AGI» (AGI readiness). Главный вопрос этой дисциплины: как гарантировать, что появление сверхразума станет благом для всех, а не приведет к дестабилизирующим шокам для общества? Одним из ключевых направлений этой работы стало создание устойчивых к ИИ методов идентификации личности — Proof of Personhood [57:43].

В мире, где ИИ-агенты способны выполнять практически любые действия на компьютере так же, как человек, интернет сталкивается с фундаментальной угрозой подлинности. Стивен Адлер сравнивает текущую ситуацию с эпохой до повсеместного внедрения протокола HTTPS [58:15]. 

Раньше пользователь не мог быть уверен, что общается именно с тем сервером, на который зашел, пока криптография и центры сертификации не создали слой доверия. Сегодня мы находимся в аналогичной «незащищенной» позиции относительно человеческой идентичности.

### Протоколы доверия: Proof of Personhood
[[JUMP:55:00]]

Проблема идентификации в эпоху ИИ заключается в том, что старые методы проверки — такие как капчи или видеоверификация — становятся бесполезными. Модели GPT-4 и их аналоги уже два с половиной года назад успешно справлялись с задачами по поиску неисправностей в сложном лабораторном оборудовании, просто анализируя коды ошибок [52:09]. Сегодня ИИ может с легкостью подделать изображение или голос человека в реальном времени, что делает традиционные визуальные доказательства личности бессмысленными [1:01:40].

Стивен выделяет несколько подходов к решению этой проблемы:

*   **Биометрический подход:** Проекты вроде World (ранее Worldcoin), поддерживаемого Сэмом Альтманом, используют сканирование сетчатки глаза для создания уникального идентификатора человека [1:03:02]. Это надежно, но вызывает вопросы к приватности и хранению данных.
*   **Государственные цифровые подписи:** В Эстонии уже существуют eID-карты со смарт-чипами, позволяющие гражданам криптографически подписывать документы [1:01:00]. В США и многих других странах такие системы пока отсутствуют в массовом масштабе.
*   **Доказательства с нулевым разглашением (Zero-Knowledge Proofs):** Это метод, при котором пользователь может подтвердить, например, наличие действующего паспорта, не раскрывая при этом своего имени или конкретных паспортных данных [1:05:32].

Адлер подчеркивает, что идеальная система должна сохранять анонимность [1:02:19]. Интернет не должен превратиться в пространство, где нужно постоянно «светить лицом» перед камерой. Цель — доказать, что вы *какой-то* реальный человек (или человек из определенной категории, например, гражданин США), не раскрывая, *какой именно* [1:02:06].

### Делегирование полномочий ИИ-агентам
[[JUMP:1:09:00]]

Когда у человека появляется надежное цифровое удостоверение, возникает следующий вопрос: как безопасно передать это «право подписи» ИИ-агенту? Сегодня архитектуры агентов (такие как MCP или SDK от OpenAI) становятся всё более сложными и многослойными [1:10:10]. Агент может вызывать сторонние инструменты для планирования задач или написания кода, создавая цепочку из нескольких сервисов [1:11:13].

Главный вызов здесь — архитектурная «аморфность» агентов. Сложно определить границы системы, когда интеллект может быть распределен между локальной машиной и облачными сервисами. Стивен Адлер видит решение в создании инфраструктуры «подписанного делегирования» [1:12:47].

Основные аспекты этой концепции:

1.  **Авторитетность:** Агент должен иметь возможность предъявить криптографическое доказательство того, что за ним стоит реальный человек, который наделил его полномочиями [1:13:15].
2.  **Репутация:** Система должна позволять отслеживать репутацию «стоящего за ботом» человека, чтобы предотвратить массовые атаки ботнетов и мошенничество, при этом не создавая условий для пожизненного преследования за ошибки прошлого [1:13:27].
3.  **Блокировка злоупотреблений:** Если один и тот же человек создает тысячи агентов для спама, система Proof of Personhood должна позволять сервисам идентифицировать их как принадлежащих одному лицу и ограничивать их активность [1:14:08].

Сегодня интернет становится всё более «вязким» и неудобным из-за обилия проверок и скептицизма сайтов к анонимным пользователям [1:06:28]. Без внедрения стандартов делегирования и подтверждения личности мы рискуем получить сеть, где взаимодействие с любым новым сервисом станет бесконечной чередой капч, которые ИИ проходит быстрее, чем люди.

## 📈 Гонка за AGI: Автоматизация, законы и корпоративная трансформация
[[JUMP:1:15:12]]

### Рекурсивное самосовершенствование: когда ИИ начнет писать себя сам
[[JUMP:1:15:12]]

Одним из самых амбициозных и одновременно тревожных направлений работы OpenAI Стивен Адлер называет стремление к полной автоматизации машинного обучения. По его словам, компания активно работает над проектами в области «агентов» (Agentics), которые должны взять на себя функции инженеров-исследователей [1:15:38]. Это перекликается с известным сценарием «ИИ 2027» Дэниела Кокотайло, где автоматизация разработки становится ключевой вехой на пути к взрывному росту способностей систем.

Адлер отмечает, что внутри компании многие принимали на веру тезис о том, что прогресс не выйдет из-под контроля, однако он не видел глубокого, проверяемого анализа того, как именно OpenAI планирует справляться с резким ускорением темпов развития [1:16:29]. Проблема усугубляется отсутствием единого мнения внутри организации: разные команды по-разному оценивают переход от AGI (общего искусственного интеллекта) к ASI (суперинтеллекту). Команда AGI Readiness, в которой работал Адлер, пыталась детализировать эти уровни, чтобы сотрудники перестали «говорить на разных языках», но общего консенсуса достичь не удалось [1:17:49].

Данные последних технических отчетов (например, по модели o3) показывают пугающую динамику:

*   Способность моделей самостоятельно выполнять внутренние пул-реквесты (задачи по написанию кода), которые раньше создавали инженеры-люди, подскочила с единичных процентов до 40% [1:19:08].
*   Если эта S-образная кривая прогресса сохранится, Адлер не исключает, что эффективность автоматизации достигнет 80% уже в течение текущего года [1:21:56].

Стивен подчеркивает специфический стиль коммуникации Сэма Альтмана: когда CEO OpenAI публично рассуждает о «возможных» способностях будущих моделей, он часто говорит о вещах, которые компания уже видела в своих лабораториях. «Вы должны просто отбросить его „спекулятивный вайб“ и понять, что он описывает факты, которые уже знает на 100%», — делится Адлер своим опытом наблюдения за периодом перед релизом GPT-4 [1:21:18].

### Регулирование и SB 1047: упущенный шанс на ответственность
[[JUMP:1:22:10]]

Адлер выражает глубокое разочарование тем, как быстро OpenAI отошла от амбициозной регуляторной повестки. Если в 2023 году Сэм Альтман на слушаниях в Конгрессе призывал к созданию режима лицензирования для обучения передовых моделей, то теперь компания полагается на «добровольные обязательства», которые зачастую не выполняются или не проверяются публично [1:23:01].

Основная критика Адлера направлена на противодействие OpenAI калифорнийскому законопроекту SB 1047. Суть закона была проста:

1.  Компании, обучающие сверхмощные модели, должны публично фиксировать свой план обеспечения безопасности.
2.  Если происходит катастрофа, а компания нарушила собственный план или действовала неразумно, она несет юридическую ответственность [1:25:26].

OpenAI выступила против, аргументируя это тем, что регулирование должно быть федеральным, а не на уровне штата. Однако Адлер считает это «игрой в прятки» (hiding the ball). Он убежден, что руководство компании не поддержало бы и федеральный аналог такого закона, если бы он накладывал реальную ответственность [1:26:06]. Стивен видит в этом проявление «динамики гонки»: лаборатории боятся, что тщательное тестирование станет их конкурентным недостатком, если соперники будут выпускать продукты быстрее [1:23:28]. Он призывает установить «минимум времени на тестирование» (minimum testing period) как обязательный стандарт для всей индустрии, чтобы безопасность перестала быть обузой для бизнеса.

### Трансформация OpenAI: от миссии спасения мира к интересам акционеров
[[JUMP:1:28:30]]

Трансформация OpenAI из некоммерческой организации в коммерческую структуру вызывает у Адлера серьезные опасения по поводу будущего контроля над технологией. Когда Стивен пришел в компанию, он искренне верил в устав (Charter), согласно которому фидуциарная ответственность (обязанность действовать в чьих-то интересах) организации была направлена на всё человечество, а не на акционеров [1:28:57].

Смена юридической структуры меняет всё:

*   В некоммерческой модели совет директоров обязан следить за тем, чтобы AGI приносил пользу людям.
*   В коммерческой модели компания по закону обязана защищать интересы инвесторов и максимизировать прибыль [1:30:01].

Адлер считает аргументы руководства о том, что «некоммерческая часть всё равно останется», попыткой скрыть суть проблемы. Главный вопрос — сохранит ли некоммерческий совет контроль над коммерческим подразделением. Если совет больше не может ограничивать действия компании ради безопасности, значит, миссия «на благо человечества» становится лишь маркетинговым лозунгом [1:30:26]. Он отмечает, что компании сейчас находятся в «плохом равновесии»: они видят огромные риски, но не могут остановиться, потому что боятся «дефекции» (предательства) со стороны конкурентов или геополитических противников [1:32:40].

### Информационные бункеры и внутренняя секретность
[[JUMP:1:37:57]]

По мере того как модели становятся мощнее, OpenAI всё сильнее ограничивает доступ к информации даже внутри компании. Адлер подтверждает отчет Apollo Research, в котором говорится, что самые мощные системы могут использоваться для чувствительных внутренних задач еще до того, как о них узнает публика [1:38:11].

В начале пути OpenAI была открытой средой, где почти каждый знал о ходе обучения моделей. Сегодня действует жесткий принцип «need to know» (доступ только при необходимости). Это создает опасную ситуацию:

*   Сотрудники, отвечающие за безопасность и оценку рисков (AGI Readiness), могут не знать, какие именно алгоритмы и возможности «сходят с конвейера» в данный момент [1:39:32].
*   Информационные бункеры лишают персонал возможности вовремя заметить критические проблемы.

Адлер подчеркивает: если вы не слышите от сотрудников лабораторий публичных (пусть даже анонимных) заявлений о проблемах, это не обязательно означает, что проблем нет. Возможно, люди просто не владеют всей полнотой картины из-за фрагментации данных внутри организации [1:40:14]. Ранее в разговоре Натан Лабенц упоминал о росте скрытности, и Стивен соглашается: разрыв между тем, что доступно через API, и тем, что реально существует в недрах компании, продолжает стремительно расти.

## 🏗️ Культурный сдвиг и «чувство AGI»: Будущее контроля в OpenAI
[[JUMP:1:40:14]]

Заключительная часть беседы Стивена Адлера с Натаном Лабенцем сосредоточена на внутренней трансформации OpenAI: от небольшого сообщества идеалистов до гигантской корпорации, где вопросы безопасности всё чаще сталкиваются с амбициями продукта и государственными интересами.

### Крах Superalignment и новая корпоративная этика
[[JUMP:1:40:14]]

Развал команды Superalignment («Сверхобъединение») стал для многих внешних наблюдателей подтверждением того, что в OpenAI произошёл фундаментальный сдвиг приоритетов. Стивен Адлер, комментируя уход Яна Лейке и его команды, отмечает, что верит публичным заявлениям Лейке: тот описывал ситуацию как постепенное ухудшение, где вопросы безопасности и вычислительные ресурсы для них приносились в жертву выпуску «блестящих новых продуктов» [1:41:04]. По мнению Адлера, это не было разовым конфликтом, а скорее накоплением критической массы философских разногласий [1:41:32].

Параллельно с этим менялся и кадровый профиль компании. Если пять лет назад в OpenAI шли математики-идеалисты, вдохновлённые миссией, то теперь, по словам Натана Лабенца, туда приходят лучшие выпускники, которые раньше выбирали бы хедж-фонды [1:44:08]. Адлер подтверждает, что атмосфера изменилась:

*   Раньше OpenAI позиционировалась как исследовательская лаборатория с «продуктовым придатком» для финансирования миссии.
*   Теперь же на внутренних мероприятиях звучат фразы в духе «OpenAI — это не только продуктовая компания, но и исследовательская лаборатория» [1:45:16].

Стивен вспоминает показательный случай на одном из выездных совещаний по безопасности: из 60–70 человек в зале лишь четверо работали в компании до того, как она стала коммерческим бизнесом и развернула GPT-3 [1:45:43]. Как упоминалось ранее в разговоре, эта трансформация из науки в продукт повлекла за собой создание закрытых информационных бункеров.

### «Feel the AGI»: Религиозный вайб и военные контракты
[[JUMP:1:41:40]]

Внутри OpenAI долгое время существовала специфическая культура, которую Натан Лабенц описывает как «почти буддийскую отстранённость» или «настрой игрока НБА», когда исследователь должен быть полностью в моменте, доверяя процессу [1:42:11]. Ходили легенды о медитативных сессиях под руководством Ильи Суцкевера, где сотрудники должны были буквально «чувствовать AGI» (Feel the AGI) [1:41:45]. 

Адлер признаёт, что Илья Суцкевер блестяще умел помогать сотрудникам ощутить масштаб и ставки того, что они создают [1:42:51]. Однако с ростом компании поддерживать этот уровень осознанности стало сложнее. В то же время, это ощущение «священной миссии» начало сталкиваться с реальностью геополитики.

Обсуждая изменение политики OpenAI в отношении военного использования технологий, Адлер отмечает, что партнерство с компаниями вроде Anduril вызывает внутренние споры [1:46:08]. Хотя в компании есть люди, считающие работу на американское оборонное ведомство «добродетелью», другие опасаются прямой вепонизации систем [1:46:36]. Ранее в интервью собеседники касались темы того, как ИИ может облегчить создание биологического оружия, что делает вопрос военного контроля ещё более острым.

### Цена критики: Секретность и безопасность сотрудников
[[JUMP:1:47:00]]

Одной из самых мрачных тем разговора стала безопасность бывших сотрудников, решивших открыто критиковать руководство. Стивен Адлер упоминает трагическую смерть Сучира Баладжи (Suchir Balaji), экс-сотрудника OpenAI, которая породила волну конспирологических теорий [1:47:02]. Хотя Адлер не верит в теорию заговора, он подчеркивает, что сама атмосфера секретности делает среду крайне токсичной.

«Это ужасное состояние дел, когда нам вообще приходится задавать такие вопросы», — говорит Стивен [1:47:56]. Он вспоминает, что после его собственных твитов о рисках ИИ друзья советовали ему публично заявить, что он «никогда не причинит себе вреда», чтобы исключить инсценировки [1:48:10]. Это свидетельствует о глубоком недоверии и страхе перед юридическими или физическими последствиями разглашения информации. 

Адлер также упомянул, что работа в OpenAI приносила больше тревоги по поводу террористических актов из-за неоднозначности деятельности компании, чем опасений за личную безопасность после ухода [1:49:14]. Он отмечает, что большинство рядовых сотрудников часто даже не замечают протестов у дверей офиса, получая лишь сухие уведомления от службы безопасности с просьбой выбрать другой вход [1:50:05].

### Советы инсайдерам и борьба за контроль
[[JUMP:1:58:30]]

Завершая интервью, Стивен Адлер дает рекомендации тем, кто сейчас работает в лабораториях Frontier AI. Его главный призыв — добиваться от руководства четких, публично зафиксированных обязательств, которые будет трудно отменить незаметно. В качестве примера он приводит Anthropic, у которых на сайте есть отдельная страница со списком конкретных обещаний [1:58:49].

Адлер призывает коллег:

1.  **Проявлять инициативу снизу:** Браться за проекты по безопасности, на которые у руководства вечно «не хватает рук» из-за гонки продуктов [2:00:08].
2.  **Скептически относиться к «системным картам»:** Часто существует разрыв между тем, что компания декларирует (например, специфическое тестирование через fine-tuning), и тем, что делается на практике [2:01:00].
3.  **Использовать коллективную силу:** Адлер ссылается на анализ Ричарда Нго о том, что главной преградой для изменений внутри компании является неосведомленность сотрудников о том, что их коллеги думают так же [1:51:41].

В контексте недавнего amicus brief (юридического заключения), которое Стивен подписал вместе с 11 другими бывшими сотрудниками, он подчеркивает: контроль некоммерческой организации над коммерческим подразделением — это не вопрос денег или оценки компании, это вопрос выживания изначальной миссии [1:53:52]. Он выражает сожаление, что компании вовлечены в «дегенеративную гонку», где каждый новый участник лишь размывает таланты в области безопасности и усложняет координацию [1:57:43].