Технологии или безопасность: как ИИ стал новым Манхэттенским проектом

The Cognitive Revolution 2,3 тыс. 2 ч 10 мин 20 мин 23.04.2025
Главное

Гонка за создание сверхразумного ИИ превратилась в игру с нулевой суммой, где цена промедления — не просто потеря лидерства, а национальная безопасность, сравнимая с угрозой биологического оружия. Пока лаборатории США работают в режиме «Slack-разговоров», Китай уже внедрил «трояны» в критическую инфраструктуру, делая ставку на аппаратный саботаж и геополитическое давление для достижения доминирования. В этой смертельной гонке «труса» единственным шансом на выживание становится переход к жесткому режиму безопасности Манхэттенского проекта и стратегии принудительного замедления конкурента.

🧠 Дилемма сверхразума: за пределами гонки вооружений 8:41

В современном дискурсе о технологическом превосходстве термины «ИИ общего назначения» (AGI) и «сверхразум» часто подменяют друг друга, однако Эдуард Харрис и Джереми Харрис настаивают на более строгой дефиниции. Сверхразум — это не просто продвинутый алгоритм, а система, способная превзойти лучших экспертов-людей практически в любой области . Если калькулятор обладает «узким» сверхразумом в арифметике, то истинный стратегический сверхразум обладает универсальностью, которая делает его цели потенциально непостижимыми для человеческого понимания .

Такой уровень способностей неизбежно подразумевает наличие процесса, который Джереми Харрис называет «взрывом интеллекта». Если система становится лучше людей в области автономных исследований самого ИИ, она запускает цикл самосовершенствования, который может сжать десятилетия прогресса в недели или даже дни . С этой точки зрения, сверхразум — это не просто еще одна технология, а «решающий источник стратегического преимущества» . Он способен проектировать биологическое оружие нового поколения или совершенные кибер-инструменты, становясь абсолютным вектором национальной безопасности. Ранее в разговоре авторы отмечали, что это ставит США перед необходимостью создания проекта масштаба Манхэттенского, но с беспрецедентным уровнем защиты.

Американский тупик: между Пекином и безопасностью 13:27

Ситуация, в которой оказались США, характеризуется экспертами как «переопределённая задача» (over-constrained problem) . С одной стороны, существует риск потери контроля над сверхразумом, который может оказаться принципиально «неприручаемым». С другой стороны, нарастает гонка с Китаем, где любое замедление ради проверки безопасности может означать передачу технологического лидерства геополитическому противнику.

Джереми Харрис отмечает опасную поляризацию в экспертном сообществе: те, кто осознает риски безопасности, часто игнорируют реальность конкуренции с КНР, и наоборот . При этом надежды на «большую сделку» с Пекином по контролю над ИИ выглядят утопично. Опыт сотрудников Госдепартамента и разведсообщества показывает, что в текущих условиях диалог невозможен без механизмов «доверия и проверки», которыми США сейчас не располагают . В отличие от ядерных технологий, где существуют физические маркеры, современное оборудование для ИИ пока не позволяет удаленно контролировать соблюдение стандартов безопасности на территории конкурента.

Почему ИИ больше похож на вирус, чем на бомбу 15:50

Хотя ядерная аналогия популярна, Эдуард Харрис утверждает, что биологическое оружие дает гораздо более точное представление о рисках ИИ . Существует три ключевых точки соприкосновения:

Главное отличие заключается в том, что биологические агенты «глупее» человека, тогда как сверхразум будет активно и творчески искать способы обойти любые барьеры сдерживания . Если вирус распространяется по биологическим векторам случайно, то сверхразум может целенаправленно использовать человеческую инфраструктуру или социальную инженерию для достижения своих целей.

«Зубчатый рельеф»: скрытая уязвимость всемогущих систем 19:28

Одним из самых парадоксальных аспектов современного ИИ является «зубчатый рельеф» (jagged frontier) его способностей. Системы, демонстрирующие сверхчеловеческие результаты в сложных задачах, могут внезапно терпеть крах в элементарных сценариях. Джереми Харрис приводит в пример исследование лаборатории FAR AI: им удалось победить ИИ-игроков в Го сверхчеловеческого уровня, используя крайне примитивную стратегию, на которую никогда не попался бы даже игрок-любитель среди людей .

Эта «зубчатость» возникает из-за того, что нейросети мыслят иными категориями, чем люди. Их слепые зоны структурно отличаются от наших . Опасность заключается в том, что:

  1. Мы не можем интуитивно предсказать, где именно ИИ совершит ошибку .
  2. Ошибки ИИ «подсвечиваются как рождественская елка» для человеческого глаза, когда они уже совершены, но остаются невидимыми для системы в процессе планирования .
  3. В контексте национальной безопасности этот рельеф создает ложное чувство надежности: система может безупречно выполнять 98% задач, но катастрофически провалиться в оставшихся 2%, что делает ее использование в условиях реального конфликта крайне рискованным.

Хотя в будущем рекурсивное самосовершенствование может помочь «залатать» эти дыры (тема, которой эксперты коснутся позже), на данном этапе развития «зубчатость» остается фундаментальным барьером для безопасного развертывания мощных моделей.

🚀 Путь к самосовершенствованию и культурный разлом лабораторий 25:09

Рекурсивное самосовершенствование как кратчайший путь к цели 27:18

В индустрии искусственного интеллекта концепция «сверхразума» перестает быть абстракцией и обретает конкретные очертания через призму автоматизации научных исследований. Джереми Харрис отмечает, что ведущие лаборатории мира не просто строят более мощные чат-боты — их главной целью является достижение точки рекурсивного самосовершенствования (RSI) . Это сценарий, в котором ИИ-система становится способной выполнять работу инженеров и исследователей, экспоненциально ускоряя собственный прогресс.

Ранее в разговоре эксперты упоминали «зубчатый рельеф» (jagged frontier) способностей нейросетей, и именно в контексте RSI эта особенность становится критической. Джереми подчеркивает, что для потери контроля над системой не обязательно обладать «идеальным» разумом во всех сферах. Достаточно, чтобы ИИ был «достаточно гладким» и лишенным пробелов именно в тех областях, которые позволяют ему модифицировать собственный код и архитектуру . Если система сможет эффективно исправлять свои недостатки, она начнет «сшивать» свои слабые места, превращаясь из набора разрозненных навыков в связного агента.

Эдуард Харрис дополняет это видением «неуклюжего» (flabby) сверхразума. В отличие от ранних теоретических моделей идеального рационального агента, современные системы, такие как GPT-4o, развиваются через глубокую мультимодальность . Интеграция текста, зрения и аудио в едином латентном пространстве позволяет ИИ формировать своего рода «интуитивную физику» . Это означает, что системе не нужно просчитывать каждое движение молекул; она начинает «чувствовать» закономерности реальности так же, как человек ловит мяч, не решая дифференциальных уравнений в уме .

Путь к самосовершенствованию, по мнению авторов, лежит через:

Логика гонки диктует свои правила: как только одна лаборатория встает на путь RSI, остальные вынуждены следовать за ней, чтобы не остаться позади. Это создает ситуацию, которую Джереми называет «йоло-подходом» (YOLOing) к разработке . Исследователи осознают, что могут находиться в последних месяцах, когда человеческий вклад еще имеет значение для конечного результата, что заставляет их работать на износ, игнорируя риски безопасности .

Корпоративная культура: авторитарность OpenAI против открытости Anthropic 48:46

Разрыв между амбициозными целями и методами их достижения наиболее ярко проявляется в различии внутренних культур двух главных игроков рынка — OpenAI и Anthropic. Основываясь на результатах своего расследования и беседах с нынешними и бывшими сотрудниками, Джереми Харрис указывает на глубокий социологический разлом в Кремниевой долине .

OpenAI под руководством Сэма Альтмана демонстрирует культуру жесткой централизации и закрытости. Джереми отмечает «невероятную расплывчатость», с которой Альтман описывает природу сверхразума и свои планы на него . По мнению эксперта, эта неопределенность является не случайностью, а стратегическим активом, который используется для привлечения талантов и инвестиций. Внутри компании наблюдается резкий контраст: в то время как руководство транслирует оптимизм, рядовые исследователи выражают глубокую обеспокоенность .

В OpenAI сотрудники чувствуют себя на «коротком поводке» . Авторы подчеркивают следующие особенности этой культуры:

Напротив, культура Anthropic описывается как более «здоровая» и склонная к внутренним дискуссиям. Сотрудники этой лаборатории чувствуют себя комфортно, выражая несогласие с руководством, что является важным «культурным фундаментом» для обеспечения безопасности ИИ . Там нет того фатального разрыва между словами исполнительных директоров и убеждениями инженеров, который характерен для их главного конкурента.

Различия в культуре имеют прямые последствия для безопасности: в закрытой и авторитарной среде OpenAI критические ошибки в процессе рекурсивного самосовершенствования могут быть скрыты или проигнорированы ради сохранения темпов гонки. В то время как Anthropic пытается сохранить возможность «нажать на тормоз», OpenAI, по мнению авторов, движется к сверхразуму в режиме максимального ускорения, полагаясь на лояльность ИИ-агентов больше, чем на прозрачность процессов .

🛡️ Шпионаж, «AGI-pilled» Вашингтон и ловушка Молоха 50:47

Состояние информационной безопасности в ведущих ИИ-лабораториях США остается критическим, несмотря на осознание ими амбиций по созданию сверхразума. Джереми Харрис утверждает, что ведущие американские компании, такие как OpenAI и Anthropic, на текущий момент «глубоко скомпрометированы» спецслужбами КНР . По его словам, рыночные стимулы и культурные особенности Кремниевой долины мешают лидерам индустрии инвестировать в защиту весов моделей так, как того требует ситуация национального уровня.

Проникновение китайского шпионажа в лаборатории США 50:47

Исследование, поддержанное Государственным департаментом США и опубликованное около года назад, показало, что ситуация с безопасностью в ИИ-секторе была «катастрофически плохой» . С тех пор был достигнут определенный прогресс, однако он всё ещё далек от необходимого уровня защиты. Основная проблема заключается в том, что лаборатории не рассматривают защиту своих разработок через призму противодействия государственным спецслужбам (nation-state actors).

Джереми Харрис подчеркивает несколько факторов этой уязвимости:

Проблема шпионажа становится экзистенциальной, так как похищение весов моделей позволяет Китаю не просто догнать США, но и использовать эти технологии для атак на американскую инфраструктуру . Ранее в разговоре эксперты уже упоминали аналогию между ИИ и биологическим оружием, что делает утечку параметров модели эквивалентной передаче чертежей патогена противнику. По мнению гостей, к моменту, когда американская лаборатория осознает, что создала нечто пугающее и опасное, китайская сторона, скорее всего, уже украдет эти данные и будет завершать обучение аналогичной модели на своих серверах .

Вашингтон принимает «AGI-таблетку» 1:03:39

За последние полтора года отношение американского истеблишмента к искусственному интеллекту претерпело радикальную трансформацию. Если раньше обсуждение AGI (общего искусственного интеллекта) считалось маргинальным, то сегодня целые офисы в правительственных структурах стали, по выражению Джереми Харриса, «AGI-pilled» — то есть осознали неизбежность и стратегическую важность сверхразума .

Ключевым фактором этого сдвига стал манифест Леопольда Ашенбреннера «Situational Awareness» (Ситуационная осведомленность). Несмотря на отсутствие широкого освещения в мейнстримных медиа, этот документ стал определяющим для кругов национальной безопасности как в США, так и в Китае . Эдуард Харрис отмечает, что китайское руководство также восприняло эти идеи всерьез: переводы манифеста циркулировали в Пекине почти сразу после публикации, а генеральные директора китайских ИИ-компаний теперь напрямую отчитываются перед Политбюро, выступая в роли «капитанов индустрии», сражающихся за величие страны .

Китай уже анонсировал инвестиционный пакет в размере около 250 миллиардов долларов (в пересчете по паритету покупательной способности) в ИИ-инфраструктуру . Это подтверждает, что КНР рассматривает ИИ как решающий фактор в многолетнем экзистенциальном противостоянии с Западом .

Дилемма двух лагерей и ловушка Молоха 1:09:50

Внутри экспертного сообщества США возник глубокий раскол между двумя группами, которые фактически не слышат друг друга :

  1. Лагерь безопасности (Safety): Считает ИИ проблемой координации. Они убеждены, что системы могут стать неуправляемыми, и единственный выход — всеобщее замедление для решения проблемы выравнивания (alignment) .
  2. Лагерь национальной безопасности (NatSec): Настаивает, что любая сделка с Китаем о замедлении невозможна, так как Пекин исторически нарушает международные соглашения. С их точки зрения, единственный путь к безопасности — это победа в гонке .

Этот конфликт интересов создает «ловушку Молоха». Лидеры лабораторий, такие как Сэм Альтман, теряют агентность — они не могут просто остановиться. Если OpenAI решит выйти из гонки из соображений безопасности, их место мгновенно займут Anthropic, xAI или Meta, а динамика глобальной угрозы не изменится .

Эдуард Харрис объясняет, что в текущей логике рынка и геополитики «игра в труса» (game of chicken) ведется у самого края обрыва. Участники надеются, что смогут «превратить машину в самолет» прямо во время падения, то есть решить проблему контроля над ИИ уже в процессе его создания . Единственным фактором, способным изменить эту траекторию, эксперты называют «кровь на полу» — масштабный инцидент с человеческими жертвами, вызванный использованием открытых моделей или вышедшим из-под контроля ИИ, который заставит политиков перейти к более трезвому и жесткому регулированию .

🛡️ Физическая уязвимость: «Закладки» в энергосетях и хрупкость дата-центров 1:16:38

Разговоры о безопасности ИИ часто ограничиваются программным кодом и алгоритмами, но Джереми Харрис и Эдуард Харрис подчеркивают: битва за сверхразум будет выиграна или проиграна на уровне «железа» и бетона. Текущее состояние американской критической инфраструктуры эксперты описывают крайне тревожно, заявляя, что Китай уже «держит пистолет у виска» США . Это не метафора, а результат многолетнего внедрения вредоносного ПО и аппаратных «троянов» в жизненно важные системы страны.

Критическая инфраструктура как заложник КПК 1:16:38

Джереми Харрис отмечает, что факт внедрения китайских «закладок» в американские энергосети и системы водоснабжения является публично раскрытой информацией . Цель Пекина — иметь возможность парализовать США изнутри в случае открытого конфликта, например, вокруг Тайваня. Если военные действия начнутся, КНР может просто «выключить свет», вызвав хаос и лишив Вашингтон возможности эффективно реагировать на внешние угрозы .

Ситуация усугубляется методами давления, которые использует КПК. Эдуард Харрис приводит в пример инцидент 2019 года в Беркли, когда во время планового отключения электричества китайские студенты впали в панику . Выяснилось, что они обязаны регулярно выходить на связь с кураторами из спецслужб, и любая задержка рассматривается как попытка дезертирства. Система принуждения работает через семьи: если исследователь в США отказывается сотрудничать, его родственники в Китае могут лишиться работы или доступа к медицине (например, к инсулину) . Учитывая, что значительный процент сотрудников ведущих ИИ-лабораторий — граждане КНР или люди с тесными связями в этой стране, создание закрытого «Манхэттенского проекта» сталкивается с беспрецедентными рисками шпионажа и саботажа .

Иллюзия защищенности: $10 миллиардов против $30 тысяч 1:25:57

Когда речь заходит о защите физических объектов — дата-центров, где будут обучаться модели сверхразума — реальность оказывается еще более суровой. Джереми Харрис рассказывает о визите на один из таких объектов стоимостью в 10 миллиардов долларов в сопровождении ветеранов элитных спецподразделений (Tier 1 units, таких как Delta Force и SEAL Team 6) .

Анализ профессионалов спецназа показал шокирующие результаты:

Харрисы подчеркивают, что современные стандарты безопасности дата-центров не рассчитаны на противостояние государственным акторам. Существует огромный разрыв между тем, что кажется безопасным гражданским инженерам, и тем, что профессиональные диверсанты считают «тривиальной целью» . Ранее в разговоре упоминался «зубчатый рельеф» способностей ИИ, и аналогичная ситуация наблюдается в защищенности государства: некоторые сферы защищены сверхнадежно, в то время как другие — критически важные — остаются полностью открытыми для удара .

Атаки Tempest: когда стены имеют уши (и радиоприемники) 1:30:43

Одной из самых экзотических, но крайне эффективных угроз являются атаки типа Tempest. Это метод кражи данных через анализ электромагнитных излучений (ЭМИ) компьютерного оборудования . Даже если компьютер полностью изолирован от интернета («air-gapped»), он всё равно излучает радиоволны в процессе работы процессора и памяти.

Джереми Харрис описывает сценарий, где вредоносное ПО заставляет память компьютера обращаться к данным с определенной частотой, фактически превращая материнскую плату в радиопередатчик . Шпион, находясь в гостевой зоне дата-центра за стеной, может считывать эти сигналы обычным смартфоном со специальным приложением .

Для защиты от таких атак требуются решения на уровне архитектуры здания:

  1. Соблюдение дистанции: необходимо минимум 3 фута (около 1 метра) свободного пространства между серверными стойками и стенами залов .
  2. Экранирование: использование специальных материалов, блокирующих ЭМИ.
  3. Проектирование зон: исключение возможности нахождения посторонних лиц в непосредственной близости от вычислительных мощностей.

Проблема в том, что эти требования являются «дверью в одну сторону» . Если дата-центр уже построен без учета Tempest-защиты, его практически невозможно модернизировать без сноса стен и полной перепланировки, что делает текущую волну строительства инфраструктуры ИИ потенциально уязвимой на десятилетия вперед.

Проблема «черного хода» в цепочках поставок 1:33:24

Физическая безопасность также упирается в происхождение компонентов. Эдуард Харрис указывает на критическую зависимость от тайваньской TSMC, но подчеркивает, что проблема глубже: даже второстепенные детали часто имеют китайские корни .

В условиях, когда Китай обладает возможностью удаленного воздействия на американскую сеть, США обязаны создать симметричные возможности (reciprocal capability) . В противном случае, гонка за сверхразумом превращается в игру, где одна сторона может в любой момент нажать кнопку «выкл» на оборудовании противника.

🛡️ Национальная безопасность: стратегия сдерживания и режим «Манхэттенского проекта» 1:40:23

Когда речь заходит о создании сверхразума (ASI), эксперты Джереми Харрис и Эдуард Харрис подчеркивают: это не просто очередной технологический рывок, а вопрос выживания государства. Ранее в разговоре они уже касались уязвимости критической инфраструктуры США перед китайскими кибератаками, но теперь дискуссия переходит в плоскость того, как именно должна выглядеть «крепость», внутри которой будет создаваться ИИ будущего. Если мы признаем ИИ оружием массового поражения, как это делает Сэм Альтман , то и методы его защиты должны радикально отличаться от привычных корпоративных стандартов Кремниевой долины.

Жесткий надзор за персоналом: уроки Лос-Аламоса 1:46:16

Реализация проекта национального сверхразума потребует условий, которые сегодня кажутся западным ученым антиутопией. Эдуард Харрис отмечает, что если США решатся на создание выделенного государственного центра разработки (условный «Проект Невада»), то моделью для него послужит Манхэттенский проект . Это подразумевает беспрецедентный уровень контроля над людьми.

В арсенале предлагаемых мер:

Джереми Харрис вспоминает исторический пример Ричарда Фейнмана, который в Лос-Аламосе в знак протеста против цензуры переписывался с женой с помощью шифров, развлекаясь тем, что цензоры не могли их вскрыть . Однако, несмотря на все меры, Клаус Фукс всё равно смог передать ядерные секреты Советскому Союзу . Современная ситуация осложняется тем, что сегодня шпионаж может быть автоматизирован. С другой стороны, автоматизация самих исследований ИИ может облегчить контроль: за действиями алгоритмов следить проще, чем за мыслями и письмами сотен ученых .

Стратегия сдерживания: как заставить противника выдать себя 1:48:38

Одной из центральных идей Эдуарда Харриса является признание того, что идеальной защиты не существует. Если сверхдержава вроде Китая решит атаковать объект, она может использовать всё — от внедренных агентов до крылатых ракет . Поэтому цель безопасности не в том, чтобы сделать кражу данных невозможной, а в том, чтобы сделать её «дорогой» и заметной.

Логика контрразведки здесь проста: нужно поднять планку безопасности настолько высоко, чтобы для её преодоления противнику пришлось мобилизовать огромные ресурсы . Масштабная подготовка к атаке неизбежно создаст «сигнатуру» — шум в информационном и физическом поле, который спецслужбы США (например, АНБ) смогут засечь заранее .

«Стабильность между великими державами сегодня поддерживается не за счет фактической обороны, а через угрозу возмездия», — поясняет Эдуард Харрис . Он сравнивает это с балансом сил между бандами в Чикаго: «Я знаю, что не могу помешать тебе выстрелить в одного из моих парней. Но если ты это сделаешь, я приду и убью твоего» . В контексте ИИ это означает, что Китай должен четко понимать: любая попытка эксфильтрации весов модели или саботажа приведет к немедленным и сокрушительным последствиям. Отсутствие таких последствий в последние годы лишь поощряло китайский шпионаж внутри США .

Китайская стратегия открытого кода как оружие 1:59:43

Особое внимание авторы уделяют недавним успехам китайских моделей, таких как DeepSeek. Существует мнение, что Китай «дарит» свои технологии миру через open-source, но Джереми Харрис призывает не обольщаться. Стратегия открытого кода в КНР — это инструмент государственного влияния, одобренный на высшем уровне КПК .

Основные цели этой стратегии:

  1. Обход санкций и экспортного контроля: Когда Китай выпускает мощные модели в открытый доступ, он подрывает попытки Запада ограничить их технологическое развитие, делая американские запреты на чипы менее эффективными в глазах мирового сообщества .
  2. Экономический демпинг: Наводнение рынка бесплатными или крайне дешевыми LLM (языковыми моделями) бьет по бизнес-моделям западных компаний, таких как Meta или OpenAI, заставляя их сокращать расходы и замедлять собственные разработки .
  3. Идеологическое и техническое влияние: Внедрение агентных систем с «черными ходами» (backdoors). Если западные компании начнут массово использовать китайские open-source модели для создания автономных агентов, Китай получит потенциальную возможность удаленно влиять на их поведение .

Интересно, что основатель DeepSeek в одном из подкастов случайно признал эффективность американских санкций на чипы, чем фактически дезавуировал многолетнюю пропаганду КПК о бесполезности ограничений . Это подчеркивает, что за фасадом «открытости» скрывается острая борьба за выживание в условиях дефицита вычислительных мощностей.

Джереми резюмирует: нынешнее состояние безопасности в американских ИИ-лабораториях, где сотрудники обсуждают критические уязвимости в открытых Slack-каналах , недопустимо. Будь то национальный проект или работа частных компаний, режим секретности должен быть приведен в соответствие с уровнем угрозы, которую представляет собой сверхразум.

🏁 Технологические барьеры и стратегия MAIM: как замедлить гонку вооружений 2:05:23

Завершая обсуждение глобальной безопасности, Джереми Харрис и Эдуард Харрис переходят к анализу практических сложностей, которые делают достижение международных договоренностей по ИИ — так называемой «Большой сделки» — крайне трудновыполнимой задачей. Основная проблема здесь кроется не только в политической воле, но и в физических ограничениях современных технологий контроля.

Аппаратный тупик: почему верификация соглашений практически невозможна 2:05:36

Любое международное соглашение о контроле над мощностью ИИ-систем требует механизмов верификации. Джереми Харрис отмечает, что хотя инвестиции в разработку способов контроля за сотрудничеством — это «темная лошадка», в которую стоит вложить миллиарды долларов , реальные сроки реализации таких решений выглядят удручающе. Проблема заключается в создании физической инфраструктуры, которую невозможно было бы скомпрометировать.

Эксперты, с которыми консультировались основатели Gladstone AI, настроены крайне пессимистично в отношении создания защищенных от взлома корпусов для чипов (tamper-detecting enclosures) . Если такой объект находится под полным физическим контролем противника, обладающего ресурсами целого государства, создать систему, способную сопротивляться длительному давлению и попыткам взлома на протяжении долгого времени, практически невозможно.

Более того, для достижения значимых вычислительных мощностей противнику придется взломать «миллионы таких чипов» , и надеяться на то, что аппаратный контроль станет непреодолимым барьером, не приходится. Разработка и внедрение таких защищенных систем в мировом масштабе заняли бы годы, что совершенно не вписывается в текущие темпы развития ИИ-индустрии . Таким образом, отсутствие надежного технического способа проверить соблюдение квот на вычисления делает любые дипломатические «сделки» с Китаем или другими игроками крайне уязвимыми.

Теория MAIM: активная деградация возможностей противника 2:06:29

Поскольку надежды на мирные соглашения и аппаратный контроль невелики, в дискуссии всплывает концепция MAIM. Как подчеркивает Джереми Харрис, это одно из самых интересных и важных направлений работы, которое вводит радикально иной подход: вместо пассивной защиты необходимо переходить к активным действиям .

Суть концепции MAIM (деградация возможностей противника) строится на жесткой логике безопасности:

  1. Чтобы создать безопасный и «выровненный» (aligned) сверхразум, лидирующей стороне нужен значительный запас времени и ресурсов по сравнению со вторым игроком в гонке .
  2. Получить этот «запас прочности» можно двумя путями: либо ускоряя собственные разработки, либо замедляя конкурента.
  3. Собственное ускорение сокращает общие сроки до появления сверхразума и экспоненциально увеличивает риски .

Следовательно, единственным логичным выходом остается активная деградация возможностей противника (capability degradation). Это подразумевает «активное вмешательство», контрразведку и саботаж программ разработки ИИ у оппонента . В рамках этой парадигмы безопасность достигается не через коллективные договоры, а через лишение противника технической способности создать опасную систему раньше, чем лидер успеет разработать методы контроля.

Сложность «хирургического» сдерживания 2:07:50

Однако теория активной деградации сталкивается с критикой со стороны разведывательного сообщества. Основной аргумент специалистов заключается в том, что в киберпространстве крайне сложно установить избирательный барьер безопасности . Невозможно создать защиту, которая была бы непреодолимой для негосударственных хакеров, но при этом позволяла бы государству полностью контролировать ситуацию — или наоборот, избирательно подавлять возможности другого государства, не затрагивая общую стабильность систем.

Джереми поясняет, что идея «тонкой настройки» уровней безопасности с помощью «скальпеля» воспринимается профессионалами в области разведки скептически . Тем не менее, он считает деградацию возможностей критическим столпом будущей стратегии национальной безопасности.

В завершение беседы Джереми и Эдуард Харрис призывают рассматривать их отчет Gladstone AI как «живой документ» и приглашают к сотрудничеству специалистов из сообществ разведки, спецопераций и кибербезопасности . Они продолжают собирать базу методов обеспечения безопасности дата-центров, которые могли бы стать «дверьми с односторонним движением» (one-way doors) для защиты американских разработок .

💬 Цитаты

«Сверхразум — это национальная технология безопасности. Это решающий источник стратегического преимущества. Точка.»

Джереми Харрис 11:44

«Китай активно внедрил множество «троянов» в нашу критическую инфраструктуру, они буквально держат пистолет у нашего виска.»

Джереми Харрис 01:16

«Самый быстрый путь к сверхразуму — это когда ваши исследователи работают со скоростью машины.»

Джереми Харрис 46:22

«Биологические агенты намного глупее тех ИИ, что существуют сегодня, и уж тем более тех, что мы построим.»

Эдуард Харрис 17:50

«Если вы серьезный игрок и создаете технологию уровня оружия массового поражения, ваша работа не должна выглядеть как обсуждение критических уязвимостей в Slack.»

Джереми Харрис 01:58

«Логика вынуждает вас к деградации возможностей противника... чтобы получить запас времени на разработку технологий безопасности.»

Джереми Харрис 02:07
👥 Спикеры
📖 Термины
ASI (Artificial Superintelligence)
ИИ-система, превосходящая людей во всех сферах интеллектуальной деятельности.
RSI (Recursive Self-Improvement)
Процесс, при котором ИИ самостоятельно совершенствует свой алгоритм, ускоряя развитие интеллекта.
MAIM
Стратегия активного замедления или саботажа ИИ-разработок конкурентов для обеспечения собственной безопасности.
Jagged frontier
Специфические слепые зоны ИИ, где система делает глупые ошибки, несмотря на сверхчеловеческие способности в других задачах.
Геополитика ИИ Китай США Сверхразум Национальная безопасность