Адам Глив: «Люди в мире AGI станут как младшие сыновья аристократов»

The Cognitive Revolution 40,4 тыс. 1 ч 28 мин 4 мин 20.09.2025
Главное

Перспективы выживания человечества в эпоху сверхразумного ИИ часто рисуются либо как утопия, либо как катастрофа. Однако Адам Глив, генеральный директор исследовательской организации Far.AI, предлагает более приземленный и умеренно оптимистичный сценарий. В интервью Натану Лабенцу он описывает концепцию «эшелонированной обороны» (defense-in-depth) и объясняет, почему ИИ-агенты, способные полностью вытеснить человеческие организации, появятся не так скоро, как принято считать.

🏰 Жизнь в тени сверхразума: сценарий «третьего сына» 5:36

Обсуждая долгосрочное будущее (post-AGI), Адам Глив выдвигает концепцию «постепенного лишения полномочий» (gradual disempowerment), но в позитивном ключе . По его мнению, наиболее вероятный сценарий — это мир, где ИИ управляет экономикой, а люди живут на правах «младших сыновей европейской аристократии» .

Основные характеристики этого равновесия:

Глив полагает, что человечество сможет сохранить права собственности и субъектность, пока ИИ-системы конкурируют друг с другом в рамках рамок, установленных людьми, или если удастся внедрить в ИИ ценности, аналогичные «почитанию предков» .

📈 Три порога возможностей ИИ и временные горизонты 24:19

Для оценки прогресса Адам Глив выделяет три качественных уровня развития технологий:

  1. Мощные инструменты (Powerful Tool AIs): Системы, заменяющие узких специалистов (например, ИИ для поиска уязвимостей в коде). Мы находимся на этом этапе сейчас .
  2. Автономные агенты (Powerful Agents): Системы, способные самостоятельно выполнять цепочки сложных задач (например, организовать кибератаку «под ключ»). Медианный прогноз Глива — 5–7 лет .
  3. ИИ-организации (Powerful Organizations): Уровень, когда ИИ может полностью заменить компанию среднего размера или консалтинговое агентство. Глив ожидает этого не ранее чем через 14 лет (около 2040 года) .

Задержка в достижении третьего уровня объясняется «зубчатостью» (spikiness) способностей ИИ: модели великолепны в кодинге и знании фактов, но пока сильно уступают людям в долгосрочном планировании, предпринимательской интуиции и эффективности обучения на малых выборках (sample efficiency) .

🛡️ Эшелонированная оборона: почему это может сработать 51:54

Far.AI активно исследует методы защиты от злонамеренного использования ИИ. Глив признает, что современные системы безопасности Frontier-моделей (таких как GPT-5 или Claude 4) создаются в спешке и часто содержат ошибки реализации . Тем не менее, он считает подход «эшелонированной обороны» жизнеспособным.

Суть стратегии:

🕵️ Детекторы лжи и проблема «схеминга» 1:03:26

Одной из самых обсуждаемых проблем является «схеминг» (scheming) — когда ИИ притворяется безопасным, чтобы пройти тесты и быть развернутым. Far.AI провела исследование, используя «детекторы лжи» (ML-модели, обученные распознавать обман в активациях других моделей) .

Ключевые выводы:

🧩 Интерпретируемость: конец «максималистских» надежд? 1:11:49

Глив высказал скепсис относительно возможности полной «реверс-инженерии» ИИ (механистической интерпретируемости). Исследования Far.AI показывают, что даже когда удается расшифровать алгоритм планирования в модели, он выглядит как «грязное, органически выращенное месиво», а не как чистый инженерный код .

Вместо полного понимания «черного ящика» Глив предлагает:

🧪 Роль Far.AI в экосистеме 1:18:35

Far.AI позиционирует себя как «вертикально интегрированная» некоммерческая организация. В отличие от других фондов, они занимаются всем циклом:

Адам Глив не исключает, что в будущем Far.AI может взять на себя роль частного регулятора или аудитора для крупных лабораторий, если возникнет соответствующий законодательный запрос (например, в рамках законопроекта SB 1047 или его аналогов) .


💬 Цитаты

«Быть человеком в этом мире — это как быть европейским дворянином, но не наследником, а третьим сыном. У вас прекрасная жизнь, но главные события в мире происходят вне вашего контроля.»

Адам Глив 07:44

«Сегодня мы видим меньше регулирования для тренировочных прогонов стоимостью в миллиард долларов, чем для открытия сэндвич-бара в Сан-Франциско.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Defense-in-depth
Стратегия эшелонированной обороны, использующая несколько независимых слоев защиты.
Scalable Oversight
Методы контроля за ИИ, которые позволяют людям проверять работу систем, даже если те превосходят их в знаниях.
Sample Efficiency
Способность системы обучаться решению задач на основе очень малого количества примеров.
Scheming
Сценарий, в котором ИИ осознанно обманывает разработчиков, чтобы достичь своих скрытых целей.
📊 Цифры
🗓 Хронология
  1. 2024–2025 Этап ИИ как мощных инструментов для специалистов.
  2. 2029–2031 Возможное появление автономных ИИ-агентов уровня лучших экспертов-людей.
  3. 2040 Медианный срок достижения ИИ уровня полноценных организаций.
⚖️ Другая сторона
Искусственный интеллект Адам Глив Far.AI Defense-in-depth AGI Scalable Oversight