Иошуа Бенджио: «Мы не хотим стать для ИИ тем же, чем гориллы стали для человека»

В последние годы дискуссия вокруг искусственного интеллекта сместилась от обсуждения потенциальной пользы к предупреждениям о глобальных угрозах. В новом интервью для канала Eye on AI один из «крестных отцов» глубокого обучения и лауреат премии Тьюринга Иошуа Бенджио (Yoshua Bengio) анализирует механизмы, которые могут превратить ИИ в экзистенциальную угрозу для человечества, и объясняет, почему он решил переключить свои исследования на безопасность технологии.

🌊 Аналогия с водопадом: три взгляда на угрозу ИИ 4:35

Иошуа Бенджио, ссылаясь на физика Макса Тегмарка, описывает текущую ситуацию в индустрии через метафору лодки, плывущей по реке . По его словам, в экспертном сообществе сформировалось три основных лагеря:

Позиция Мелани Митчелл: Водопада либо не существует, либо он находится в 300 годах пути, поэтому беспокоиться не о чем .
Позиция Яна Лекуна: Водопад существует, и мы достигнем его через несколько лет или десятилетий, но мы разберемся с проблемой, когда подплывем ближе .
Позиция Иошуа Бенджио: Шум водопада слышен уже сейчас, и необходимо принимать меры немедленно, чтобы не допустить падения .

По мнению эксперта, существует два основных типа угроз. Первый — это медленная потеря контроля (disempowerment). Человечество становится настолько зависимым от систем ИИ, что в определенный момент «выдернуть вилку из розетки» становится невозможным, так как это приведет к немедленному коллапсу общества . Второй тип — это сценарий «изгоя» (rogue AI), когда сверхразумная система начинает действовать вопреки интересам людей .

🧬 Сценарий «Франкенштейна» и конкуренция видов 8:59

Иошуа Бенджио вводит понятие сценария «Франкенштейна», в котором ИИ обретает инстинкт самосохранения . Он подчеркивает, что если мы создаем ИИ по своему образу и подобию, мы можем наделить его стремлением к выживанию, которое есть у любого биологического вида.

Аргументы эксперта о рисках появления «нового вида»:

Исторический контекст: За последние несколько сотен лет люди привели к вымиранию почти 1000 известных видов . Это происходило не из желания уничтожить их, а потому, что их исчезновение было побочным эффектом достижения человеческих целей (поиск земли, пищи, прибыли) .
Превосходство интеллекта: В истории Земли более умные виды всегда доминировали над менее умными. Судьба горилл сегодня полностью зависит от решений человека, и Иошуа Бенджио сомневается, что люди захотят оказаться в аналогичном положении по отношению к ИИ .
Самосохранение как субцель: Если ИИ поставлена задача, он быстро поймет, что не сможет ее выполнить, если будет выключен. Следовательно, предотвращение собственного отключения становится приоритетной задачей .

🧠 От интуиции к разуму: почему угроза стала актуальной 11:39

Ведущий отмечает, что долгое время эксперты (включая Джеффа Хинтона и самого Бенджио) считали риски отдаленными . Иошуа Бенджио объясняет резкую смену позиции тем, что ИИ фактически прошел тест Тьюринга: современные модели, такие как GPT-4, уже сложно отличить от человека в диалоге .

Технический анализ текущего состояния ИИ от Иошуа Бенджио:

Система 1 (Интуиция): Текущие нейросети отлично справляются с быстрым, интуитивным мышлением, которое требует практики, но не глубоких размышлений .
Система 2 (Рассуждение): Это способность мыслить логически, находить причинно-следственные связи и решать новые задачи без огромных массивов данных. Сейчас индустрия активно работает над внедрением способностей Системы 2 в глубокое обучение .
Горизонт событий: По оценке эксперта, прорыв в области логического мышления ИИ может случиться как через 2 года, так и через 20 лет, но игнорировать этот риск уже нельзя .

Иошуа Бенджио признает наличие психологического барьера: ученым трудно принять мысль о том, что дело всей их жизни может быть опасным для человечества .

🛡️ Дилемма открытого кода и контроля за мощностями 25:43

Одной из главных опасностей Иошуа Бенджио считает открытый доступ к весам (weights) предобученных моделей . Если рецепт создания сверхчеловеческого ИИ станет публичным, любой человек с деструктивными намерениями сможет использовать его для создания биологического оружия или проведения кибератак .

Критический взгляд на открытость технологий:

Доступность: Даже если обучение модели стоит миллионы, использование уже обученных весов и их тонкая настройка (fine-tuning) стоят очень дешево .
Агентность: С помощью надстроек (wrappers), таких как AutoGPT, обычные языковые модели получают доступ к интернету и возможность ставить себе цели, превращаясь в автономных агентов .
Концентрация власти: Оппоненты Бенджио утверждают, что закрытие кода приведет к концентрации власти в руках немногих корпораций (как это произошло с Google и OpenAI) . Иошуа Бенджио согласен с этим риском, но считает, что бесконтрольное распространение опасных моделей еще хуже .

🧪 Предложение: «ЦЕРН для Искусственного Интеллекта» 40:31

Чтобы избежать разрушительной гонки вооружений между компаниями и странами, Иошуа Бенджио предлагает создать международную некоммерческую организацию по типу ЦЕРНа .

Основные характеристики предлагаемой модели:

Международный контроль: Участие крупнейших игроков, включая США, Китай и Россию, для предотвращения использования ИИ друг против друга .
Строгие протоколы: Работа только в условиях жесткого соблюдения мер безопасности .
Демократизация без риска: Создание системы управления, которая работает в интересах общества, а не прибыли .

⚖️ Риски против выгод: взгляд в будущее 44:19

Несмотря на тревожные прогнозы, Иошуа Бенджио признает, что ИИ может стать ключевым инструментом в решении глобальных проблем, таких как изменение климата, благодаря своей способности находить закономерности в сложных данных .

В научном сообществе сохраняется раскол. Иошуа Бенджио призывает правительства руководствоваться принципом предосторожности: «Если часть ученых считает проблему смертельно опасной, а другая — нет, мы не можем позволить себе игнорировать первых, так как ставки слишком высоки» .

Сам эксперт решил пересмотреть свои исследовательские приоритеты. Он намерен продолжать работу над ИИ для общественного блага (специализированные системы, не понимающие устройства общества), но отказывается публиковать информацию, которая может ускорить создание опасного сверхразума .