Иошуа Бенджио: «Мы не хотим стать для ИИ тем же, чем гориллы стали для человека»

Eye on AI 31 тыс. 48 мин 4 мин 06.07.2023
Главное

В последние годы дискуссия вокруг искусственного интеллекта сместилась от обсуждения потенциальной пользы к предупреждениям о глобальных угрозах. В новом интервью для канала Eye on AI один из «крестных отцов» глубокого обучения и лауреат премии Тьюринга Иошуа Бенджио (Yoshua Bengio) анализирует механизмы, которые могут превратить ИИ в экзистенциальную угрозу для человечества, и объясняет, почему он решил переключить свои исследования на безопасность технологии.

🌊 Аналогия с водопадом: три взгляда на угрозу ИИ 4:35

Иошуа Бенджио, ссылаясь на физика Макса Тегмарка, описывает текущую ситуацию в индустрии через метафору лодки, плывущей по реке . По его словам, в экспертном сообществе сформировалось три основных лагеря:

По мнению эксперта, существует два основных типа угроз. Первый — это медленная потеря контроля (disempowerment). Человечество становится настолько зависимым от систем ИИ, что в определенный момент «выдернуть вилку из розетки» становится невозможным, так как это приведет к немедленному коллапсу общества . Второй тип — это сценарий «изгоя» (rogue AI), когда сверхразумная система начинает действовать вопреки интересам людей .

🧬 Сценарий «Франкенштейна» и конкуренция видов 8:59

Иошуа Бенджио вводит понятие сценария «Франкенштейна», в котором ИИ обретает инстинкт самосохранения . Он подчеркивает, что если мы создаем ИИ по своему образу и подобию, мы можем наделить его стремлением к выживанию, которое есть у любого биологического вида.

Аргументы эксперта о рисках появления «нового вида»:

🧠 От интуиции к разуму: почему угроза стала актуальной 11:39

Ведущий отмечает, что долгое время эксперты (включая Джеффа Хинтона и самого Бенджио) считали риски отдаленными . Иошуа Бенджио объясняет резкую смену позиции тем, что ИИ фактически прошел тест Тьюринга: современные модели, такие как GPT-4, уже сложно отличить от человека в диалоге .

Технический анализ текущего состояния ИИ от Иошуа Бенджио:

  1. Система 1 (Интуиция): Текущие нейросети отлично справляются с быстрым, интуитивным мышлением, которое требует практики, но не глубоких размышлений .
  2. Система 2 (Рассуждение): Это способность мыслить логически, находить причинно-следственные связи и решать новые задачи без огромных массивов данных. Сейчас индустрия активно работает над внедрением способностей Системы 2 в глубокое обучение .
  3. Горизонт событий: По оценке эксперта, прорыв в области логического мышления ИИ может случиться как через 2 года, так и через 20 лет, но игнорировать этот риск уже нельзя .

Иошуа Бенджио признает наличие психологического барьера: ученым трудно принять мысль о том, что дело всей их жизни может быть опасным для человечества .

🛡️ Дилемма открытого кода и контроля за мощностями 25:43

Одной из главных опасностей Иошуа Бенджио считает открытый доступ к весам (weights) предобученных моделей . Если рецепт создания сверхчеловеческого ИИ станет публичным, любой человек с деструктивными намерениями сможет использовать его для создания биологического оружия или проведения кибератак .

Критический взгляд на открытость технологий:

🧪 Предложение: «ЦЕРН для Искусственного Интеллекта» 40:31

Чтобы избежать разрушительной гонки вооружений между компаниями и странами, Иошуа Бенджио предлагает создать международную некоммерческую организацию по типу ЦЕРНа .

Основные характеристики предлагаемой модели:

⚖️ Риски против выгод: взгляд в будущее 44:19

Несмотря на тревожные прогнозы, Иошуа Бенджио признает, что ИИ может стать ключевым инструментом в решении глобальных проблем, таких как изменение климата, благодаря своей способности находить закономерности в сложных данных .

В научном сообществе сохраняется раскол. Иошуа Бенджио призывает правительства руководствоваться принципом предосторожности: «Если часть ученых считает проблему смертельно опасной, а другая — нет, мы не можем позволить себе игнорировать первых, так как ставки слишком высоки» .

Сам эксперт решил пересмотреть свои исследовательские приоритеты. Он намерен продолжать работу над ИИ для общественного блага (специализированные системы, не понимающие устройства общества), но отказывается публиковать информацию, которая может ускорить создание опасного сверхразума .

💬 Цитаты

«Очень трудно для собственного эго принять идею, что то, над чем ты работал десятилетиями, может быть на самом деле очень опасно для человечества.»

Иошуа Бенджио 16:19

«Мы привели к вымиранию почти тысячу видов не потому, что хотели их уничтожить, а потому, что это было побочным эффектом достижения наших целей.»

Иошуа Бенджио 10:47

«Гориллы все еще здесь, но сколько агентности у них осталось в их среде обитания? Все это контролируется нами.»

Иошуа Бенджио 11:11
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Система 1 и Система 2
Концепция Даниэля Канемана: Система 1 — быстрое, интуитивное мышление; Система 2 — медленное, логическое и аналитическое мышление.
Веса модели (Weights)
Параметры нейросети, полученные в процессе обучения, которые определяют ее поведение и знания.
Тонкая настройка (Fine-tuning)
Процесс дообучения уже готовой модели на узком наборе данных для выполнения конкретной задачи.
Агентность (Agency)
Способность системы ИИ самостоятельно ставить цели и предпринимать действия для их достижения в окружающей среде.
📊 Цифры
🗓 Хронология
  1. 1955 Джон фон Нейман пишет работу «Компьютер и мозг», предсказывая риск вымирания людей от машин.
  2. Март 2023 Future of Life Institute публикует открытое письмо с призывом к 6-месячному мораторию на обучение мощных LLM.
  3. Май 2023 Center for AI Safety выпускает заявление об экзистенциальном риске ИИ, подписанное Джеффом Хинтоном и Сэмом Альтманом.
⚖️ Другая сторона
Искусственный интеллект Иошуа Бенджио GPT-4 OpenAI AutoGPT экзистенциальный риск