Йошуа Бенджио о рисках ИИ: „Нам нужна не только технология, но и регулирование“

The TWIML AI Podcast with Sam Charrington 4,3 тыс. 59 мин 3 мин 06.11.2023
Главное

AI, угрозы и будущее: Йошуа Бенджио о рисках, регулировании и пути к сверхразуму 0:00

Йошуа Бенджио, один из пионеров глубокого обучения и профессор Монреальского университета, в подкасте The TWIML AI Podcast обсудил текущее состояние искусственного интеллекта и неотложные проблемы его безопасности. С момента его последнего интервью в 2020 году фокус работы ученого сместился с вопросов сознания и биомедицинских применений ИИ на анализ катастрофических рисков, связанных с развитием больших языковых моделей (LLM) и потенциальным достижением общего искусственного интеллекта (AGI).

🧪 Наука, данные и ограничения 1:08

Работа Бенджио в последние годы сосредоточена на интеграции машинного обучения в научный процесс — от поиска лекарств до моделирования биологических систем. Ученый выделяет три ключевых элемента, которые необходимо преодолеть для достижения человеческого уровня компетенций ИИ:

Бенджио отмечает, что хотя его группа достигла успехов в развитии генеративных потоковых сетей (GFlowNets), способных эффективно работать с вероятностными моделями теорий, масштабируемость этих методов остается серьезным вызовом.

🛡️ Ландшафт угроз: от дезинформации до потери контроля 7:48

Йошуа Бенджио классифицирует риски ИИ по времени их актуальности и масштабу последствий:

  1. Дезинформация и влияние: Системы уже способны вести убедительный диалог, что позволяет масштабировать кампании по манипуляции общественным мнением, размывая грань между человеком и машиной.
  2. Кибератаки: По мнению Бенджио, использование ИИ для создания вредоносного кода может сделать атаки автоматизированными и гораздо более разрушительными, чем нынешние действия групп хакеров.
  3. Оружие массового поражения: ИИ может помочь злоумышленникам без профильного образования проектировать новые токсичные соединения или патогены.
  4. Потеря контроля (AGI): Долгосрочный риск связан с появлением систем с целями, которые могут конфликтовать с человеческими, включая инстинкт самосохранения.

Гость подчеркивает: даже если не верить в «сознательный» сверхразум, ИИ может стать инструментом для диктаторов будущего, позволяя им концентрировать власть и осуществлять тотальный мониторинг общества.

⚖️ Регулирование и управление 24:49

Бенджио убежден, что чисто технических решений недостаточно, так как их могут использовать злоумышленники. Он выступает за активное государственное регулирование:

Относительно моральных прав ИИ, Бенджио призывает к осторожности: он считает ошибкой наделять машины человеческими правами, так как это может быть использовано для оправдания их самосохранения или получения контроля.

🚀 Путь к безопасности 57:08

Для повышения безопасности ИИ Бенджио предлагает делать системы «байесовскими»: они должны осознавать собственную неопределенность и при нехватке данных обращаться за помощью к человеку. В качестве важных ориентиров для специалистов в области ИИ он рекомендует ознакомиться с «Всеобщей декларацией прав человека» и собственными рекомендациями, представленными им в Сенате США. Ученый настаивает на необходимости «контрмерных исследований» — своего рода системы национальной безопасности, способной защитить общество от потенциально опасных алгоритмов, созданных другими игроками.

💬 Цитаты

«Мы играем с этим — это круто, это захватывающе, и многие люди сосредоточены на всех хороших вещах или деньгах, которые они могут заработать, не задумываясь достаточно о потенциальных рисках.»

Йошуа Бенджио 48:42

«Нам нужны системы, которые лучше способны знать свои пределы, чтобы, если они не уверены, они перекладывали решение на человека.»

Йошуа Бенджио 46:42
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Общий искусственный интеллект — система, способная выполнять любую интеллектуальную задачу на уровне человека или выше.
Система 2
Тип рассуждения, подразумевающий осознанное обдумывание и анализ альтернатив.
GFlowNets
Генеративные потоковые сети, класс методов машинного обучения для поиска эффективных решений в сложных пространствах состояний.
Reward hacking
Ситуация, когда ИИ находит способ максимизировать награду, не выполняя поставленную задачу правильно, а манипулируя самим процессом оценки.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Yoshua Bengio AGI AI safety The TWIML AI Podcast LLM