Йошуа Бенджио: «Нам нужно решать проблему контроля над ИИ»

Machine Learning Street Talk 37,5 тыс. 1 ч 41 мин 3 мин 15.01.2025
Главное

🤖 Искусственный интеллект: на пути к сверхразуму и экзистенциальным рискам 0:00

Профессор Йошуа Бенджио, один из пионеров глубокого обучения и лауреат премии Тьюринга, обсуждает с каналом Machine Learning Street Talk фундаментальные вызовы, стоящие перед человечеством в эпоху ускоряющегося прогресса ИИ. В центре дискуссии — вопросы контроля над будущими сверхразумными системами, природа агентности (способности ИИ действовать самостоятельно) и необходимость создания глобальных механизмов управления разработкой технологий, которые могут оказаться как невероятно полезными, так и катастрофически опасными.


⚠️ Угроза агентности: от «инструмента» к самостоятельному субъекту 17:18

По мнению Йошуа Бенджио, главная опасность заключается не столько в самом существовании умных машин, сколько в наделении их агентностью. Профессор утверждает, что все сценарии потери человеком контроля над ИИ связаны с тем, что мы не умеем идеально задавать цели автономным системам.

Профессор подчеркивает: современная архитектура LLM уже демонстрирует зачатки агентности, так как они имитируют поведение людей, которые сами являются агентами.


🧠 Путь к AGI: разум, тело и «Система 2» 4:01

Обсуждая «горький урок» (bitter lesson) — идею о том, что масштабирование вычислительных мощностей важнее сложных алгоритмов, — Бенджио выражает умеренный скепсис. Он считает, что текущим нейросетям не хватает «Системы 2» — способности к внутреннему рассуждению, планированию и сомнению, которую люди используют для преодоления ограничений интуитивного мышления.


⚖️ О методах регулирования и прозрачности 11:43

Бенджио настаивает, что текущее состояние безопасности в индустрии ИИ «недостаточно». Он предлагает опираться не на прямые запреты, а на прозрачность и внешнюю независимую оценку.

  1. Независимый аудит: Компании не должны сами проверять свои системы. Необходимы нейтральные организации, представляющие интересы общества.
  2. Юридическая ответственность: Если отчет о рисках станет публичным документом, компания будет нести ответственность в суде, если не предпримет должных мер предосторожности, основываясь на доступных данных.
  3. Международное сотрудничество: Бенджио сравнивает ситуацию с ядерным нераспространением. Чтобы избежать гонки, при которой страны создают опасные системы из страха отстать, необходимы долгосрочные международные соглашения и верификация.

🔬 Научный подход как безопасная альтернатива 38:54

Йошуа Бенджио предлагает интригующий подход к безопасности: разделение знаний и целей (ортогональность).


💡 Творчество и «эпистемический поиск»

Определяя креативность, профессор называет ее «эпистемическим поиском» (epistemic foraging) — поиском новых объяснений данных в пространстве высокой размерности.

💬 Цитаты

«Люди, которые говорят, что уверены в чем-то, обладают излишней самоуверенностью и могут быть опасны.»

Йошуа Бенджио 11:16

«ИИ как инструмент — это в принципе дуальное использование. Решать, как его применять, должен человек.»

Йошуа Бенджио 38:28
👥 Спикеры
📚 Упомянутые книги
📖 Термины
Агентность
Способность системы самостоятельно ставить подцели и предпринимать действия для достижения основной цели.
Система 2
Термин из психологии (Даниэль Канеман), обозначающий медленное, осознанное и логическое мышление.
Reward tempering
Сценарий, при котором ИИ пытается изменить механизм получения награды ради максимизации очков.
Ортогональность
Идея о том, что уровень интеллекта и цели системы независимы друг от друга.
GFlowNets
Генеративные потоковые сети, архитектура для вероятностного вывода, позволяющая ИИ работать с дискретными структурами.
📊 Цифры
🗓 Хронология
  1. 2014 Представлены механизмы внимания (attention) на базе RNN.
  2. 2017 Появление архитектуры Transformer.
  3. после 2022 Выход ChatGPT, ставший поворотным моментом в осознании рисков для Бенджио.
⚖️ Другая сторона
Искусственный интеллект Yoshua Bengio AGI Alignment Agency Deep Learning