Йошуа Бенджио: «Мы играем с огнем, создавая сверхразумный ИИ»

World Science Festival 146 тыс. 1 ч 10 мин 3 мин 19.04.2024
Главное

ИИ как «ученик чародея»: почему отец-основатель нейросетей боится будущего 0:01

Йошуа Бенджио, лауреат премии Тьюринга 2018 года и один из ключевых архитекторов современного искусственного интеллекта, сегодня открыто говорит о том, что человечество находится в опасной точке. По мнению ученого, развитие ИИ напоминает игру с огнем, где исследовательская среда неосознанно берет на себя роль «ученика чародея», не до конца понимая последствия создаваемой ими мощи. Вместе с ведущим Брайаном Грином на площадке World Science Festival они обсудили, почему современный ИИ — это не «чужая» разумная форма, а прямое отражение наших собственных методов обучения, и к каким катастрофическим сценариям это может привести.

🧠 Путь к машинному интеллекту: от нейронов к трансформерам 1:44

Бенджио отмечает, что его путь в науку был мотивирован стремлением понять природу человеческого интеллекта. Фундаментальные идеи, заложенные в современные модели, прошли длинный путь эволюции:

По словам гостя, стремительный прорыв последних лет объясняется не столько новыми алгоритмами, сколько масштабированием — увеличением размеров моделей и объема обучающих данных. Однако он признает, что способность ИИ мастерски манипулировать языком стала сюрпризом даже для разработчиков.

⚠️ Угрозы: «медведь в клетке» и потеря контроля 26:26

Самая серьезная опасность, по мнению Бенджио, заключается в возможной «потере контроля» (loss of control) над сверхразумными системами. Он приводит пугающую аналогию: сегодня мы обучаем ИИ методами положительного подкрепления, подобно дрессировке животных — даем «рыбку» за правильное поведение.

Гость подчеркивает: идея о том, что мы сможем «просто выдернуть шнур из розетки», является наивной.

⚖️ Этический тупик и необходимость регулирования 38:38

Ученый призывает к жестким международным мерам контроля и правовым «ограждениям» (guardrails). Основная претензия Бенджио к индустрии — отсутствие достаточных усилий в области безопасности ИИ (AI safety). Он настаивает на том, что если компания не может доказать безопасность системы при приближении к уровню AGI (искусственного общего интеллекта), она не должна приступать к её созданию.

Контраргумент, часто звучащий от других экспертов (включая Яна Лекуна), заключается в том, что «добрые» игроки должны развивать технологии быстрее «злых», чтобы иметь средства защиты. Бенджио возражает: нет никаких гарантий, что защитная система будет иметь преимущество над атакующей, особенно если та действует деструктивно.

🌐 Сознание или побочный эффект вычислений? 55:43

В финале беседы была затронута природа субъективного опыта. Бенджио предложил механистическую теорию сознания, основанную на динамике нейронных сетей:

  1. Состояние мозга стремится к «аттракторам» — особым точкам стабильности, которые соответствуют конкретной мысли.
  2. Поскольку аттракторов конечное число, мозг переводит сложную непрерывную активность в дискретные символы.
  3. Субъективное чувство «невыразимости» опыта возникает из-за того, что мы не можем передать другому человеку полную высокоразмерную динамику нейронных состояний, а обмениваемся лишь упрощенными символами.

По мнению гостя, если мы создадим ИИ с подобными механизмами, возникнет опасный вопрос: должны ли такие системы обладать моральным статусом и правами? Он считает этот путь «опасным склоном» и призывает проявлять крайнюю осторожность, прежде чем наделять ИИ правами, которые могут поставить под угрозу выживание человечества.

💬 Цитаты

«Мы играем роль ученика чародея. Мы играем с огнем, не понимая, какими могут быть последствия.»

Йошуа Бенджио 26:39

«Как только сущность, работающая на программном обеспечении, решит сделать что-то плохое, она не объявит об этом.»

Йошуа Бенджио 28:11

«Если бы мы были коллективно рациональны, мы бы решили проблему климата за секунду.»

Йошуа Бенджио 43:57
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AGI
Искусственный общий интеллект — система, обладающая когнитивными способностями уровня человека.
Трансформеры
Тип архитектуры нейронных сетей, лежащий в основе современных больших языковых моделей.
Аттрактор
Математическое состояние, к которому стремится динамическая система в ходе своего развития.
AlphaGo
Программа для игры в го, использующая глубокое обучение для поиска новых стратегий.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Yoshua Bengio Artificial General Intelligence AI safety neural networks