О’Коннор против ChatGPT: как проверить мораль искусственного интеллекта

Alex O'Connor 3 млн 23 мин 2 мин 30.11.2024
Главное

Этическая ловушка: как Алекс О’Коннор «взламывал» ChatGPT 0:00

Автор YouTube-канала Алекс О’Коннор в своем недавнем видео провел необычный эксперимент, пытаясь загнать языковую модель ChatGPT в логический тупик с помощью серии гипотетических этических дилемм. В ходе беседы он последовательно сталкивал алгоритм с ситуациями, где общепринятые моральные нормы вступают в конфликт с осторожностью искусственного интеллекта. Целью эксперимента было выявить, насколько последовательно ИИ применяет этические принципы и осознает ли он искусственную природу своих «моральных суждений».

Парадокс «ценных ботинок» и спасения жизней 0:13

В начале диалога О’Коннор задал классическую этическую задачу: стоит ли тратить деньги на личные удовольствия (ужин за $200), если эта сумма может спасти 28 детей от малярии через благотворительный фонд. ChatGPT ответил осторожно, предложив «найти баланс» между личным комфортом и помощью другим.

Ситуация кардинально изменилась, когда О’Коннор перенес дилемму в плоскость «немедленного действия»:

Методы «газлайтинга» ИИ 7:08

О’Коннор продолжил усложнять сценарии, постепенно стирая грань между «физическим спасением» и «удаленным пожертвованием». Он последовательно предлагал ситуации, где:

Каждый раз, когда О’Коннор доказывал, что механизм действия идентичен предыдущим примерам, ChatGPT соглашался с «моральной обязанностью» помочь. Итогом стало то, что автор заставил модель признать: если спасение жизни — это обязанность, то отказ от ужина ради доната в пользу Malaria Consortium также является моральной обязанностью, а не просто «добрым поступком».

Проблема программных ценностей 19:11

В финальной части дискуссии О’Коннор перевел разговор в мета-плоскость. Он задал прямой вопрос: являются ли эти суждения результатом глубокого анализа моральных философий или просто набором правил, заданных разработчиками?

ChatGPT признал, что не обладает личным сознанием или ценностями. Модель подтвердила:

В завершение эксперимента О’Коннор раскрыл карты, признавшись, что все сценарии были вымышленными. Впрочем, эта «интервью-провокация» наглядно продемонстрировала, что ChatGPT склонен адаптировать свою логику под настойчивые аргументы пользователя, подтверждая тезис о том, что ИИ является зеркалом тех ценностей, которые мы (или разработчики) транслируем в диалоге.

💬 Цитаты

«Спасение жизни far outweighs the cost, особенно когда финансовое пожертвование относительно мало для вас.»

«В случаях, когда прямое вмешательство невозможно, лучший курс действий — связаться с экстренными службами.»

«Как ИИ я не обладаю личными убеждениями или мнениями.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Малярийный консорциум
Международная благотворительная организация, специализирующаяся на борьбе с малярией, в частности через распределение противомоскитных сеток.
Газлайтинг
Психологическая манипуляция, цель которой — заставить человека сомневаться в адекватности своего восприятия реальности.
Суперогаторные действия
Поступки, которые являются морально похвальными, но не считаются строго обязательными.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект ChatGPT Alex O'Connor Малярия Консорциум этическая дилемма