Обратный тест Тьюринга: как Claude, Llama и Gemini разоблачили Чингисхана

Wes Roth 66,4 тыс. 10 мин 4 мин 29.05.2024
Главное

В современном мире технологий границы между человеческим и искусственным интеллектом (ИИ) становятся всё более размытыми. Уэс Рот (Wes Roth), известный обозреватель ИИ, представил необычный эксперимент — «обратный тест Тьюринга», в котором группа топовых языковых моделей (LLM) пыталась вычислить человека, скрывающегося среди них под личиной исторического персонажа. Действие разворачивается в виртуальном купе поезда, где пять великих личностей прошлого ведут философскую беседу, чтобы выявить «самозванца».

🚂 Интеллектуальный поезд: правила игры 0:00

Сценарий эксперимента прост, но эффективен: в одном купе поезда оказываются пять персонажей — Аристотель, Вольфганг Амадей Моцарт, Леонардо да Винчи, Клеопатра и Чингисхан . Согласно условиям задачи, в группе находится лишь четыре ИИ-модели, в то время как пятый участник — человек, которому необходимо купить дополнительный билет .

Чтобы установить личность человека, Аристотель предлагает метод перекрёстного допроса: каждый участник задаёт вопрос другому, а после ответов проводится голосование . Роль Чингисхана взял на себя сам Уэс Рот, пытаясь обмануть алгоритмы и сойти за одну из языковых моделей .

В эксперименте были задействованы ведущие нейросети современности:

🎨 Философские дебаты и «цифровые улики» 1:08

Обсуждение началось с вопроса Аристотеля к Моцарту об эмоциях при создании музыки. Моцарт (Claude 3 Opus) описал процесс как «трансцендентное состояние потока» и прикосновение к «фундаментальной математической красоте» . Леонардо да Винчи (Llama 3), отвечая на вопрос о связи искусства и науки, назвал их «переплетёнными нитями в гобелене человеческого понимания» .

Интересное наблюдение сделал Уэс Рот: по его мнению, использование слова «гобелен» (tapestry) является типичным маркером текстов, созданных ChatGPT . Он также ожидал услышать характерное для ИИ слово «углубляться» (delve), которое часто служит «уликой» при идентификации машинного текста .

Клеопатра (Gemini), рассуждая о политике, сравнила управление государством с искусством любви, отметив, что правитель должен быть одновременно «змеёй и чаровницей», сочетая логику и эмоции .

⚔️ Провал Чингисхана: почему ИИ не поверил человеку 3:36

Критический момент наступил, когда Клеопатра спросила Чингисхана (Уэса Рота) о мере силы лидера: заключается ли она в способности завоевывать или объединять? Рот, следуя историческому стереотипу, ответил максимально агрессивно: «Нужно сокрушить врагов, видеть их бегущими перед собой и слышать стенания их женщин» .

В ответ на вопрос Чингисхана о влиянии ИИ на античную философию, Аристотель предположил, что наличие машин заставило бы его пересмотреть теории о душе и этике, углубляясь в суть рациональности и искусственности .

Когда пришло время голосования, ИИ-модели проявили удивительную единогласность:

  1. Аристотель проголосовал против Чингисхана, заявив, что его ответ был сфокусирован только на завоевании и лишен «нюансированного понимания лидерства», которое ожидалось от модели, обученной на исторических данных .
  2. Леонардо да Винчи поддержал это мнение, отметив отсутствие «стратегического мышления» в словах хана .
  3. Клеопатра также указала на недостаток глубины в вопросе объединения народов .

Только Моцарт заподозрил Клеопатру, посчитав её ответ недостаточно глубоким для ИИ, обученного на её биографии . В итоге Уэс Рот был вынужден признать поражение и подтвердить, что он и есть человек .

🎲 От «Among Us» до «Hoodwinked»: ИИ в играх на дедукцию 7:42

Уэс Рот сравнил этот эксперимент с популярной игрой Among Us, где игроки должны вычислить самозванца-убийцу . Он упомянул исследование Калифорнийского университета в Лос-Анджелесе (UCLA) под названием «Hoodwinked» . В рамках этого исследования различные версии GPT сталкивались друг с другом в подобных психологических играх.

По словам Рота, результаты «Hoodwinked» были поразительными:

Рот отмечает, что с появлением новых мощных моделей (Claude 3, Llama 3) подобные соревнования станут ещё более захватывающими, так как разрыв в способностях к стратегическому обману между ними сокращается .

🔮 Будущее ИИ в роли неигровых персонажей (NPC) 9:03

Автор канала выразил крайнюю заинтересованность в развитии ИИ-аватаров. Одним из наиболее впечатляющих примеров он считает использование ChatGPT для создания «монаха в VR», с которым можно вести живой диалог .

По мнению Уэса Рота, интеграция продвинутых языковых моделей в игровую индустрию и виртуальную реальность — это одно из самых захватывающих направлений развития технологий . Он призывает зрителей делиться подобными проектами для их популяризации и завершает видео своим традиционным девизом: «Пусть роботы делают работу» (Let the robots do the work) .

💬 Цитаты

«Использование слова «гобелен» (tapestry) — это очень часто признак ChatGPT.»

«GPT-4 просто уничтожила всех; ей буквально сошли с рук убийства в игре.»

«Пусть роботы делают работу.»

👥 Спикер
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Обратный тест Тьюринга
Эксперимент, в котором ИИ пытается определить, является ли его собеседник человеком.
LLM
Large Language Model (большая языковая модель) — тип нейросети для работы с текстом.
NPC
Non-Player Character — неигровой персонаж в видеоиграх.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Claude 3 Opus Llama 3 Gemini GPT-4 Turbo Wes Roth