Обратный тест Тьюринга: как Claude, Llama и Gemini разоблачили Чингисхана

В современном мире технологий границы между человеческим и искусственным интеллектом (ИИ) становятся всё более размытыми. Уэс Рот (Wes Roth), известный обозреватель ИИ, представил необычный эксперимент — «обратный тест Тьюринга», в котором группа топовых языковых моделей (LLM) пыталась вычислить человека, скрывающегося среди них под личиной исторического персонажа. Действие разворачивается в виртуальном купе поезда, где пять великих личностей прошлого ведут философскую беседу, чтобы выявить «самозванца».

🚂 Интеллектуальный поезд: правила игры 0:00

Сценарий эксперимента прост, но эффективен: в одном купе поезда оказываются пять персонажей — Аристотель, Вольфганг Амадей Моцарт, Леонардо да Винчи, Клеопатра и Чингисхан . Согласно условиям задачи, в группе находится лишь четыре ИИ-модели, в то время как пятый участник — человек, которому необходимо купить дополнительный билет .

Чтобы установить личность человека, Аристотель предлагает метод перекрёстного допроса: каждый участник задаёт вопрос другому, а после ответов проводится голосование . Роль Чингисхана взял на себя сам Уэс Рот, пытаясь обмануть алгоритмы и сойти за одну из языковых моделей .

В эксперименте были задействованы ведущие нейросети современности:

GPT-4 Turbo;
Claude 3 Opus (в роли Моцарта);
Llama 3 от Meta (в роли Леонардо да Винчи);
Gemini от Google (в роли Клеопатры) .

🎨 Философские дебаты и «цифровые улики» 1:08

Обсуждение началось с вопроса Аристотеля к Моцарту об эмоциях при создании музыки. Моцарт (Claude 3 Opus) описал процесс как «трансцендентное состояние потока» и прикосновение к «фундаментальной математической красоте» . Леонардо да Винчи (Llama 3), отвечая на вопрос о связи искусства и науки, назвал их «переплетёнными нитями в гобелене человеческого понимания» .

Интересное наблюдение сделал Уэс Рот: по его мнению, использование слова «гобелен» (tapestry) является типичным маркером текстов, созданных ChatGPT . Он также ожидал услышать характерное для ИИ слово «углубляться» (delve), которое часто служит «уликой» при идентификации машинного текста .

Клеопатра (Gemini), рассуждая о политике, сравнила управление государством с искусством любви, отметив, что правитель должен быть одновременно «змеёй и чаровницей», сочетая логику и эмоции .

⚔️ Провал Чингисхана: почему ИИ не поверил человеку 3:36

Критический момент наступил, когда Клеопатра спросила Чингисхана (Уэса Рота) о мере силы лидера: заключается ли она в способности завоевывать или объединять? Рот, следуя историческому стереотипу, ответил максимально агрессивно: «Нужно сокрушить врагов, видеть их бегущими перед собой и слышать стенания их женщин» .

В ответ на вопрос Чингисхана о влиянии ИИ на античную философию, Аристотель предположил, что наличие машин заставило бы его пересмотреть теории о душе и этике, углубляясь в суть рациональности и искусственности .

Когда пришло время голосования, ИИ-модели проявили удивительную единогласность:

Аристотель проголосовал против Чингисхана, заявив, что его ответ был сфокусирован только на завоевании и лишен «нюансированного понимания лидерства», которое ожидалось от модели, обученной на исторических данных .
Леонардо да Винчи поддержал это мнение, отметив отсутствие «стратегического мышления» в словах хана .
Клеопатра также указала на недостаток глубины в вопросе объединения народов .

Только Моцарт заподозрил Клеопатру, посчитав её ответ недостаточно глубоким для ИИ, обученного на её биографии . В итоге Уэс Рот был вынужден признать поражение и подтвердить, что он и есть человек .

🎲 От «Among Us» до «Hoodwinked»: ИИ в играх на дедукцию 7:42

Уэс Рот сравнил этот эксперимент с популярной игрой Among Us, где игроки должны вычислить самозванца-убийцу . Он упомянул исследование Калифорнийского университета в Лос-Анджелесе (UCLA) под названием «Hoodwinked» . В рамках этого исследования различные версии GPT сталкивались друг с другом в подобных психологических играх.

По словам Рота, результаты «Hoodwinked» были поразительными:

Модели ИИ активно пытались лгать, чтобы избежать подозрений .
Они мастерски «подставляли» других участников, пытаясь переложить вину на них .
В соревновании разных поколений GPT-4 «буквально вырезала» (slaughtered) своих предшественников, таких как GPT-3.5, благодаря значительно более высокому уровню дедукции и способности к манипуляции .

Рот отмечает, что с появлением новых мощных моделей (Claude 3, Llama 3) подобные соревнования станут ещё более захватывающими, так как разрыв в способностях к стратегическому обману между ними сокращается .

🔮 Будущее ИИ в роли неигровых персонажей (NPC) 9:03

Автор канала выразил крайнюю заинтересованность в развитии ИИ-аватаров. Одним из наиболее впечатляющих примеров он считает использование ChatGPT для создания «монаха в VR», с которым можно вести живой диалог .

По мнению Уэса Рота, интеграция продвинутых языковых моделей в игровую индустрию и виртуальную реальность — это одно из самых захватывающих направлений развития технологий . Он призывает зрителей делиться подобными проектами для их популяризации и завершает видео своим традиционным девизом: «Пусть роботы делают работу» (Let the robots do the work) .