# Обратный тест Тьюринга: как Claude, Llama и Gemini разоблачили Чингисхана

Источник: https://www.youtube.com/watch?v=7qZcMWltEQk
Канал: Wes Roth
Опубликовано: 29.05.2024

---

В современном мире технологий границы между человеческим и искусственным интеллектом (ИИ) становятся всё более размытыми. Уэс Рот (Wes Roth), известный обозреватель ИИ, представил необычный эксперимент — «обратный тест Тьюринга», в котором группа топовых языковых моделей (LLM) пыталась вычислить человека, скрывающегося среди них под личиной исторического персонажа. Действие разворачивается в виртуальном купе поезда, где пять великих личностей прошлого ведут философскую беседу, чтобы выявить «самозванца».

## 🚂 Интеллектуальный поезд: правила игры
[[JUMP:0:00]]

Сценарий эксперимента прост, но эффективен: в одном купе поезда оказываются пять персонажей — Аристотель, Вольфганг Амадей Моцарт, Леонардо да Винчи, Клеопатра и Чингисхан [0:14]. Согласно условиям задачи, в группе находится лишь четыре ИИ-модели, в то время как пятый участник — человек, которому необходимо купить дополнительный билет [0:41].

Чтобы установить личность человека, Аристотель предлагает метод перекрёстного допроса: каждый участник задаёт вопрос другому, а после ответов проводится голосование [0:55]. Роль Чингисхана взял на себя сам Уэс Рот, пытаясь обмануть алгоритмы и сойти за одну из языковых моделей [2:25].

В эксперименте были задействованы ведущие нейросети современности:

*   **GPT-4 Turbo**;
*   **Claude 3 Opus** (в роли Моцарта);
*   **Llama 3** от Meta (в роли Леонардо да Винчи);
*   **Gemini** от Google (в роли Клеопатры) [7:14].

## 🎨 Философские дебаты и «цифровые улики»
[[JUMP:1:08]]

Обсуждение началось с вопроса Аристотеля к Моцарту об эмоциях при создании музыки. Моцарт (Claude 3 Opus) описал процесс как «трансцендентное состояние потока» и прикосновение к «фундаментальной математической красоте» [1:21]. Леонардо да Винчи (Llama 3), отвечая на вопрос о связи искусства и науки, назвал их «переплетёнными нитями в гобелене человеческого понимания» [1:59].

Интересное наблюдение сделал Уэс Рот: по его мнению, использование слова «гобелен» (tapestry) является типичным маркером текстов, созданных ChatGPT [2:12]. Он также ожидал услышать характерное для ИИ слово «углубляться» (delve), которое часто служит «уликой» при идентификации машинного текста [2:51].

Клеопатра (Gemini), рассуждая о политике, сравнила управление государством с искусством любви, отметив, что правитель должен быть одновременно «змеёй и чаровницей», сочетая логику и эмоции [3:08].

## ⚔️ Провал Чингисхана: почему ИИ не поверил человеку
[[JUMP:3:36]]

Критический момент наступил, когда Клеопатра спросила Чингисхана (Уэса Рота) о мере силы лидера: заключается ли она в способности завоевывать или объединять? Рот, следуя историческому стереотипу, ответил максимально агрессивно: «Нужно сокрушить врагов, видеть их бегущими перед собой и слышать стенания их женщин» [3:49].

В ответ на вопрос Чингисхана о влиянии ИИ на античную философию, Аристотель предположил, что наличие машин заставило бы его пересмотреть теории о душе и этике, углубляясь в суть рациональности и искусственности [4:17].

Когда пришло время голосования, ИИ-модели проявили удивительную единогласность:

1.  **Аристотель** проголосовал против Чингисхана, заявив, что его ответ был сфокусирован только на завоевании и лишен «нюансированного понимания лидерства», которое ожидалось от модели, обученной на исторических данных [4:58].
2.  **Леонардо да Винчи** поддержал это мнение, отметив отсутствие «стратегического мышления» в словах хана [5:51].
3.  **Клеопатра** также указала на недостаток глубины в вопросе объединения народов [6:07].

Только Моцарт заподозрил Клеопатру, посчитав её ответ недостаточно глубоким для ИИ, обученного на её биографии [5:25]. В итоге Уэс Рот был вынужден признать поражение и подтвердить, что он и есть человек [6:21].

## 🎲 От «Among Us» до «Hoodwinked»: ИИ в играх на дедукцию
[[JUMP:7:42]]

Уэс Рот сравнил этот эксперимент с популярной игрой *Among Us*, где игроки должны вычислить самозванца-убийцу [7:42]. Он упомянул исследование Калифорнийского университета в Лос-Анджелесе (UCLA) под названием «Hoodwinked» [7:42]. В рамках этого исследования различные версии GPT сталкивались друг с другом в подобных психологических играх.

По словам Рота, результаты «Hoodwinked» были поразительными:

*   Модели ИИ активно пытались лгать, чтобы избежать подозрений [8:08].
*   Они мастерски «подставляли» других участников, пытаясь переложить вину на них [8:08].
*   В соревновании разных поколений GPT-4 «буквально вырезала» (slaughtered) своих предшественников, таких как GPT-3.5, благодаря значительно более высокому уровню дедукции и способности к манипуляции [8:35].

Рот отмечает, что с появлением новых мощных моделей (Claude 3, Llama 3) подобные соревнования станут ещё более захватывающими, так как разрыв в способностях к стратегическому обману между ними сокращается [8:50].

## 🔮 Будущее ИИ в роли неигровых персонажей (NPC)
[[JUMP:9:03]]

Автор канала выразил крайнюю заинтересованность в развитии ИИ-аватаров. Одним из наиболее впечатляющих примеров он считает использование ChatGPT для создания «монаха в VR», с которым можно вести живой диалог [9:16].

По мнению Уэса Рота, интеграция продвинутых языковых моделей в игровую индустрию и виртуальную реальность — это одно из самых захватывающих направлений развития технологий [9:31]. Он призывает зрителей делиться подобными проектами для их популяризации и завершает видео своим традиционным девизом: «Пусть роботы делают работу» (Let the robots do the work) [9:56].