# Могут ли машины мыслить? Глубокий разбор теста Тьюринга и будущего ИИ с Лексом Фридманом

Источник: https://www.youtube.com/watch?v=MGW_Qcqr9eQ
Канал: Lex Fridman
Опубликовано: 27.04.2020

---

В 1950 году математик и криптограф Алан Тьюринг опубликовал статью, которая заложила интеллектуальный фундамент для всей будущей области искусственного интеллекта. Лекс Фридман возвращается к этому программному тексту, чтобы проанализировать, насколько современный инженерный прагматизм соотносится с философскими мечтами прошлого и какие современные тесты могут прийти на смену классической «Имитационной игре».

## 🧠 Наследие Алана Тьюринга: Рождение мечты об ИИ
[[JUMP:0:00]]

Статья «Вычислительные машины и разум» (Computing Machinery and Intelligence), опубликованная почти 70 лет назад, по мнению Лекса Фридмана, является самой влиятельной работой в истории искусственного интеллекта [1:04]. Несмотря на то что по своей сути это философское эссе, оно предложило конкретный инженерный бенчмарк для определения разумности систем [0:25].

Фридман полагает, что именно эта работа посеяла «семена мечты» для целых поколений исследователей, вдохновив их на создание систем, обладающих человеческим уровнем способностей [2:10]. Тьюринг начал свой текст со знаменитого предложения: «Я предлагаю рассмотреть вопрос: „Могут ли машины мыслить?“» [2:24]. Однако, осознавая расплывчатость определений «машина» и «мыслить», он заменил этот вопрос на описание эксперимента, который мы сегодня называем тестом Тьюринга [3:04].

## 🎭 Имитационная игра: Механика и предсказания
[[JUMP:03:16]]

Классический тест Тьюринга строится по схеме «Имитационной игры»:

*   Человек-экзаменатор находится в одной комнате, а два собеседника (машина и другой человек) — за стеной.
*   Общение происходит исключительно с помощью текстовых сообщений.
*   Задача экзаменатора — на основе переписки определить, кто из собеседников является человеком, а кто — машиной [3:45].

Алан Тьюринг сделал смелое предсказание: к 2000 году компьютеры с объёмом памяти в 100 мегабайт смогут обманывать 30% судей в ходе пятиминутного теста [4:37]. Кроме того, он считал, что в будущем фраза «мыслящая машина» перестанет казаться людям противоречивой [5:03].

По словам Фридмана, сегодня мы всё ещё находимся в процессе осмысления этого вызова. Почему мы до сих пор отказываем в разуме системе IBM Deep Blue или алгоритму AlphaGo, которые побеждают лучших мастеров игры в шахматы и го? [7:05]. Ведущий утверждает, что существует глубокий психологический барьер: когда мы понимаем, как работает алгоритм (например, через брутфорс или обучение с подкреплением), магия интеллекта исчезает [7:18].

## 🏆 Реальные попытки: От Премии Лёбнера до Google Meena
[[JUMP:07:43]]

В реальном мире тест Тьюринга воплотился в Премии Лёбнера (Loebner Prize), которая существует с 1991 года [7:57]. Структура вознаграждений такова:

*   $25 000 за прохождение теста в текстовом формате.
*   $100 000 за систему, способную учитывать визуальные и аудиальные модальности [8:10].

Фридман отмечает, что долгое время в конкурсе доминировали чат-боты Mitsuku и Rose, созданные Стивом Уорвиком и Брюсом Уилкоксом. Однако эти системы основаны преимущественно на правилах и скриптах, а не на сквозном машинном обучении [8:37]. Анализ диалогов с Mitsuku показывает, что бот часто терпит неудачу на мелких деталях человеческого опыта — например, не может логично объяснить свои футбольные симпатии или теряет нить разговора на уточняющих вопросах [10:35].

В 2014 году большой резонанс вызвало заявление о прохождении теста программой Eugene Goostman, которая выдавала себя за 13-летнего украинского мальчика [11:41]. Бот смог обмануть 33% судей, используя тактику уклонения от сложных вопросов, прикрываясь языковым барьером и возрастом [12:06]. Фридман, однако, считает это «трюкачеством», которое обходит суть теста — способность вести глубокий и осмысленный диалог [12:45].

Более современным подходом является модель Meena от Google — нейросеть с 2,6 миллиардами параметров [13:53]. Google предложила новый показатель качества — SSA (Sensibleness and Specificity Average):

1.  **Разумность (Sensibleness):** Насколько ответ логичен в текущем контексте. Люди достигают здесь 97% [14:33].
2.  **Специфичность (Specificity):** Насколько ответ уникален для данного момента, а не является дежурной фразой вроде «Я не знаю» [15:01].

По данным Google, Meena достигла показателя SSA в 79%, в то время как человек — 86%, а бот Mitsuku — лишь 56% [15:43]. Тем не менее, Фридман призывает относиться к этим цифрам с осторожностью, так как код модели закрыт, а методология тестирования может быть подобрана под архитектуру системы [16:09].

## 🛡 Девять возражений Тьюринга и «Китайская комната»
[[JUMP:17:16]]

В своей оригинальной статье Тьюринг предвосхитил и разобрал девять основных возражений против возможности машинного мышления. Фридман выделяет самые интересные из них:

*   **Теологическое возражение:** Только человек обладает божественной душой. Тьюринг ответил, что Бог всемогущ и при желании может наделить душой и искусственное существо [17:46].
*   **Возражение «Голова в песке»:** Страх перед тем, что ИИ может стать опасным (экзистенциальная угроза), мешает нам признать его возможность. По мнению Тьюринга, наши чувства не влияют на факт свершения события [18:53].
*   **Математическое возражение (теорема Гёделя):** Утверждение, что вычислительные системы имеют пределы логики. Тьюринг возразил, что люди тоже совершают ошибки и не являются идеально рациональными [19:36].
*   **Возражение Ады Лавлейс:** Машина делает только то, что ей приказали, и не может создать ничего оригинального. Фридман согласен с Тьюрингом в том, что достаточно сложные системы постоянно удивляют своих создателей, так как их поведение невозможно предсказать интуитивно [22:43].

Особое внимание Фридман уделяет аргументу Джона Сёрла о «Китайской комнате» (1980) [26:48]. Сёрл утверждал, что если человек в комнате просто следует инструкциям по манипуляции символами (синтаксис), он не понимает смысла языка (семантика) [28:09]. 

Сам Лекс Фридман придерживается инженерной позиции: для нашего ограниченного понимания «видимость сознания» и есть само сознание [31:13]. Он полагает, что, работая над имитацией мышления и любви, мы со временем придем к пониманию фундаментальной природы этих явлений [30:58].

## 🔄 Альтернативные тесты на интеллект
[[JUMP:31:41]]

Фридман рассматривает несколько современных альтернатив классическому тесту Тьюринга:

*   **Total Turing Test (1989):** Расширяет тест на область компьютерного зрения и робототехники (манипуляция объектами) [32:09].
*   **Тест Лавлейс 2.0 (2014):** Фокусируется на творчестве и способности машины создать произведение искусства, которое удивит создателя [33:15].
*   **Winograd Schema Challenge:** Тест на здравый смысл, где машине нужно разрешить неоднозначность местоимений в предложениях. Например: «Трофей не влез в чемодан, потому что *он* слишком большой». Машина должна понять, что «он» — это трофей [37:11].
*   **Hutter Prize:** Премия за сжатие данных (1 ГБ Википедии). В основе лежит идея, что способность к максимальному сжатию знаний эквивалентна интеллекту [41:25].
*   **Alexa Prize:** Конкурс Amazon, где целью является удержание человека в разговоре более 20 минут. Фридман считает это мощным сигналом: мы не остаемся в скучном или бессмысленном разговоре добровольно [40:05].

## 🧩 ARC: Измерение абстрактного мышления
[[JUMP:43:26]]

Одним из самых перспективных подходов Фридман называет ARC (Abstraction and Reasoning Corpus), предложенный Франсуа Шолле [44:05]. ARC — это набор визуальных задач, похожих на IQ-тесты, которые проверяют способность машины к обобщению на основе минимального количества примеров [44:19].

Задачи ARC опираются на фундаментальные человеческие «априорные знания» (priors), такие как:

*   **Постоянство объекта:** Объект продолжает существовать, даже если он частично перекрыт шумом [45:40].
*   **Пространственная связность:** Клетки одного цвета, касающиеся друг друга, воспринимаются как единый объект [46:10].
*   **Симметрия:** Способность распознать и достроить симметричный паттерн [48:13].

Фридман подчеркивает, что такие тесты позволяют отделить реальное умение рассуждать от простого заучивания огромных массивов данных, чем грешат современные языковые модели [45:12].

## 🏁 Резюме: Почему тест Тьюринга всё еще важен
[[JUMP:54:28]]

Лекс Фридман не согласен с теми исследователями (включая Стюарта Рассела и Франсуа Шолле), которые считают тест Тьюринга «отвлечением» от серьезной науки [54:55]. По мнению Фридмана, этот тест «держит нас в честности», заставляя анализировать реальный прогресс в создании систем, способных на глубокую связь с человеком [55:10].

Ключевой вывод Фридмана заключается в необходимости «принять человеческую сложность и хаотичность» (messiness) [56:16]. Интеллект — это не только чистая логика, но и эмоции, скука, иррациональность и социальное взаимодействие [50:41]. Исследователь убежден, что настоящий ИИ человеческого уровня родится именно в области взаимодействия «человек-машина», будь то в форме чат-ботов или полуавтономных автомобилей [56:42].