Могут ли машины мыслить? Глубокий разбор теста Тьюринга и будущего ИИ с Лексом Фридманом

В 1950 году математик и криптограф Алан Тьюринг опубликовал статью, которая заложила интеллектуальный фундамент для всей будущей области искусственного интеллекта. Лекс Фридман возвращается к этому программному тексту, чтобы проанализировать, насколько современный инженерный прагматизм соотносится с философскими мечтами прошлого и какие современные тесты могут прийти на смену классической «Имитационной игре».

🧠 Наследие Алана Тьюринга: Рождение мечты об ИИ 0:00

Статья «Вычислительные машины и разум» (Computing Machinery and Intelligence), опубликованная почти 70 лет назад, по мнению Лекса Фридмана, является самой влиятельной работой в истории искусственного интеллекта . Несмотря на то что по своей сути это философское эссе, оно предложило конкретный инженерный бенчмарк для определения разумности систем .

Фридман полагает, что именно эта работа посеяла «семена мечты» для целых поколений исследователей, вдохновив их на создание систем, обладающих человеческим уровнем способностей . Тьюринг начал свой текст со знаменитого предложения: «Я предлагаю рассмотреть вопрос: „Могут ли машины мыслить?“» . Однако, осознавая расплывчатость определений «машина» и «мыслить», он заменил этот вопрос на описание эксперимента, который мы сегодня называем тестом Тьюринга .

🎭 Имитационная игра: Механика и предсказания 3:16

Классический тест Тьюринга строится по схеме «Имитационной игры»:

Человек-экзаменатор находится в одной комнате, а два собеседника (машина и другой человек) — за стеной.
Общение происходит исключительно с помощью текстовых сообщений.
Задача экзаменатора — на основе переписки определить, кто из собеседников является человеком, а кто — машиной .

Алан Тьюринг сделал смелое предсказание: к 2000 году компьютеры с объёмом памяти в 100 мегабайт смогут обманывать 30% судей в ходе пятиминутного теста . Кроме того, он считал, что в будущем фраза «мыслящая машина» перестанет казаться людям противоречивой .

По словам Фридмана, сегодня мы всё ещё находимся в процессе осмысления этого вызова. Почему мы до сих пор отказываем в разуме системе IBM Deep Blue или алгоритму AlphaGo, которые побеждают лучших мастеров игры в шахматы и го? . Ведущий утверждает, что существует глубокий психологический барьер: когда мы понимаем, как работает алгоритм (например, через брутфорс или обучение с подкреплением), магия интеллекта исчезает .

🏆 Реальные попытки: От Премии Лёбнера до Google Meena 7:43

В реальном мире тест Тьюринга воплотился в Премии Лёбнера (Loebner Prize), которая существует с 1991 года . Структура вознаграждений такова:

$25 000 за прохождение теста в текстовом формате.
$100 000 за систему, способную учитывать визуальные и аудиальные модальности .

Фридман отмечает, что долгое время в конкурсе доминировали чат-боты Mitsuku и Rose, созданные Стивом Уорвиком и Брюсом Уилкоксом. Однако эти системы основаны преимущественно на правилах и скриптах, а не на сквозном машинном обучении . Анализ диалогов с Mitsuku показывает, что бот часто терпит неудачу на мелких деталях человеческого опыта — например, не может логично объяснить свои футбольные симпатии или теряет нить разговора на уточняющих вопросах .

В 2014 году большой резонанс вызвало заявление о прохождении теста программой Eugene Goostman, которая выдавала себя за 13-летнего украинского мальчика . Бот смог обмануть 33% судей, используя тактику уклонения от сложных вопросов, прикрываясь языковым барьером и возрастом . Фридман, однако, считает это «трюкачеством», которое обходит суть теста — способность вести глубокий и осмысленный диалог .

Более современным подходом является модель Meena от Google — нейросеть с 2,6 миллиардами параметров . Google предложила новый показатель качества — SSA (Sensibleness and Specificity Average):

Разумность (Sensibleness): Насколько ответ логичен в текущем контексте. Люди достигают здесь 97% .
Специфичность (Specificity): Насколько ответ уникален для данного момента, а не является дежурной фразой вроде «Я не знаю» .

По данным Google, Meena достигла показателя SSA в 79%, в то время как человек — 86%, а бот Mitsuku — лишь 56% . Тем не менее, Фридман призывает относиться к этим цифрам с осторожностью, так как код модели закрыт, а методология тестирования может быть подобрана под архитектуру системы .

🛡 Девять возражений Тьюринга и «Китайская комната» 17:16

В своей оригинальной статье Тьюринг предвосхитил и разобрал девять основных возражений против возможности машинного мышления. Фридман выделяет самые интересные из них:

Теологическое возражение: Только человек обладает божественной душой. Тьюринг ответил, что Бог всемогущ и при желании может наделить душой и искусственное существо .
Возражение «Голова в песке»: Страх перед тем, что ИИ может стать опасным (экзистенциальная угроза), мешает нам признать его возможность. По мнению Тьюринга, наши чувства не влияют на факт свершения события .
Математическое возражение (теорема Гёделя): Утверждение, что вычислительные системы имеют пределы логики. Тьюринг возразил, что люди тоже совершают ошибки и не являются идеально рациональными .
Возражение Ады Лавлейс: Машина делает только то, что ей приказали, и не может создать ничего оригинального. Фридман согласен с Тьюрингом в том, что достаточно сложные системы постоянно удивляют своих создателей, так как их поведение невозможно предсказать интуитивно .

Особое внимание Фридман уделяет аргументу Джона Сёрла о «Китайской комнате» (1980) . Сёрл утверждал, что если человек в комнате просто следует инструкциям по манипуляции символами (синтаксис), он не понимает смысла языка (семантика) .

Сам Лекс Фридман придерживается инженерной позиции: для нашего ограниченного понимания «видимость сознания» и есть само сознание . Он полагает, что, работая над имитацией мышления и любви, мы со временем придем к пониманию фундаментальной природы этих явлений .

🔄 Альтернативные тесты на интеллект 31:41

Фридман рассматривает несколько современных альтернатив классическому тесту Тьюринга:

Total Turing Test (1989): Расширяет тест на область компьютерного зрения и робототехники (манипуляция объектами) .
Тест Лавлейс 2.0 (2014): Фокусируется на творчестве и способности машины создать произведение искусства, которое удивит создателя .
Winograd Schema Challenge: Тест на здравый смысл, где машине нужно разрешить неоднозначность местоимений в предложениях. Например: «Трофей не влез в чемодан, потому что он слишком большой». Машина должна понять, что «он» — это трофей .
Hutter Prize: Премия за сжатие данных (1 ГБ Википедии). В основе лежит идея, что способность к максимальному сжатию знаний эквивалентна интеллекту .
Alexa Prize: Конкурс Amazon, где целью является удержание человека в разговоре более 20 минут. Фридман считает это мощным сигналом: мы не остаемся в скучном или бессмысленном разговоре добровольно .

🧩 ARC: Измерение абстрактного мышления 43:26

Одним из самых перспективных подходов Фридман называет ARC (Abstraction and Reasoning Corpus), предложенный Франсуа Шолле . ARC — это набор визуальных задач, похожих на IQ-тесты, которые проверяют способность машины к обобщению на основе минимального количества примеров .

Задачи ARC опираются на фундаментальные человеческие «априорные знания» (priors), такие как:

Постоянство объекта: Объект продолжает существовать, даже если он частично перекрыт шумом .
Пространственная связность: Клетки одного цвета, касающиеся друг друга, воспринимаются как единый объект .
Симметрия: Способность распознать и достроить симметричный паттерн .

Фридман подчеркивает, что такие тесты позволяют отделить реальное умение рассуждать от простого заучивания огромных массивов данных, чем грешат современные языковые модели .

🏁 Резюме: Почему тест Тьюринга всё еще важен 54:28

Лекс Фридман не согласен с теми исследователями (включая Стюарта Рассела и Франсуа Шолле), которые считают тест Тьюринга «отвлечением» от серьезной науки . По мнению Фридмана, этот тест «держит нас в честности», заставляя анализировать реальный прогресс в создании систем, способных на глубокую связь с человеком .

Ключевой вывод Фридмана заключается в необходимости «принять человеческую сложность и хаотичность» (messiness) . Интеллект — это не только чистая логика, но и эмоции, скука, иррациональность и социальное взаимодействие . Исследователь убежден, что настоящий ИИ человеческого уровня родится именно в области взаимодействия «человек-машина», будь то в форме чат-ботов или полуавтономных автомобилей .