Могут ли машины мыслить? Глубокий разбор теста Тьюринга и будущего ИИ с Лексом Фридманом

Lex Fridman 122 тыс. 1 ч 6 мин 27.04.2020
Главное

В 1950 году математик и криптограф Алан Тьюринг опубликовал статью, которая заложила интеллектуальный фундамент для всей будущей области искусственного интеллекта. Лекс Фридман возвращается к этому программному тексту, чтобы проанализировать, насколько современный инженерный прагматизм соотносится с философскими мечтами прошлого и какие современные тесты могут прийти на смену классической «Имитационной игре».

🧠 Наследие Алана Тьюринга: Рождение мечты об ИИ 0:00

Статья «Вычислительные машины и разум» (Computing Machinery and Intelligence), опубликованная почти 70 лет назад, по мнению Лекса Фридмана, является самой влиятельной работой в истории искусственного интеллекта . Несмотря на то что по своей сути это философское эссе, оно предложило конкретный инженерный бенчмарк для определения разумности систем .

Фридман полагает, что именно эта работа посеяла «семена мечты» для целых поколений исследователей, вдохновив их на создание систем, обладающих человеческим уровнем способностей . Тьюринг начал свой текст со знаменитого предложения: «Я предлагаю рассмотреть вопрос: „Могут ли машины мыслить?“» . Однако, осознавая расплывчатость определений «машина» и «мыслить», он заменил этот вопрос на описание эксперимента, который мы сегодня называем тестом Тьюринга .

🎭 Имитационная игра: Механика и предсказания 3:16

Классический тест Тьюринга строится по схеме «Имитационной игры»:

Алан Тьюринг сделал смелое предсказание: к 2000 году компьютеры с объёмом памяти в 100 мегабайт смогут обманывать 30% судей в ходе пятиминутного теста . Кроме того, он считал, что в будущем фраза «мыслящая машина» перестанет казаться людям противоречивой .

По словам Фридмана, сегодня мы всё ещё находимся в процессе осмысления этого вызова. Почему мы до сих пор отказываем в разуме системе IBM Deep Blue или алгоритму AlphaGo, которые побеждают лучших мастеров игры в шахматы и го? . Ведущий утверждает, что существует глубокий психологический барьер: когда мы понимаем, как работает алгоритм (например, через брутфорс или обучение с подкреплением), магия интеллекта исчезает .

🏆 Реальные попытки: От Премии Лёбнера до Google Meena 7:43

В реальном мире тест Тьюринга воплотился в Премии Лёбнера (Loebner Prize), которая существует с 1991 года . Структура вознаграждений такова:

Фридман отмечает, что долгое время в конкурсе доминировали чат-боты Mitsuku и Rose, созданные Стивом Уорвиком и Брюсом Уилкоксом. Однако эти системы основаны преимущественно на правилах и скриптах, а не на сквозном машинном обучении . Анализ диалогов с Mitsuku показывает, что бот часто терпит неудачу на мелких деталях человеческого опыта — например, не может логично объяснить свои футбольные симпатии или теряет нить разговора на уточняющих вопросах .

В 2014 году большой резонанс вызвало заявление о прохождении теста программой Eugene Goostman, которая выдавала себя за 13-летнего украинского мальчика . Бот смог обмануть 33% судей, используя тактику уклонения от сложных вопросов, прикрываясь языковым барьером и возрастом . Фридман, однако, считает это «трюкачеством», которое обходит суть теста — способность вести глубокий и осмысленный диалог .

Более современным подходом является модель Meena от Google — нейросеть с 2,6 миллиардами параметров . Google предложила новый показатель качества — SSA (Sensibleness and Specificity Average):

  1. Разумность (Sensibleness): Насколько ответ логичен в текущем контексте. Люди достигают здесь 97% .
  2. Специфичность (Specificity): Насколько ответ уникален для данного момента, а не является дежурной фразой вроде «Я не знаю» .

По данным Google, Meena достигла показателя SSA в 79%, в то время как человек — 86%, а бот Mitsuku — лишь 56% . Тем не менее, Фридман призывает относиться к этим цифрам с осторожностью, так как код модели закрыт, а методология тестирования может быть подобрана под архитектуру системы .

🛡 Девять возражений Тьюринга и «Китайская комната» 17:16

В своей оригинальной статье Тьюринг предвосхитил и разобрал девять основных возражений против возможности машинного мышления. Фридман выделяет самые интересные из них:

Особое внимание Фридман уделяет аргументу Джона Сёрла о «Китайской комнате» (1980) . Сёрл утверждал, что если человек в комнате просто следует инструкциям по манипуляции символами (синтаксис), он не понимает смысла языка (семантика) .

Сам Лекс Фридман придерживается инженерной позиции: для нашего ограниченного понимания «видимость сознания» и есть само сознание . Он полагает, что, работая над имитацией мышления и любви, мы со временем придем к пониманию фундаментальной природы этих явлений .

🔄 Альтернативные тесты на интеллект 31:41

Фридман рассматривает несколько современных альтернатив классическому тесту Тьюринга:

🧩 ARC: Измерение абстрактного мышления 43:26

Одним из самых перспективных подходов Фридман называет ARC (Abstraction and Reasoning Corpus), предложенный Франсуа Шолле . ARC — это набор визуальных задач, похожих на IQ-тесты, которые проверяют способность машины к обобщению на основе минимального количества примеров .

Задачи ARC опираются на фундаментальные человеческие «априорные знания» (priors), такие как:

Фридман подчеркивает, что такие тесты позволяют отделить реальное умение рассуждать от простого заучивания огромных массивов данных, чем грешат современные языковые модели .

🏁 Резюме: Почему тест Тьюринга всё еще важен 54:28

Лекс Фридман не согласен с теми исследователями (включая Стюарта Рассела и Франсуа Шолле), которые считают тест Тьюринга «отвлечением» от серьезной науки . По мнению Фридмана, этот тест «держит нас в честности», заставляя анализировать реальный прогресс в создании систем, способных на глубокую связь с человеком .

Ключевой вывод Фридмана заключается в необходимости «принять человеческую сложность и хаотичность» (messiness) . Интеллект — это не только чистая логика, но и эмоции, скука, иррациональность и социальное взаимодействие . Исследователь убежден, что настоящий ИИ человеческого уровня родится именно в области взаимодействия «человек-машина», будь то в форме чат-ботов или полуавтономных автомобилей .

💬 Цитаты

«Я предлагаю рассмотреть вопрос: «Могут ли машины мыслить?»»

Алан Тьюринг 02:24

«Для нашего исключительно ограниченного понимания видимость сознания и есть сознание.»

Лекс Фридман 31:13

«Интеллект вполне может быть путем, а не пунктом назначения.»

Лекс Фридман 36:30
👥 Спикер
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
SSA (Sensibleness and Specificity Average)
Метрика Google для оценки качества диалога по двум параметрам: логичность ответа и его уникальность.
Китайская комната
Аргумент Джона Сёрла о том, что выполнение алгоритмов не означает понимания смысла.
ARC (Abstraction and Reasoning Corpus)
Набор визуальных задач для проверки способности ИИ обучаться новым концепциям на лету.
📊 Цифры
🗓 Хронология
  1. 1950 Публикация статьи Алана Тьюринга «Вычислительные машины и разум».
  2. 1991 Запуск ежегодного конкурса на Премию Лёбнера.
  3. 2000 Год, к которому Тьюринг прогнозировал частичный успех машин в тестах.
  4. 2014 Бот Eugene Goostman обманул 33% судей на мероприятии в Лондоне.
⚖️ Другая сторона
Искусственный интеллект Алан Тьюринг Тест Тьюринга Francois Chollet Google Meena Китайская комната