Ноам Хомский и Брайан Китинг о будущем лингвистики и ИИ

Brian Keating 58,1 тыс. 1 ч 34 мин 14 мин 20.09.2023
Главное

Беседа известного физика Брайана Китинга и легендарного лингвиста Ноама Хомского посвящена фундаментальным вопросам человеческой природы, эволюции языка и границам современных технологий. В ходе интервью исследователи подробно разбирают, почему популярные нейросети не способны воспроизвести истинное человеческое мышление и в чём заключается подлинный секрет языковой эволюции. Центральной темой диалога становится глубокий анализ сознания через призму когнитивистики, лингвистических патологий и классического научного метода.

🧠 Крах надежд на нейросети: наука против инженерии 0:00

Современные нейросетевые системы представляют собой принципиально неверное направление для поиска механизмов мышления. По мнению Ноама Хомского, они полностью лишены той архитектуры, которая реально задействована в человеческом когнитивном процессе. Учёный убеждён, что простое дублирование или масштабирование существующих искусственных нейросетей ничего не даст исследователям, поскольку инженеры ищут ответы не в том месте.

В научном сообществе часто путают технологический прогресс с фундаментальным пониманием природы вещей. Ноам Хомский призывает разделять эти понятия: сначала необходимо заниматься чистой наукой и лишь затем переходить к инженерным решениям. Нынешний бум машинного обучения, с точки зрения когнитивистики, является исключительно триумфом вычислительной инженерии, но не продвигает нас в понимании того, как именно мыслит человек.

🐒 Эволюционный скачок и истинная природа языка 0:39

Ещё со времён классической Греции философы понимали, что владение языком — это главная определяющая характеристика человеческого существа. Это уникальное видовое свойство, общее для всех людей и не имеющее аналогов в органическом мире. Современная наука располагает вескими доказательствами того, что в этом аспектe среди человеческой популяции практически нет вариаций.

С точки зрения эволюции, появление полноценного языка произошло совсем недавно:

Именно эта врождённая языковая способность, как утверждает Хомский, лежит в основе любых творческих возможностей человека, включая те абстрактные размышления, за которые учёные получают Нобелевские премии.

🧮 Лингвистический аналог теоремы Гёделя и внутренняя архитектура 2:42

Брайан Китинг выдвинул гипотезу о существовании лингвистического аналога знаменитой теоремы Гёделя о неполноте, которая определяла бы формальные границы того, что находится вне пределов человеческого языка. Однако Ноам Хомский пояснил, что математическая концепция Гёделя применима исключительно к жестко заданным формальным системам. Язык же является органической физической системой, закодированной в мозге, и его свойства необходимо изучать экспериментально, как и любую другую физическую сущность.

Лингвистическую систему человека можно разделить на два базовых компонента:

  1. Внутренняя система: отвечает за конструирование ментальных выражений и формирование мыслительных смыслов.
  2. Система экстернализации: отвечает за передачу этих выражений во внешний мир через сенсомоторный аппарат.

Хомский приводит наглядную аналогию с техникой: внутренняя языковая система похожа на программу внутри ноутбука, а речь или жестовый язык глухонемых — это просто разные принтеры, подключаемые к этому компьютеру. Сама внутренняя система абсолютно одинакова в обоих случаях.

Удивительный факт заключается в том, что внутреннее ядро языка вообще не обращает внимания на линейный порядок слов, а оперирует исключительно иерархической структурой выражений. Когда дети осваивают речь, они полностью игнорируют линейный порядок того, что слышат, и опираются только на внутренние структурные правила, которые они физически не могут услышать извне.

В качестве доказательства Хомский приводит эксперименты с «невозможными языками». Если создать искусственный язык, где отрицание строится на основе линейного порядка (например, частица «не» всегда ставится строго третьим словом в предложении), человек сможет решать эту задачу как логическую головоломку, но стандартные языковые зоны его мозга останутся неактивными. Мозг принимает только те системы, которые соответствуют его врождённой иерархической архитектуре.

👽 Парадокс Ферми и лингвистика внеземных цивилизаций 8:42

Брайан Китинг, заявляющий о своей личной вере в существование внеземных цивилизаций, поднял проблему потенциального контакта с ними через двоичные коды или вспышки света. Хомский в ответ напомнил об известной дискуссии между астрофизиком Карлом Саганом и выдающимся американским биологом Эрнстом Майром.

Саган рассуждал с позиции физики: во Вселенной есть миллиарды планет, похожих на Землю, а значит, жизнь и разум неизбежно должны были там развиться. Майр же смотрел на проблему как биолог:

Из этого Майр делал вывод, что высокий технологический интеллект — это скорее эволюционная аномалия, снижающая шансы на долгосрочное выживание вида. Хомский соглашается с этой логикой и считает её наиболее вероятным ответом на парадокс Ферми.

Если же гипотетический внеземной разум всё-таки существует, канал связи (звук, свет или прикосновения) не будет иметь решающего значения. Главное — совпадение внутренней вычислительной архитектуры. По мнению Хомского, базовая вычислительная система любого разума должна строиться на простейшей бинарной информации. Существует высокая вероятность того, что эволюция в любой точке Вселенной неизбежно приходит к простейшим механизмам, включающим функцию следования (successor function), которая лежит в основе как арифметики, так и универсального языка.

🔬 Чему учат аномалии: патологии и «невозможные языки» 17:34

Изучение врождённой природы языка во многом опирается на исследование когнитивных дефицитов и повреждений мозга. Родоначальником современной биологии языка Хомский называет своего близкого друга Эрика Леннеберга, который заложил основы этой дисциплины около 50 лет назад.

Особый интерес для науки представляет детально изученный случай молодого человека по имени Крис (Chris):

В медицинской литературе также зафиксированы случаи, когда пациенты с экстремально малой долей коры головного мозга демонстрировали абсолютно полноценное и сохранное владение речью. Хомский отмечает, что нейролингвистика вынуждена развиваться через подобные косвенные наблюдения и аналогии, поскольку прямые инвазивные эксперименты (например, вживление электродов в зону Брока у детей ради проверки гипотез) исключены по строгим этическим соображениям.

🗣️ Внутренний монолог и мифы о раннем обучении 21:00

Физик Ричард Фейнман в своё время заметил, что люди мыслят и считают по-разному: сам он проговаривал числа внутренним голосом, тогда как некоторые его коллеги из MIT буквально видели цифры, двигающиеся в их воображении. Хомский утверждает, что этот непрерывный внутренний монолог знаком каждому, однако природа его глубже, чем кажется.

Когда человек печатает письмо и совершает опечатку в слове, которое пишется по-разному, но звучит одинаково (омофоны), это доказывает, что в процессе письма он ментально слышит эти слова. Процесс механического написания или набора текста — это лишь периферийная, удалённая деятельность (даже более дистанцированная от мышления, чем принтер), тогда как внутреннее «слышание» укоренено в мозге гораздо глубже.

Параллельно Хомский развенчивает популярные родительские мифы об усвоении языка. Существовало мнение, будто ребёнку необходимо услышать от родителей около миллиона слов, прежде чем он начнёт говорить сам. На самом деле исследования показывают следующее:

Понимание языка во многом предопределено генетически. Экспериментально доказано, что уже двухдневный младенец способен четко отличить голос и родную речь своей матери от того же самого языка, но произносимого другой женщиной-билингвом. Это неопровержимо свидетельствует о том, что когнитивные процессы и фиксация ритмики речи начинаются ещё в утробе матери. Человеческий младенец рождается с врождённой программой выделения языкового шума из окружающей среды, в то время как шимпанзе с аналогичной слуховой системой в той же самой среде никогда не начнёт воспринимать звуки как членораздельную речь.

📜 Единство биологии и лингвистики: от Кембрийского взрыва до словарей 33:25

В лингвистике, как и в биологии, долгое время доминировал ошибочный взгляд на бесконечное разнообразие изучаемых объектов. Хомский проводит параллель: ещё 60 лет назад биологи были убеждены, что живые организмы настолько разнообразны, что каждый вид нужно исследовать обособленно. Сегодня наука пришла к выводу, что все организмы фундаментально унифицированы и фактически представляют собой вариации нескольких базовых форм, возникших ещё в эпоху Кембрийского взрыва.

Аналогичная революция произошла в языкознании. Прежнее убеждение профессиональных лингвистов в том, что языки могут отличаться друг от друга до бесконечности, оказалось полностью ложным. Базовые принципы грамматики абсолютно едины для всего человечества, иначе дети просто не смогли бы осваивать речь.

В период пикового развития (в возрасте двух-трёх лет) ребёнок усваивает в среднем по одному новому слову за каждый час бодрствования. Столь молниеносное понимание богатейших и сложнейших смыслов невозможно объяснить простым обучением или индукцией из опыта — у человека физически нет для этого достаточного количества данных. Детский мозг работает подобно опытному врачу-радиологу: там, где обычный человек видит на рентгеновском снимке лишь хаотичный шум, младенец мгновенно вычленяет скрытые и строго упорядоченные языковые структуры.

💡 Галилеевский вызов и скрытые механизмы сознания 39:06

В когнитивной науке существует так называемый «Галилеевский вызов» — концепция, сформулированная на заре научной революции XVII века. Галилео Галилей и его современники были поражены невероятным, необъяснимым фактом: как человек умудряется с помощью всего лишь пары десятков символов конструировать в своей голове бесконечное множество мыслей и, более того, передавать их другим людям, которые не имеют прямого доступа к его сознанию. По признанию Хомского, эта сложнейшая загадка до сих пор остаётся решённой лишь частично.

Мозг человека жестко ограничен соображениями вычислительной эффективности и экономии ресурсов. При этом человеческий мозг устроен как чрезвычайно медленная система. Например, зрительный аппарат ежесекундно бомбардирует сознание колоссальными объёмами информации, но мозг попросту не успевает обрабатывать всё подряд, поэтому он безжалостно отсекает и выбрасывает до 100% лишних данных.

В лингвистической системе действует прямой аналог физического «принципа наименьшего действия». Наш внутренний разум строит максимально полные и эффективные языковые конструкции со всеми повторяющимися элементами. Однако, когда дело доходит до этапа экстернализации, «внутренний принтер» ради экономии энергии сокращает и выбрасывает всё, что возможно произнести короче. Из-за этого возникают огромные трудности у разработчиков систем автоматического парсинга речи, вынужденных программно восстанавливать пропущенные смысловые лакуны.

Из этого Хомский делает фундаментальный вывод для философии сознания:

В подтверждение этой скрытой сложности Хомский напоминает досократический парадокс Гераклита о невозможности войти в одну и ту же реку дважды. Любой младенец интуитивно понимает, что если реку заморозить, превратить в пар или перенаправить, она в одном контексте останется той же самой рекой, а в другом — превратится в шоссе. Эти сложнейшие ментальные категории даны нам изначально и не черпаются из наблюдений за внешней средой.

🤖 Машина Тьюринга, Neuralink и иллюзия мыслящих машин 58:00

Ноам Хомский предлагает разделять искусственный интеллект на два направления. Первое, которым занимался Марвин Минский, ставило целью понять саму природу человеческого разума — это полноценная наука, неотделимая от когнитивистики. Второе направление — чисто коммерческая инженерия, ярким примером которой выступает Google Translator. В основе современных систем глубокого обучения (Deep Learning) лежит исключительно «грубая сила» (brute force) — гигантские вычислительные мощности и обработка колоссальных массивов текста для статистического предсказания следующего слова.

С научной точки зрения, как утверждает Хомский, эти статистические предсказания абсолютно бессмысленны. Это всё равно что провести миллиарды хаотичных химических опытов и на основе этой статистики научиться угадывать цвет получающейся смеси, так и не поняв законов химии.

Говоря о перспективах прохождения ИИ знаменитого теста Тьюринга, Хомский предлагает вспомнить, что думал об этом сам Алан Тьюринг. В своей знаковой статье 1950 года о мыслящих машинах Тьюринг прямо указал, что вопрос «могут ли машины мыслить» слишком бессмысленен, чтобы вообще заслуживать серьёзного обсуждения. Хомский сравнивает это с вопросом «умеют ли субмарины плавать»: в русском или английском языке мы можем использовать это слово для описания движения корабля, но это лишь лингвистическая конвенция, не имеющая отношения к биологическому плаванию.

Не менее скептически Хомский настроен в отношении амбициозного проекта Илона Маска Neuralink:

Хомский солидарен с исследованиями Роджера Пенроуза и Стюарта Хамероффа, которые ищут механизмы мышления внутри нейронов — на ультраструктурном уровне микротрубочек и молекулярных вычислений. Вполне вероятно, что попытка воссоздать человеческий разум путём копирования обычной структуры макро-нейросетей окажется абсолютно пустой затеей.

🎓 Будущее университетов: от «зазубривания» к открытиям 1:09:34

Обсуждая кризис и будущее академического образования, Ноам Хомский цитирует своего старого друга, знаменитого физика из MIT Виктора Вайскопфа. Тот во время вводных лекций для первокурсников на вопрос студентов о том, что именно они будут «проходить» в семестре, неизменно отвечал: «Неважно, что мы изучим. Важно то, что вы откроете».

Наихудшая модель образования из всех возможных — это популярная ныне система «обучения ради тестов» (teaching to test), когда школьников и студентов заставляют зазубривать готовые массивы данных ради успешной сдачи экзамена. Хомский отмечает, что при таком подходе уже через неделю после теста учащиеся полностью забывают всё, что им преподавали.

В качестве эталона правильного образования Хомский приводит два примера:

Хомский соглашается с тезисом астрофизика Марио Ливио о том, что фундаментом любого образования должно выступать эпистемическое любопытство. Современные технологические новшества в вузах, вроде повсеместного использования презентаций PowerPoint, Хомский оценивает прохладно. По его мнению, когда профессор просто зачитывает готовые тезисы с экрана, это убивает живую дискуссию, возможность импровизации и совместное черчение на обычной доске.

🤐 Табу на внутренний голос и радикальная иррациональность культуры 1:18:51

В ходе беседы Китинг упомянул индустрию медитации и практики с участием Дипака Чопры, направленные на полную остановку внутреннего монолога. Ведущий задался вопросом, почему непрерывный поток мыслей считается в обществе своеобразным табу, о котором не принято говорить открыто. Хомский с юмором заметил, что двухлетние дети как раз озвучивают абсолютно всё, что происходит у них в голове, но взрослые люди в процессе социализации учатся держать этот хаотичный поток при себе, иначе мир стал бы невыносим для жизни.

В завершение интервью Хомский прокомментировал резонансное «Письмо о справедливости и открытых дебатах» (Harper's Letter, 2020), соподписанными которого в своё время выступили он сам и писательница Дж. К. Роулинг. Острая негативная реакция на это письмо со стороны медиа, по мнению философа, вскрыла глубокую проблему:

Хомский признаёт, что за последние десятилетия мир сделал огромный шаг вперёд в области защиты прав человека, прав женщин и расового разнообразия. Однако побочным эффектом этого процесса стала цензура и необходимость «ходить по яичной скорлупе», когда любое мнение, минимально расходящееся с мейнстримом, подвергается жесткому остракизму. Точно так же предрассудки в отношении южных американских акцентов, кажущихся необразованными, или британских, кажущихся аристократичными — это не лингвистическая проблема, а банальное проявление иерархии политической власти.

Прогнозируя будущее планеты в рамках концепции Clarke's Monolith, Хомский заявляет, что перед нами стоит не абстрактный, а вполне реальный вызов: из-за угрозы ядерной войны или надвигающейся экологической катастрофы человечество рискует полностью уничтожить себя уже в течение пары ближайших поколений. Отвечая на финальный вопрос о совете самому себе в молодом возрасте, 90-летний учёный резюмировал, что когда он только начинал свои исследования, лингвистики как науки вообще не существовало, а издатели отказывались печатать его книги. Главный совет, который доказал свою эффективность — никогда не слушать авторитетных критиков и всегда делать то, что кажется по-настоящему интересным.

💬 Цитаты

«Нейросетевые системы — это просто не то место, где стоит искать. У них нет той архитектуры, которая участвует в мышлении.»

Ноам Хомский 0:00

«Вопрос о том, могут ли машины мыслить, слишком бессмысленен, чтобы заслуживать обсуждения. Это как спрашивать, умеют ли субмарины плавать.»

«Неважно, что мы изучили в семестре, важно то, что вы смогли открыть самостоятельно.»

👥 Спикеры
📚 Упомянутые книги
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Тест Тьюринга
Эмпирический тест, идея которого заключается в том, чтобы определить, может ли компьютерная программа мыслить наравне с человеком.
Функция следования
Базовая математическая операция в арифметике, находящая для любого числа следующее за ним число.
Принцип наименьшего действия
Фундаментальный закон физики, согласно которому любая система выбирает траекторию с минимальными затратами энергии.
Зона Брока
Участок коры головного мозга, отвечающий за моторную организацию речи.
📊 Цифры
🗓 Хронология
  1. 200 000 лет назад Внезапное появление человеческого языка в ходе эволюции.
  2. 17 век Начало Галилеевской научной революции и формулирование вызова о природе языка.
  3. 1950 год Публикация знаковой статьи Алана Тьюринга о возможности мышления у машин.
  4. 2020 год Публикация «Письма о справедливости и открытых дебатах» в журнале Harper's.
⚖️ Другая сторона
Наука Ноам Хомский Брайан Китинг Neuralink Тест Тьюринга Когнитивная наука