Профессор Софи Скотт: «Человеческий мозг — единственный в мире мастер синтаксиса»

Человеческий язык — это не просто набор звуков, а сложнейший код, позволяющий передавать мысли из одного мозга в другой практически мгновенно. В третьей рождественской лекции Королевского института профессор Софи Скотт исследует границы этого «суперпауэр», пытаясь выяснить, смогут ли животные когда-нибудь полноценно заговорить с нами и почему современные компьютеры все еще пасуют перед простыми человеческими шутками.

🐦 Сложный сигнал или осмысленный код: чему нас учат птицы 4:20

Для того чтобы коммуникация считалась языком, сигнал должен обладать четкой структурой — он не может быть ни случайным шумом, ни бесконечным повторением одного и того же звука . В качестве главных кандидатов на роль «собеседников» ученые часто рассматривают певчих птиц, таких как зяблики и канарейки. Профессор Софи Скотт демонстрирует спектрограмму песни канарейки: на визуализации звука видны повторяющиеся последовательности ритмичных нот разной высоты .

Несмотря на внешнюю схожесть структуры птичьего пения с человеческой речью (наличие ритма, темпа и высоты тона), между ними есть фундаментальное различие:

Певчие птицы выучивают свои песни в детстве и практически не меняют их во взрослом возрасте .
Они не склонны «разрезать» свои песни на части и переставлять их, чтобы создавать новые смыслы.
Люди же постоянно жонглируют словами, создавая бесконечное количество новых комбинаций .

Особое место занимают попугаи, способные имитировать человеческую речь. Амазонский попугай Хелли, представленный на лекции, знает около 80 различных звуков и слов . По словам владельца птицы Майка, Хелли понимает контекст: она говорит «привет» при появлении людей и «пока» при их уходе, а также связывает определенные фразы с эмоциями, например, спрашивая «Ты в порядке?», если чувствует беспокойство в студии . Тем не менее, по мнению профессора Скотт, это скорее имитация и ситуативное связывание, чем полноценное владение языком.

🧠 Генетика речи и «отключение» голоса магнитом 10:47

Удивительная способность птиц к обучению звукам объясняется сходством структур их мозга с человеческим. Несмотря на то, что птицы ближе к динозаврам, чем к млекопитающим, у нас общие гены, отвечающие за построение нейронных сетей для вокального контроля .

В человеческом мозге за планирование и управление речью отвечают специфические зоны, расположенные преимущественно в левом полушарии. Профессор Софи Скотт и доктор Риччи Ханна продемонстрировали работу этих зон в реальном времени с помощью транскраниальной магнитной стимуляции (ТМС) на комике Робине Инсе :

При воздействии магнитным импульсом на левую нижнюю лобную извилину (зону Брока), Робин мгновенно терял способность произносить слова .
Сам Робин описал это состояние как «ощущение Гомера Симпсона с пончиком», когда ты хочешь говорить, но издаешь лишь нечленораздельные звуки .
Как только стимуляция прекращалась, способность говорить возвращалась в полном объеме .
При воздействии на другие участки мозга речь не прерывалась, что доказывает узкую специализацию конкретных областей мозга для речевой деятельности .

🐕 Декодирование слов: на что способны собаки 18:38

Если птицы хороши в производстве звуков, то собаки — признанные мастера их декодирования. Бордер-колли по кличке Гейбл продемонстрировал способность идентифицировать около 150 различных предметов по их названиям . В ходе эксперимента пес безошибочно приносил «трицератопса», «осьминога» и «молоток», даже когда команды отдавал незнакомый ему человек .

Научные исследования в Венгрии с использованием функциональной МРТ показали, что происходит в мозгу собак в такие моменты:

Когда собаки слышат знакомые слова, у них активируется левое полушарие — точно так же, как у людей при обработке речи .
Исключительные представители породы способны запоминать до 1000 слов, однако, как отмечает Скотт, любой трехлетний ребенок понимает столько же .
Главное ограничение собак — они воспринимают слова как отдельные символы, но не связывают их в сложные последовательности с грамматической структурой .

🦍 Жесты шимпанзе: за шаг до предложения 27:25

Ближайшие родственники человека, человекообразные обезьяны, используют для общения не только вокализацию (крики, ворчание, визг), но и богатую систему жестов. Доктор Кэт Хобайтер из Сент-Эндрюсского университета утверждает, что естественная коммуникация шимпанзе включает 60–70 различных движений рук и тела .

Ученые определяют значение жеста, наблюдая за реакцией получателя: если действие собеседника «удовлетворяет» сигнализирующего и тот прекращает жестикуляцию, значит, цель достигнута . Например:

Поднятая рука часто означает «подойди ближе» .
Легкое шевеление ступней — приглашение ребенку «залезть на спину» .
Почесывание может быть просьбой о груминге .

Самое интригующее в исследованиях Хобайтер — использование последовательностей жестов. Шимпанзе могут комбинировать «тряску дерева» и «почесывание», чтобы усилить или уточнить смысл сообщения . Сейчас ученые пытаются выяснить, меняется ли смысл сообщения от перемены порядка жестов, как это происходит в человеческой грамматике .

🧪 Важность синтаксиса: химический эксперимент 32:34

Чтобы показать, насколько критичен порядок слов и пунктуация, на сцене провели эксперимент с «химическими инструкциями». Два волонтера получили один и тот же набор реактивов и текст, отличавшийся только знаками препинания:

Первая последовательность привела к безобидному изменению цвета жидкости .
Вторая последовательность (с измененной пунктуацией) вызвала бурную реакцию с образованием огромного столба пены .

Этот пример иллюстрирует, почему комбинирование символов — это «высшая лига» коммуникации. По мнению Скотт, именно отсутствие развитого синтаксиса проводит черту между человеческим языком и самыми сложными системами общения животных .

🤖 Почему компьютеры плохо понимают шутки 37:35

Сегодня четверть населения Земли пользуется голосовыми помощниками, но понимает ли машина нас на самом деле? Профессор Скотт называет распознавание речи «чудовищно сложной задачей» . Основная проблема заключается в том, что в живой речи между словами физически нет пауз — это непрерывный поток звуковой энергии, «размазанный» на спектрограмме .

Компьютеры решают эту задачу в несколько этапов:

Акустический уровень: поток звука разбивается на крошечные фрагменты (слайсы), которые сопоставляются с библиотекой идеализированных звуков речи .
Языковой уровень: компьютер использует базы данных, чтобы оценить вероятность следования одного слова за другим (например, после «корабль плывет через...» слово «залив» более вероятно, чем «холодильник») .

Однако человеческое общение — это не только слова (левое полушарие), но и интонация (правое полушарие) . Интонация сообщает об эмоциях, иронии и социальном статусе. Эксперимент с ведущим Кришнаном Гуру-Мурти показал, что по одной лишь интонации при чтении футбольных результатов слушатели могут понять, выиграла команда, проиграла или сыграла вничью, еще до того, как будет назван счет .

Современные разработки, такие как робот Olly, начинают анализировать не только семантику, но и акустические параметры голоса, пытаясь определить эмоциональное состояние пользователя . Тем не менее, по словам Скотт, до полноценного понимания человеческого юмора и всех нюансов социального контекста машинам еще далеко.

В финале лекции Софи Скотт вспоминает о золотых пластинках на аппаратах «Вояджер», которые несут звуки 55 языков Земли в глубокий космос . По её мнению, если когда-нибудь инопланетный разум встретит эти зонды, ему понадобится мозг, столь же невероятный, как человеческий, чтобы взломать наш код и понять, что мы хотели сказать .