Действительно ли современные большие языковые модели понимают человеческий язык, или они лишь искусно имитируют его? В рамках подкаста Eye on AI легендарный ученый в области вычислительной нейробиологии и один из пионеров глубокого обучения Терри Сейновски (Terry Sejnowski) делится инсайдами о природе ИИ, рассказывает о своей новой книге и объясняет, почему современная наука о данных все еще находится в «докоперниковской» эпохе. Сейновски сопоставляет архитектуру искусственных нейросетей с биологическим мозгом, объясняя, чего именно не хватает ChatGPT для обретения истинной автономии и почему его «галлюцинации» — это лишь обратная сторона человеческой креативности.
🧠 От истоков физики к революции глубокого обучения 2:56
Путь Терри Сейновски в нейробиологию начался с теоретической физики . Получив степень доктора философии (PhD) в Принстоне, ученый осознал, что для совершения прорывов в физике требуются колоссальные ресурсы — гигантские ускорители частиц или запуск космических спутников . Мозг же показался ему не менее загадочным, чем Вселенная, но при этом доступным для исследования непосредственно в лаборатории .
В 1979 году в Сан-Диего на небольшой конференции по ассоциативной памяти Терри Сейновски познакомился с Джеффри Хинтоном . Это определило траекторию развития всей индустрии искусственного интеллекта. Оба исследователя стремились понять два фундаментальных вопроса:
- Как биологический мозг решает сложнейшие вычислительные задачи?
- Каковы вычислительные возможности крупномасштабных сетевых моделей?
Научным руководителем Сейновски в Принстоне был Джон Хопфилд . Развивая его идеи, Сейновски и Хинтон добавили в модель «шум» (по аналогии со спиновыми стеклами в статистической механике Людвига Больцмана), что позволило сети находить не просто локальные, а глобальные минимумы . Так появилась знаменитая «машина Больцмана» (Boltzmann machine), чей алгоритм обучения при достижении теплового равновесия Сейновски до сих пор считает одной из самых красивых математических работ в своей карьере . Именно это открытие преодолело застой в области искусственных нейросетей и привело к созданию алгоритма обратного распространения ошибки (backpropagation), который Хинтон и Дэвид Румельхарт представили вскоре после этого .
В то время как Хинтон посвятил следующие десятилетия масштабированию этих идей (что привело к триумфу сверточных сетей на конкурсе ImageNet в 2012–2013 годах) , карьера Сейновски сместилась в сторону чистой нейробиологии. Он прошел постдокторантуру в Гарварде, после чего перешел в Институт Солка (Salk Institute) в Ла-Хойе и Университет Калифорнии в Сан-Диего (UCSD) . Кроме того, Сейновски долгие годы возглавлял фонд NeurIPS (Neural Information Processing Systems), который вырос из скромных академических встреч на 500 человек в 1980-х годах в крупнейшую мировую ИИ-конференцию .
🪞 Эффект зеркала: ChatGPT как инопланетный разум 7:49
Главным стимулом для написания новой книги Терри Сейновски стал глубокий раскол в академической среде относительно природы способностей ChatGPT . Ученые в области когнитивных наук, лингвистики и ИИ уже более двух лет ведут ожесточенные споры о том, «понимает» ли модель язык .
По мнению Сейновски, природа взаимодействия человека с ChatGPT ошибочно интерпретируется как общение с личностью. На самом деле ИИ функционирует как цифровое зеркало . Модель обучена на колоссальном массиве человеческих текстов — романах, учебниках, статьях — и способна принимать абсолютно любую роль (персону) . То, какую именно «личность» примет модель и насколько качественным будет ее ответ, полностью определяется контекстом и формулировкой запроса (промпта) пользователя .
Сейновски подчеркивает следующие особенности этой технологии:
- Инопланетная природа: ИИ очевидно не является человеком. Сейновски сравнивает ChatGPT с инопланетным разумом, который внезапно прибыл на Землю и заговорил с нами .
- Устаревший понятийный аппарат: Термины, которыми мы описываем когнитивные функции ИИ (интеллект, понимание, сознание), пришли из психологии XIX века или даже более ранних эпох. Они научно не определены так же строго, как физические понятия массы или энергии .
- Докоперниковская эпоха ИИ: По мнению Сейновски, современная наука об искусственном интеллекте находится на этапе, аналогичном астрономии до Николая Коперника . Изучение математических свойств больших языковых моделей может помочь нам со временем понять не только ИИ, но и биологический мозг животных .
🎨 Креативность, галлюцинации и феномен NetTalk 12:41
Одним из первых ярких примеров неочевидного «понимания» в ИИ Сейновски считает знаменитый 37-й ход системы AlphaGo в матче против Ли Седоля в 2016 году . Этот неординарный ход на пустом участке доски сначала озадачил экспертов, но в итоге предопределил победу машины.
По мнению ученого, данный инцидент доказывает, что современные нейросети способны на подлинное творчество . В этом контексте так называемые «галлюцинации» ИИ представляют собой не дефект, а оборотную сторону креативности . ИИ не просто выдумывает факты, он создает крайне правдоподобные сценарии событий, которые теоретически могли бы произойти, но не происходили в реальности .
Сейновски проводит прямую аналогию с человеческой психикой:
- Конфабуляция: В медицине это явление называется конфабуляцией (патологическим вымыслом) . Например, пациенты с синдромом Корсакова искренне верят в истинность вымышленных ими историй, поскольку их мозг не способен критически оценить собственную память .
- Человеческая память: Люди постоянно галлюцинируют. Сейновски приводит пример: если человека спросить, какого цвета была его рубашка на пятилетии, он может четко «увидеть» в памяти синий цвет, однако старые фотографии обнаружат, что рубашка была оранжевой .
Ученый напоминает, что творческий потенциал нейросетей проявился еще в конце 1980-х годов. Тогда Джеральд Тезауро (Gerald Tesauro) применил алгоритмы обучения с подкреплением к игре в нарды (проект TD-Gammon) . ИИ играл сам с собой и в итоге разработал стратегии и ходы на чемпионском уровне, которые до этого никогда не использовались людьми .
Другим историческим прорывом стал проект NetTalk (1980-е годы), в котором принимал участие сам Сейновски совместно с выпускником Принстона Чарли Розенбергом . Это была крошечная по современным меркам нейросеть (всего 200 вычислительных узлов и 20 000 синаптических связей), обученная правильному произношению английских слов с учетом контекста букв . Сеть смогла успешно усвоить не только общие правила фонетики английского языка, но и все сложные исключения. В процессе обучения сеть сначала издавала нечленораздельный лепет, затем осваивала простые слова и в итоге научилась бегло читать незнакомый текст . Сейновски считает это доказательством того, что архитектура нейросетей изначально предрасположена к освоению структуры языка .
🗣️ Спор о понимании: Джеффри Хинтон против «стохастического попугая» 20:16
Существует скептический аргумент, согласно которому большие языковые модели — это лишь «стохастические попугаи» (stochastic parrots), предсказывающие следующее слово на основе статистических вероятностей обучающей выборки .
Однако Джеффри Хинтон не согласен с такой трактовкой. В личных беседах с Сейновски Хинтон отстаивает позицию, что модели действительно понимают язык . Его аргументация строится на следующем тезисе:
«Для того чтобы с высокой точностью предсказать следующее слово в предложении, нейросеть обязана построить качественную внутреннюю модель семантического контекста этого предложения . Невозможно угадывать слова, опираясь лишь на грамматику (синтаксис); необходимо улавливать сам смысл (семантику) передаваемого сообщения» .
Сейновски соглашается с Хинтоном: глубина понимания ИИ может отличаться от человеческой, но внутреннее представление информации в современных LLM интегрирует данные из множества источников . При этом ученый отмечает, что лингвисты XX века слишком долго концентрировались на синтаксисе, игнорируя тот факт, что главная цель языка — это передача смыслов (семантика) . В живом общении смысл передается не только текстом, но и интонацией, мимикой и жестами .
✍️ Письменность как катализатор эволюции разума 28:06
Анализируя природу человеческого интеллекта, Сейновски ссылается на идеи из книги Джеймса Глика «Информация» (The Information by James Gleick) . Автор книги утверждает, что устная речь мимолетна: звуковые волны исчезают сразу после произнесения .
Революционным скачком для человечества стало не появление разговорной речи, а изобретение письменности . Письменность — это искусственная технология, под которую людям пришлось перепрофилировать свою зрительную систему (для этого требуется много лет обучения в школе) .
Именно фиксация текстов на материальных носителях позволила человечеству:
- Накапливать знания в масштабах поколений .
- Проверять и корректировать эти знания (ученый может прочесть тезис предшественника, провести эксперимент и аргументированно опровергнуть его) .
- Уйти от ограничений устной традиции, где история неизбежно искажалась и мутировала при пересказе .
Поскольку ChatGPT обучается преимущественно на огромных массивах именно письменного языка, он фактически впитывает в себя дистиллированный аналитический опыт всего человечества .
🚫 Чего не хватает ChatGPT до уровня человеческого мозга? 34:16
Несмотря на выдающиеся результаты ИИ, Терри Сейновски призывает не переоценивать текущие модели. Он отмечает, что архитектура ChatGPT моделирует исключительно кору головного мозга (cerebral cortex) — зону, отвечающую за хранение знаний и обработку ассоциаций . Однако в реальном мозге существует около сотни других важнейших отделов, которые полностью отсутствуют в ИИ .
Сейновски выделяет три ключевых дефицита современных LLM:
- Отсутствие биологических целей: У ИИ нет эволюционных драйверов — выживания, размножения, потребности в пище и сне . У него нет врожденного понимания того, «что такое хорошо и что такое плохо» . В человеческом мозге за это отвечает система базальных ганглиев (basal ganglia), оценивающая будущие награды и формирующая ценности .
- Отсутствие непрерывного обучения (Lifelong Learning): После завершения этапа обучения веса ChatGPT замораживаются . Модель не учится в процессе общения с конкретным пользователем. Если ее отключить и включить заново, она останется прежней .
- Главный стоп-фактор («Showstopper»): Когда ChatGPT заканчивает выводить ответ на экране, любые вычислительные процессы внутри его сети полностью прекращаются . Модель абсолютно статична. В ней нет спонтанной, самогенерирующейся активности .
По мнению Сейновски, именно поэтому ИИ не обладает субъектностью (agency) и чувственностью (sentience) . Человек, запертый в темной комнате без внешних раздражителей, продолжает непрерывно мыслить, планировать, испытывать эмоции и гонять нейронные импульсы по кругу . ChatGPT же мертв до тех пор, пока пользователь не отправит ему новый промпт.
Ученый скептически относится и к концепции создания «агентов» путем соединения нескольких LLM. С математической точки зрения, две модели ChatGPT, разговаривающие друг с другом, эквивалентны одной большой сети GPT .
🪰 Уроки биологии: Муха против суперкомпьютера 45:28
Сейновски убежден, что создателям ИИ необходимо черпать вдохновение в дикой природе . Любая полевая мышь автономно ориентируется в трехмерном физическом мире, ищет пищу и строит норы . С точки зрения выживания в реальном мире, она бесконечно превосходит любую современную ИИ-модель, которая остается «тепличным растением», полностью зависимым от человека, серверов и электроэнергии .
Ученый вспоминает показательную историю из 1980-х годов, когда его пригласили прочесть лекцию в Лаборатории искусственного интеллекта Массачусетского технологического института (MIT AI Lab) . В те годы классический ИИ базировался на символьных правилах, и идеи нейросетей воспринимались в штыки. Организатор встречи буквально перед входом в лифт предупредил Сейновски: «Терри, они ненавидят то, чем ты занимаешься» .
Чтобы переломить скепсис аудитории, Сейновски указал на муху, летавшую над бутербродами в зале :
«Посмотрите на эту муху. Она летает, находит пищу, избегает опасностей и успешно размножается. Все это она делает с помощью сети из 100 000 нейронов. При этом в вашем подвале стоит суперкомпьютер Cray XMP стоимостью 100 миллионов долларов. Он не умеет летать, не умеет видеть и никогда не даст потомства. Что не так с этой картиной?»
Один из профессоров возразил, что для компьютера просто «еще не написали программу компьютерного зрения» . На это Сейновски ответил, что Агентство передовых оборонных исследовательских проектов США (DARPA) уже влило миллиарды долларов в компьютерное зрение, но задача так и не была решена из-за комбинаторного взрыва классических алгоритмов .
Смысл биологического решения заключается в специализации:
- Универсальность против эффективности: Цифровой компьютер Тьюринга универсален, но крайне неэффективен для специфических сенсомоторных задач .
- Аппаратный алгоритм: В мозге мухи алгоритм работы неотделим от физической структуры связей (аппаратной архитектуры) . Именно обратный инжиниринг биологических связей (коннектомика) укажет инженерам правильный путь развития вычислительных систем .
🛠️ Будущее: Сделает ли ИИ людей умнее? 52:46
В финальной части беседы Терри Сейновски делится своим видением будущего рынка труда и роли ИИ в обществе. Он считает панические статьи о «немедленном вытеснении людей сверхинтеллектом» преувеличением журналистов .
Вместо потери рабочих мест людей ждет глубокая трансформация характера их труда благодаря появлению новых инструментов . Ученый проводит аналогию с лопатой:
- Если ваша работа — копать траншеи руками, это тяжелый, грязный и неэффективный труд .
- Изобретение лопаты кардинально меняет процесс. Сначала вы не понимаете, как ее держать, но освоив инструмент, вы копаете глубже, быстрее и с меньшими усилиями .
- Точно так же ChatGPT возьмет на себя выполнение рутинных задач, освободив время для интеллектуального творчества. Человек останется главным оператором процесса .
Сейновски подчеркивает, что ИИ буквально сделает людей умнее . Это «Google-поиск на стероидах», который дает глубокие ответы на сложные вопросы вместо выдачи простых ссылок по ключевым словам . Умные технологии уже расширяют границы нашего познания. В будущем интерфейсы взаимодействия с компьютерами изменятся: физические клавиатуры и смартфоны уступят место естественному речевому общению с ИИ-ассистентами .