Валид Саба о пределах ChatGPT: «Аппроксимация бесконечности звучит глупо»

В новом эпизоде подкаста Machine Learning Street Talk исследователь в области искусственного интеллекта Валид Саба (Walid Saba) разбирает фундаментальные различия между современными большими языковыми моделями (LLM) и классическими вычислительными моделями. В центре дискуссии — вопрос о том, способны ли системы вроде ChatGPT реально оперировать бесконечными структурами данных или они лишь создают качественную иллюзию понимания через статистическую аппроксимацию.

🔄 Рекурсия против рекуррентности: в чём ошибка нейросетевого подхода 0:00

Валид Саба настаивает на строгом разграничении понятий «рекуррентность» и «рекурсия», которые часто ошибочно отождествляются в среде разработчиков машинного обучения . По его словам, сходство этих процессов не означает их эквивалентности: рекуррентность — это лишь повторяющийся процесс, в то время как рекурсия является полноценной вычислительной моделью .

Основные различия между ними, по мнению гостя:

Семантика остановки: В рекурсии критерий остановки (базовый случай) является интринсивным, то есть заложенным в саму структуру данных и функцию . В нейросетях (RNN) остановка часто внешняя (экстринсивная) — например, ограничение в 300 токенов, что не связано с логикой задачи .
Вычислительная мощность: Рекурсивные функции эквивалентны машинам Тьюринга, лямбда-исчислению и логике предикатов первого порядка . Рекуррентные же сети без бесконечной памяти или ленты не обладают такой полнотой.
Композициональность: Рекурсия неразрывно связана с математической индукцией и композициональностью . Она определяет объекты (списки, числа, деревья) через них самих: список — это либо пустой элемент, либо элемент, присоединённый к списку .

📊 Иерархия Хомского и «аппроксимация» бесконечности 6:03

Ведущий упоминает недавнюю работу DeepMind, в которой исследовалось соответствие различных архитектур нейросетей уровням иерархии Хомского . Согласно этой иерархии:

Стандартные многослойные перцептроны (MLP) соответствуют конечным автоматам.
Рекуррентные сети (RNN) способны порождать регулярные языки.
На вершине находятся рекурсивно перечислимые языки, распознаваемые машинами Тьюринга .

Валид Саба отмечает, что сторонники LLM часто используют аргумент об «аппроксимации» . Они утверждают, что если Трансформеры могут имитировать рекурсивно перечислимые языки на достаточном для практических нужд уровне сложности, то в полноценных машинах Тьюринга нет необходимости. Однако Саба считает этот вопрос открытым: можно ли считать аппроксимацию бесконечного множества (каким является человеческий язык) эквивалентом самого множества ? По его мнению, «аппроксимация бесконечности» — это концептуальное противоречие .

💻 «Практическая бесконечность»: пример с компилятором Python 9:35

В дискуссии поднимается критика со стороны таких учёных, как Педро Домингос, которые скептически относятся к апелляциям к «бесконечности» в ИИ, считая их абстрактными и практически бесполезными . Валид Саба категорически не согласен с такой позицией, приводя в пример работу любого компилятора .

Аргументы Сабы о реальности бесконечности в программировании:

Компилятор Python или Java не содержит в себе список всех возможных программ. Он содержит конечный набор правил (грамматику), который описывает бесконечное множество валидных конструкций .
Если вы напишете новую, никогда не существовавшую валидную программу, компилятор не выдаст ошибку «этого нет в моей базе» . Он готов к любому объекту из бесконечного множества.
Это и есть «практическая бесконечность», с которой разработчики сталкиваются каждое утро . Способность конечного объекта (кода компилятора) представлять бесконечный объект (множество программ) — это фундаментальная мощь логики и рекурсии .

🗣️ Почему язык — это не статистика, а логика 11:54

Обсуждая естественный язык, Саба ссылается на Ноама Хомского, который называл попытки вычислить вероятность предложения бессмысленными . По мнению гостя, когда человек идет по улице, он не может предсказать, что скажет ему случайный прохожий, используя вероятностные модели .

Ключевые тезисы Валида Сабы о языке:

Проблема нулевой вероятности: Любое конкретное предложение из бесконечного набора имеет вероятность, стремящуюся к нулю . Следовательно, статистическое предсказание следующего токена — это лишь попытка угадать результат в системе, где пространство вариантов бесконечно.
Универсальность: Тот же принцип бесконечности, что применим к Python, применим и к SQL, и к естественному языку . Мы должны быть готовы к бесконечному набору объектов, которые нам могут предъявить.
Остановка и регресс: Проблема остановки в вычислениях напрямую сводится к бесконечному регрессу . Попытка написать программу, проверяющую завершаемость другой программы, ведет в бесконечность, если только мы не начнем снова использовать аппроксимацию .

В завершение беседы Валид Саба подчеркивает, что хотя современные LLM демонстрируют впечатляющие результаты в тестах, их реальная проверка «в дикой природе» (in the wild) ещё впереди . По его мнению, пользователи часто склонны переоценивать модели, игнорируя их фундаментальные ограничения в угоду кратковременному вау-эффекту .