Валид Саба о пределах ChatGPT: «Аппроксимация бесконечности звучит глупо»

Machine Learning Street Talk 19,6 тыс. 16 мин 3 мин 15.04.2023
Главное

В новом эпизоде подкаста Machine Learning Street Talk исследователь в области искусственного интеллекта Валид Саба (Walid Saba) разбирает фундаментальные различия между современными большими языковыми моделями (LLM) и классическими вычислительными моделями. В центре дискуссии — вопрос о том, способны ли системы вроде ChatGPT реально оперировать бесконечными структурами данных или они лишь создают качественную иллюзию понимания через статистическую аппроксимацию.

🔄 Рекурсия против рекуррентности: в чём ошибка нейросетевого подхода 0:00

Валид Саба настаивает на строгом разграничении понятий «рекуррентность» и «рекурсия», которые часто ошибочно отождествляются в среде разработчиков машинного обучения . По его словам, сходство этих процессов не означает их эквивалентности: рекуррентность — это лишь повторяющийся процесс, в то время как рекурсия является полноценной вычислительной моделью .

Основные различия между ними, по мнению гостя:

📊 Иерархия Хомского и «аппроксимация» бесконечности 6:03

Ведущий упоминает недавнюю работу DeepMind, в которой исследовалось соответствие различных архитектур нейросетей уровням иерархии Хомского . Согласно этой иерархии:

  1. Стандартные многослойные перцептроны (MLP) соответствуют конечным автоматам.
  2. Рекуррентные сети (RNN) способны порождать регулярные языки.
  3. На вершине находятся рекурсивно перечислимые языки, распознаваемые машинами Тьюринга .

Валид Саба отмечает, что сторонники LLM часто используют аргумент об «аппроксимации» . Они утверждают, что если Трансформеры могут имитировать рекурсивно перечислимые языки на достаточном для практических нужд уровне сложности, то в полноценных машинах Тьюринга нет необходимости. Однако Саба считает этот вопрос открытым: можно ли считать аппроксимацию бесконечного множества (каким является человеческий язык) эквивалентом самого множества ? По его мнению, «аппроксимация бесконечности» — это концептуальное противоречие .

💻 «Практическая бесконечность»: пример с компилятором Python 9:35

В дискуссии поднимается критика со стороны таких учёных, как Педро Домингос, которые скептически относятся к апелляциям к «бесконечности» в ИИ, считая их абстрактными и практически бесполезными . Валид Саба категорически не согласен с такой позицией, приводя в пример работу любого компилятора .

Аргументы Сабы о реальности бесконечности в программировании:

🗣️ Почему язык — это не статистика, а логика 11:54

Обсуждая естественный язык, Саба ссылается на Ноама Хомского, который называл попытки вычислить вероятность предложения бессмысленными . По мнению гостя, когда человек идет по улице, он не может предсказать, что скажет ему случайный прохожий, используя вероятностные модели .

Ключевые тезисы Валида Сабы о языке:

  1. Проблема нулевой вероятности: Любое конкретное предложение из бесконечного набора имеет вероятность, стремящуюся к нулю . Следовательно, статистическое предсказание следующего токена — это лишь попытка угадать результат в системе, где пространство вариантов бесконечно.
  2. Универсальность: Тот же принцип бесконечности, что применим к Python, применим и к SQL, и к естественному языку . Мы должны быть готовы к бесконечному набору объектов, которые нам могут предъявить.
  3. Остановка и регресс: Проблема остановки в вычислениях напрямую сводится к бесконечному регрессу . Попытка написать программу, проверяющую завершаемость другой программы, ведет в бесконечность, если только мы не начнем снова использовать аппроксимацию .

В завершение беседы Валид Саба подчеркивает, что хотя современные LLM демонстрируют впечатляющие результаты в тестах, их реальная проверка «в дикой природе» (in the wild) ещё впереди . По его мнению, пользователи часто склонны переоценивать модели, игнорируя их фундаментальные ограничения в угоду кратковременному вау-эффекту .

💬 Цитаты

«Рекурсия — это модель вычислений, а не просто конструкция повторения.»

Валид Саба 2:00

«Компилятор Python готов к бесконечному количеству программ — это практическая бесконечность на вашем компьютере каждое утро.»

Валид Саба 11:27

«Вы можете аппроксимировать бесконечность, но не звучит ли это глупо?»

Валид Саба 15:43
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Рекуррентность
Простое повторение процесса или цикла без строгих семантических правил остановки.
Рекурсия
Метод определения функции, при котором она вызывает саму себя, базирующийся на наличии базового случая и индуктивном шаге.
Иерархия Хомского
Классификация формальных грамматик, определяющая их вычислительную сложность и типы порождаемых языков.
Проблема остановки
Классическая задача теории алгоритмов о невозможности создать программу, которая для любого алгоритма определит, завершится он или будет работать вечно.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Валид Саба Machine Learning Street Talk рекурсия иерархия Хомского ChatGPT