Валид Саба о пределах глубокого обучения: «Нейросети — это лишь хеш-таблицы»

Machine Learning Street Talk 9,3 тыс. 1 ч 42 мин 2 мин 07.03.2022
Главное

Философия «наивной физики» против диктата больших данных 🧠 3:48

В центре дискуссии между ведущим Machine Learning Street Talk Тимом Скарфом и приглашенным экспертом, ученым-когнитивистом Валидом Саба, стоит фундаментальный вопрос: можно ли достичь истинного понимания языка (NLU) исключительно через статистические методы глубокого обучения?

Валид Саба занимает позицию радикального скептика по отношению к текущему мейнстриму, называя попытки решить задачу понимания языка через большие языковые модели (LLM) «бесперспективной затеей». По его мнению, современные нейросети по сути являются гигантскими «хеш-таблицами», которые не совершают вычислений, а лишь хранят и извлекают корреляции из обучающей выборки.

Ключевые аргументы Саба:


🏗️ Битва парадигм: Top-Down против Bottom-Up 38:47

Дискуссия затрагивает фундаментальную разницу между двумя подходами к моделированию интеллекта:

  1. Bottom-Up (снизу-вверх): Традиционный подход современного глубокого обучения, где модели учатся на огромных массивах данных, выстраивая статистические представления. Скарф и Саба соглашаются, что это отлично работает в задачах распознавания образов (Computer Vision), где данных много, а структура относительно однородна.
  2. Top-Down (сверху-вниз): Подход, который отстаивает Саба, опираясь на символьную логику. Он утверждает, что для решения таких задач, как создание новых алгоритмов сортировки или понимание естественного языка, невозможно полагаться на статистику,.

По мнению Саба, когда мы пытаемся решить задачу «снизу-вверх», мы попадаем в «неуправляемую бесконечность», тогда как символьная логика позволяет работать с «управляемой бесконечностью»,.


💾 Нейросети как «хеш-таблицы» 14:16

Одной из самых ярких метафор выпуска стало сравнение нейросетей с locality-sensitive hashing (LSH) таблицами. Участники подчеркивают:

Тим Скарф делает важное дополнение: прогресс последних лет во многом связан не столько с «гениальностью» парадигмы обучения, сколько с огромным количеством инженерных решений (ReLU, сверточные слои, облачные вычисления), которые позволяют «сглаживать» ограничения этого подхода.


🔮 Будущее: гибридные системы 55:01

Несмотря на критику, оба участника согласны: текущий путь «чистого» глубокого обучения близок к своему пределу. Саба уверен, что будущее за гибридными системами, где нейронные сети отвечают за низкоуровневое восприятие и распознавание паттернов, а символьная логика берет на себя управление высокоуровневыми смыслами и абстракциями.

Скарф, ссылаясь на исследования в области DreamCoder (индуктивный поиск программ), отмечает, что идеальным будущим для ИИ стали бы системы, способные писать «модульные и переиспользуемые» программы, избегая комбинаторного взрыва. В конечном итоге, дебаты сводятся к признанию того, что ИИ все еще находится на стадии «открытия» метафизических законов, которые уже управляют нашей реальностью, а не их «изобретения».

💬 Цитаты

«По сути, нейросети — это locality-sensitive hashing таблицы.»

Валид Саба 08:43

«Мы даем себе слишком много кредита. Мир работает вопреки нам, а не благодаря нам.»

«Обучение на примерах теоретически возможно, если я смогу прожить 200 миллиардов лет.»

Валид Саба 26:27
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
NLU
Понимание естественного языка, задача создания ИИ, способного понимать человеческую речь так же, как люди.
Winograd Schema Challenge
Тест на здравый смысл, требующий разрешения неоднозначности местоимений в предложении.
Наивная физика
Набор врожденных представлений о физическом мире, которыми обладают дети и которые позволяют им предсказывать поведение объектов.
G-Flow Nets
Архитектура нейронных сетей, ориентированная на генерацию последовательностей решений, обсуждавшаяся как альтернатива простому поиску.
Абдукция
Метод рассуждения, представляющий собой «вывод к лучшему объяснению».
📊 Цифры
🗓 Хронология
  1. 2011 Гектор Левеск впервые предложил Winograd Schema Challenge как тест на здравый смысл.
  2. 1980-е Активное развитие теории когнитивных наук и символьных систем, на которые опирается Валид Саба.
  3. Январь 2026 Съемка эпизода с Валидом Саба в рамках экспериментального формата unplugged.
⚖️ Другая сторона
Искусственный интеллект Walid Saba Deep Learning Natural Language Understanding Symbolic AI GPT-J