Франсуа Шолле о тупике LLM: почему масштаб не равен интеллекту

Machine Learning Street Talk 123 тыс. 46 мин 3 мин 12.10.2024
Главное

Абстракция вместо масштабирования: почему LLM всё еще далеки от AGI 0:00

Несмотря на бум вокруг больших языковых моделей (LLM) и их способность демонстрировать выдающиеся результаты на стандартизированных тестах, современный искусственный интеллект все еще не достиг уровня настоящего общего интеллекта (AGI). По мнению Франсуа Шолле, ведущего исследователя в области ИИ, главная проблема заключается в том, что индустрия ошибочно делает ставку на масштабирование вычислений и объема данных, упуская из виду фундаментальный механизм познания — способность к абстракции и генерации новых программ «на лету».

📉 Парадокс «умных» моделей 1:33

Период начала 2023 года запомнился как пик хайпа вокруг AGI. ChatGPT и GPT-4 преподносились как системы, способные заменить врачей, юристов и программистов. Однако, если отбросить маркетинговую риторику, текущие модели демонстрируют лишь ограниченную функциональность.

Основные ограничения LLM, которые остаются неизменными с момента появления трансформеров пять лет назад:

По словам Шолле, сегодня над аннотированием данных для обучения LLM работают от 10 000 до 30 000 человек, что делает прогресс крайне зависимым от ручного труда и «хрупким».

🧠 Интеллект — это не набор навыков 12:04

Ключевой тезис Шолле: навык — это не интеллект. В отличие от «минскианского» подхода, где ИИ — это система для выполнения набора ценных экономических задач, Шолле предлагает смотреть на интеллект как на процесс.

Автор проводит аналогию: дорожная сеть (множество готовых путей) не равна дорожно-строительной компании (механизму, который создает пути на лету). Современные LLM — это «дорожная сеть», работающая в строго ограниченном пространстве familiar (знакомых) задач.

🧩 Тест на интеллект нового поколения: ARC-AGI 19:59

Для измерения реальной способности к обобщению Шолле разработал датасет ARC-AGI (Abstraction and Reasoning Corpus for Artificial General Intelligence). В отличие от стандартных экзаменов, ARC невозможно «зазубрить», так как каждая задача в нем уникальна.

🏗️ Путь к AGI: синтез интуиции и рассуждения 31:12

Шолле выделяет два типа абстракции:

  1. Value-centric (тип 1): Интуиция, основанная на сравнении расстояний в непрерывном пространстве. Трансформеры в этом превосходны.
  2. Program-centric (тип 2): Логический вывод, основанный на дискретном манипулировании программами. Это слабое место текущих LLM.

Для создания AGI необходимо объединить эти подходы. Deep Learning (интуиция) может выступать как «навигатор», который помогает эффективно искать решения в пространстве дискретных программ, преодолевая проблему комбинаторного взрыва.

В заключение Шолле отмечает: попытки просто увеличивать масштаб текущих моделей — это тупиковый путь. Прорыв, скорее всего, придет от «аутсайдеров», которые предложат архитектурные идеи, выходящие за рамки чистого аппроксимирующего криволинейного обучения.

💬 Цитаты

«Если есть просто один момент, который вы должны вынести из этого разговора, так это то, что навык — это не интеллект.»

Франсуа Шолле 13:36

«Атрибуция интеллекта кристаллической поведенческой программе — это категориальная ошибка. Вы путаете результат процесса с самим процессом.»

Франсуа Шолле 14:21

«Моя ставка в том, что следующий прорыв, скорее всего, придет от аутсайдера, пока все крупные лаборатории заняты обучением более крупных LLM.»

Франсуа Шолле 45:48
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
AGI (Artificial General Intelligence)
Искусственный интеллект общего уровня, способный эффективно решать любые задачи на уровне человека или выше.
Комбинаторный взрыв
Проблема в информатике, при которой количество вариантов поиска решения растет настолько быстро, что их невозможно перебрать за разумное время.
Трансформер
Архитектура нейронных сетей, лежащая в основе большинства современных LLM, использующая механизм внимания.
Синтез программ
Область ИИ, направленная на автоматическую генерацию кода (программ) для решения поставленных задач.
RLHF
Метод обучения моделей с помощью обратной связи от людей для настройки их ответов.
📊 Цифры
🗓 Хронология
  1. 2020 год Проведено первое соревнование на датасете ARC на платформе Kaggle.
  2. февраль 2023 года Пик хайпа вокруг AGI после выхода ChatGPT и GPT-4.
  3. июнь 2026 года Запуск более масштабного конкурса ARC Prize.
⚖️ Другая сторона
Искусственный интеллект Франсуа Шолле ARC-AGI LLM AGI Program Synthesis