Кевин Эллис и Зенна Таварес о будущем AI: почему имитации недостаточно для создания мировых моделей

Machine Learning Street Talk 21,7 тыс. 1 ч 16 мин 4 мин 08.04.2025
Главное

В новом эпизоде подкаста Machine Learning Street Talk специалисты по синтезу программ Кевин Эллис и Зенна Таварес обсуждают фундаментальные ограничения современных нейросетей и объясняют, почему будущее искусственного интеллекта лежит в плоскости программного синтеза и построения «моделей мира». Основная идея дискуссии заключается в переходе от масштабного обучения на основе имитации (imitation learning) к системам, способным формировать гипотезы и строить абстракции из ограниченного набора данных, подобно тому, как это делает человек.

🧠 Проклятие композициональности и «бытовая наука» 0:00

Одной из центральных тем обсуждения стало понятие композициональности — способности строить сложные структуры из простых «атомарных» блоков знаний . По мнению Кевина Эллиса, это «обоюдоострый меч». С одной стороны, композициональность позволяет экстраполировать знания на новые ситуации, находящиеся далеко за пределами обучающей выборки . С другой стороны, она ведет к тому, что психолог Элизабет Спелке называет «проклятием композиционального разума» .

Суть этого проклятия заключается в следующем:

Зенна Таварес дополняет это концепцией «бытовой науки» (everyday science). Он утверждает, что принципы, по которым ребенок или взрослый разбирается с устройством новой микроволновки или кондиционера в отеле, идентичны принципам «настоящей» большой науки . Это процесс формирования гипотез, их проверки через взаимодействие с миром и коррекции убеждений на основе полученных данных .

💻 Индукция против Трансдукции: эксперименты с ARC 12:57

Собеседники подробно разобрали свою недавнюю работу, посвященную тесту ARC (Abstraction and Reasoning Corpus) Франсуа Шолле. В этом исследовании они сравнили два принципиально разных подхода к решению задач на логическое обобщение :

  1. Индуктивный подход: система генерирует явный программный код (на Python), который описывает правило трансформации. Этот метод позволяет проверить правильность гипотезы на обучающих примерах перед применением к тестовым .
  2. Трансдуктивный подход: нейросеть (в данном случае Llama 3 8B) напрямую выдает ответ в виде сетки пикселей, без промежуточного кода. Этот метод опирается на «интуицию» весов модели .

Кевин Эллис отмечает любопытный факт из когнитивной психологии: в некоторых задачах, если попросить человека «думать усерднее» и вербализировать решение, результаты становятся хуже . Аналогичный эффект наблюдается и у ИИ:

Итоговое решение исследователей представляло собой ансамбль: сначала система пытается найти программное решение (индукция), и только если оно не проходит проверку, «откатывается» к интуитивному ответу нейросети (трансдукция) .

🌙 Фаза сна и бодрствования: алгоритм DreamCoder 30:43

Кевин Эллис рассказал о философии своего известного алгоритма DreamCoder, который использует метафору «сна» и «бодрствования» для обучения систем программного синтеза :

Зенна Таварес подчеркивает, что современные большие языковые модели позволяют реализовать этот процесс более гибко. Вместо жестко заданных библиотек можно использовать нейросетевые веса для хранения «мягких» абстракций, которые затем материализуются в код через контекстное обучение (in-context learning) .

🛠 Почему Python лучше лямбда-исчисления? 25:23

В ходе дискуссии был поднят вопрос о выборе языка для представления знаний. Ранее в академических работах по программному синтезу доминировало лямбда-исчисление. Однако Кевин Эллис утверждает, что Python оказался гораздо эффективнее .

Основные аргументы в пользу Python:

Зенна Таварес видит будущее в создании «полиструктурных» систем, где сосуществуют несколько моделей реальности на разных уровнях абстракции: от низкоуровневой физики до высокоуровневых логических правил .

🚀 Проект MARA и будущее «бытовой науки» 1:11:41

В финале встречи гости анонсировали запуск проекта MARA (Modeling, Abstraction, Reasoning, Agency) на базе некоммерческой организации BASIS . Это трехлетняя исследовательская программа, целью которой является создание агентов, способных активно изучать мир.

Ключевые принципы MARA:

  1. Активное обучение: агент не просто пассивно получает данные, а «тыкает» в объекты и нажимает на кнопки, чтобы понять реакцию среды .
  2. Поиск абстракций «на лету»: система должна сама решать, какие детали мира игнорировать (например, цвет волос в модели распространения вируса), а какие считать критически важными .
  3. Выход за пределы ARC: создание новых бенчмарков, которые требуют не просто статического решения задачи по картинке, а полноценного взаимодействия с интерактивной средой .

Кевин Эллис резюмирует, что этот путь сложен с вычислительной точки зрения, но он необходим для создания ИИ, который сможет ориентироваться в незнакомых ситуациях — будь то робот, впервые видящий новую модель посудомоечной машины, или цифровая система навигации по незнакомому веб-интерфейсу .

💬 Цитаты

«Обладание бесконечным количеством концепций, выразимых на врожденном языке, приведет к проклятию композиционального разума.»

Элизабет Спелке (цитирует Кевин Эллис) 8:24

«Программы на Python — это отличный способ представления знаний, потому что они заставляют систему обобщать, а не просто интерполировать данные.»

Кевин Эллис 21:13

«Принципы формирования гипотез в обычной жизни такие же, как в большой науке. Мы называем это «бытовой наукой».»

Зенна Таварес 1:13:49
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
ARC (Abstraction and Reasoning Corpus)
Бенчмарк для проверки способности ИИ к логическому обобщению на основе визуальных сеток.
Трансдукция
Метод решения задачи, при котором ответ выдается напрямую на основе сходства с известными примерами, без построения общего правила.
Индукция
Процесс вывода общего правила или алгоритма (в данном случае — кода) из конкретных примеров.
Композициональность
Принцип, согласно которому значение сложного выражения определяется значениями его частей и правилами их соединения.
DSL (Domain Specific Language)
Специализированный язык программирования, оптимизированный для решения узкого круга задач.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Кевин Эллис Зенна Таварес программный синтез ARC benchmark DreamCoder