Алессандро Померини о декомпиляции знаний и будущем ИИ

Machine Learning Street Talk 17,4 тыс. 51 мин 2 мин 19.10.2024
Главное

Новый взгляд на ARC: как декомпиляция знаний ускоряет обучение ИИ 0:00

Традиционные подходы к измерению интеллекта ИИ часто путают навыки с эффективностью обучения. В недавнем выпуске Machine Learning Street Talk исследователь Алессандро Померини (Alessandro Pomerini) из Института Санта-Фе представил новый метод, который может кардинально изменить подход к задаче ARC (Abstraction and Reasoning Corpus) Франсуа Шолле. В центре дискуссии — идея о том, что истинный интеллект заключается не в объёме накопленных знаний, а в способности эффективно использовать имеющиеся данные для приобретения новых навыков.

Различие между мастерством и интеллектом 6:33

Померини, опираясь на взгляды Шолле, подчеркивает фундаментальный разрыв между «выдачей результата» (skill) и «процессом обучения» (intelligence).

По мнению Померини, интеллект — это коэффициент того, насколько эффективно система преобразует исходные данные (опыт или априорные знания) в прикладные навыки.

ARC и «core knowledge» 10:42

Benchmark ARC был создан Шолле как противовес бенчмаркам, измеряющим просто performance. Задача состоит из 1000 заданий, где для каждого дано лишь 2–3 примера трансформации пиксельных сеток.

DreamCoder и «декомпиляция» знаний 19:20

Померини работает с алгоритмом DreamCoder (разработанным Кевином Эллисом и группой Джоша Тененбаума в MIT), который является системой индуктивного синтеза программ.

Инновация Померини: Он предложил метод декомпиляции знаний, при котором выбор компонентов для «чанкинга» основан не просто на частоте использования, а на вероятностной модели полезности, извлеченной из весов нейронной сети. Это позволяет системе быстрее находить решения, обучаясь на «фэнтезийных» примерах, созданных самой моделью.

Будущее и вызовы 47:53

Хотя многие участники соревнования ARC сегодня используют большие языковые модели (LLM), Померини считает, что это противоречит духу оригинального бенчмарка. Его личный подход, который он планирует реализовать, отходит от прямого поиска в пространстве программ в пользу иной комбинаторной структуры.

Главный риск метода — «плато», когда имеющиеся примитивы в библиотеке не позволяют найти решение, выходящее за рамки заданного пространства программ. Тем не менее, Померини настроен оптимистично и надеется подготовить решение к ноябрьскому дедлайну.

💬 Цитаты

«Интеллект — это эффективность, с которой вы можете превратить исходную информацию в новые навыки.»

Алессандро Померини 0:00

«Научные теории не выводятся из наблюдений, они тестируются наблюдениями.»

Алессандро Померини 15:03
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
ARC
Abstraction and Reasoning Corpus — бенчмарк для проверки способности ИИ к абстрактному мышлению.
Индуктивный синтез программ
область ИИ, где система автоматически генерирует программы, соответствующие заданному поведению (вводу-выводу).
Чанкинг (Chunking)
процесс объединения мелких функций в более крупные блоки для упрощения поиска решений.
Эпистемология
раздел философии, изучающий, как мы получаем знания и как строим теории.
Амортизированный вывод
метод в машинном обучении, позволяющий использовать одну функцию (нейросеть) для предсказания параметров распределения для огромного количества задач.
📊 Цифры
🗓 Хронология
  1. 2025 Окончание бакалавриата в Университете Эдинбурга.
  2. 2025 Начало стажировки в Институте Санта-Фе под руководством Мелани Митчелл.
  3. Ноябрь 2026 Планируемый дедлайн для подачи решения задачи ARC.
⚖️ Другая сторона
Искусственный интеллект ARC DreamCoder Алессандро Померини Франсуа Шолле индуктивный синтез программ