Францен и Диссельхофф: «LLM — слишком мощные инструменты для ARC»

Machine Learning Street Talk 19,5 тыс. 1 ч 8 мин 3 мин 12.02.2025
Главное

Архитекторы победы: как Даниэль Францен и Ян Диссельхофф покорили ARC Prize 2024 0:00

Победители конкурса ARC Prize 2024 Даниэль Францен и Ян Диссельхофф рассказали о своем подходе к решению задач на абстрактное мышление (ARC), который позволил им обойти конкурентов. Их стратегия сочетала использование языковых моделей (LLM) с инновационными методами поиска и самооценки, что позволило достичь высоких результатов в задачах, которые изначально считались невыполнимыми для таких моделей. Исследователи основали новую лабораторию Tufa Labs в Цюрихе, чтобы продолжать работу в области фундаментальных исследований ИИ.

🤖 Гибкость языковых моделей и «тестовое обучение» 0:27

Разработчики начали работу с попыток тонкой настройки (fine-tuning) большой языковой модели, но вскоре поняли, что для достижения успеха необходимы дополнительные вычислительные шаги вне самой модели.

🌳 Поиск по дереву и эффективность генерации 14:08

Для генерации ответов команда разработала собственный алгоритм поиска в глубину (Depth First Search, DFS), который оказался эффективнее стандартного поиска по лучу (beam search).

🧐 Самопроверка через аугментацию 24:13

Одной из самых сложных задач стал выбор правильного кандидата из множества сгенерированных ответов. Авторы решили использовать саму модель для оценки качества предложенных ею решений.

🧠 Обучение и будущее ИИ 34:34

В ходе дискуссии спикеры затронули фундаментальные вопросы архитектуры ИИ. Они отметили, что их итоговая модель была «лоботомирована» — у нее удалили все языковые способности, оставив только возможность оперировать числами 0–9 и служебными токенами для ARC, что значительно сэкономило ресурсы.

💬 Цитаты

«Мы используем тот факт, что языковая модель несовершенна в 2D-задачах.»

Даниэль Францен 28:04

«LLM — слишком сильные решатели задач для этого конкурса, чтобы позволить любому другому методу выиграть.»

Ян Диссельхофф 42:47
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
ARC
Конкурс по абстрактному мышлению, где модели должны решать задачи на преобразование визуальных сеток.
DFS
Алгоритм поиска в глубину, использованный для навигации по дереву решений модели.
Lora
Метод адаптации больших моделей через обучение двух небольших матриц вместо всей сети целиком.
Аугментация
Создание новых примеров задачи (вращение, сдвиг) для улучшения обучения и проверки гипотез.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект ARC Prize Llama 3.2 Tufa Labs Depth First Search Даниэль Францен