Клемент Бонне о подходе Latent Program Networks: «LLM экспоненциально не креативны»

Machine Learning Street Talk 16,2 тыс. 51 мин 3 мин 19.02.2025
Главное

Революция в абстрактном мышлении ИИ: подход Latent Program Networks 🚀 0:00

Исследователь Клемент Бонне (Clement Bonnet) представляет новый подход к решению задач на абстрактное мышление и рассуждение (benchmark Abstraction and Reasoning Corpus, ARC), который кардинально отличается от доминирующих сегодня методов обучения больших языковых моделей (LLM). В отличие от систем, основанных на «грубой силе» и гигантских массивах интернет-данных, проект Бонне — Latent Program Networks — фокусируется на обучении компактному латентному пространству, которое позволяет эффективно искать решения программных задач непосредственно во время тестирования.

🧠 Проблема «закрытых» тестов и ограничения нейросетей 5:00

Основная трудность ARC заключается в том, что этот бенчмарк специально разработан Франсуа Шолле для предотвращения «зубрежки». Задачи в нем по своей природе новы и не встречаются в тренировочных наборах данных, доступных в интернете.

🛠 Архитектура Latent Program Networks: как это работает 13:30

В основе подхода лежит идея поиска в пространстве программ, но не в классическом смысле генерации кода, а в поиске наиболее подходящего скрытого представления (латентного вектора).

  1. Энкодер и Декодер: Модель использует вариационный автокодировщик (VAE), где энкодер переводит пары «вход-выход» в распределение программ в латентном пространстве.
  2. Тестовый поиск: Главная инновация — использование оптимизации прямо во время работы (at test time). Модель делает начальный «интуитивный» прогноз (как человек), а затем уточняет его с помощью градиентного спуска, чтобы найти решение, лучше всего соответствующее всем примерам задачи.
  3. Приоритет сжатия: Бонне убежден, что ключом является сжатие (compression). Компактное представление программы — это мощный инструмент для эффективного поиска решения.

🔍 Эксперименты и результаты 23:05

Вопреки догмам современной индустрии, Бонне не использовал предобученные LLM.

🔮 Будущее: композиционность и креативность ИИ 32:00

Дискуссия также затронула вопрос о том, может ли ИИ быть по-настоящему креативным или он просто выполняет статистический перебор.

💬 Цитаты

«LLM экспоненциально не креативны. Вам нужно экспоненциально больше сэмплов, чтобы сделать их креативными.»

Клемент Бонне 44:15

«Я большая сторонник поиска небольших повторений, которые могли бы объяснить ваши выходные данные.»

Клемент Бонне 0:54
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
ARC (Abstraction and Reasoning Corpus)
Бенчмарк для проверки способности ИИ адаптироваться к совершенно новым задачам, не используя предварительные знания из интернета.
Латентное пространство
Многомерное пространство, в которое сжимаются сложные данные (например, логика программы) для упрощения манипуляций с ними.
Индукция
Метод, при котором система выводит общие правила или сжатые представления (программы) из частных данных.
Трансдукция
Метод, при котором предсказание делается непосредственно на основе имеющихся данных без промежуточного создания модели или программы.
Вариационный автокодировщик (VAE)
Тип архитектуры, который обучается сжимать данные в структуру распределений, что делает латентное пространство более упорядоченным.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Latent Program Networks Clement Bonnet Abstraction and Reasoning Corpus ARC трансформеры