Крис Лу и Роберт Ланге: «ИИ должен искать новые идеи самостоятельно»

🤖 Эволюция автоматизированной науки: когда ИИ начинает исследовать сам себя 0:00

Исследователи искусственного интеллекта Крис Лу (Университет Оксфорда), Роберт Ланге (TU Berlin, Sakana AI) и Цун Лу (Университет Британской Колумбии) в интервью каналу Machine Learning Street Talk обсуждают новую парадигму в разработке алгоритмов, где большие языковые модели (LLM) выступают не просто инструментом для генерации текста, а активными участниками научного поиска. Главная идея заключается в использовании языковых моделей для автоматического создания, оптимизации и оценки новых методов обучения, что позволяет выйти за рамки человеческих интуиций и ускорить темпы научных открытий.

🔬 Дискретность против интуиции: новые методы оптимизации 2:09

Крис Лу и Роберт Ланге представили подход, в котором LLM используются для «изобретения» алгоритмов оптимизации предпочтений (как, например, в их работе Discovering Preference Optimization Algorithms). Вместо того чтобы полагаться на ручную разработку функций потерь экспертами, исследователи поручают эту задачу модели.

Механизм работы: Исследователи используют LLM как «интеллектуальный мутационный оператор», который генерирует фрагменты кода (целевые функции). Модель анализирует комбинации техник (например, регуляризацию или сглаживание) и пробует новые конфигурации.
Результаты: В одном из экспериментов модель обнаружила «экспоненциальную функцию потерь», которую ранее редко использовали в одиночку, но которая показала высокую эффективность в комбинациях.
Интерпретируемость: По словам Роберта Ланге, такие функции обычно занимают 5–8 строк кода, что делает их доступными для понимания человеком, в отличие от «черных ящиков» в виде весов нейронных сетей.

По мнению гостей, LLM демонстрируют «интеллектуальное исследование» пространства алгоритмов, смешивая концепции из разных дисциплин (физика, химия, экономика), к которым у человека в узкой области машинного обучения может не быть доступа.

🏗️ Автоматизированные агентные системы (ADIS) 48:17

Цун Лу обсудил свою работу Automated Design of Agentic Systems (ADIS). Если раньше агентные системы (например, инструменты для литературого обзора) создавались вручную месяцами, то теперь ИИ может «проектировать» другие ИИ-системы, перебирая огромные пространства промптов и рабочих процессов.

Архитектурные находки: Система обнаружила, что для решения сложных задач эффективны многошаговые цепочки, включающие «экспертов» по разным аспектам: эффективности, читаемости и точности кода.
Композиционность: Использование кода как примитива позволяет создавать модульные структуры, которые легче «сшивать» между собой, чем чисто нейронные компоненты.
Энтропия: Гости подчеркивают важность «инъекции» случайности (энтропии) в систему, чтобы избежать коллапса модели и поощрить поиск нестандартных решений.

🎮 Интеллектуальный «Go-Explore» и вкус к открытиям 1:09:31

Цун Лу рассказал об адаптации известного алгоритма Go-Explore (2017) для современных моделей. В классическом RL-обучении (например, в игре Montezuma’s Revenge) была нужна кропотливая ручная разработка «функции интересности».

Новый подход: Исследователи используют «нюх» (intuition) языковой модели на то, что является перспективным состоянием или интересным объектом.
Масштабируемость: Этот принцип может быть применен к научным исследованиям как к задаче поиска в огромном пространстве, где «интересные состояния» — это новые гипотезы или данные.

📜 «ИИ-ученый»: к полной автоматизации науки 1:20:01

Проект The AI Scientist — попытка автоматизировать весь цикл научной работы: от идеи до написания статьи и рецензирования.

Этапы: Генерация идеи → написание кода → эксперимент → написание текста статьи.
Критика и контраргументы: Критики отмечают, что наука — это не только публикация результата, но и физический процесс обучения через провалы и обсуждения. Гости признают этот аргумент: нынешние системы линейны, тогда как 80% времени реального ученого уходит на выдвижение и отбраковку гипотез.
Видение будущего: Крис Лу и Роберт Ланге мечтают о «полностью ИИ-конференциях», где модели не только пишут статьи, но и проводят взаимное рецензирование, создавая новую культуру фильтрации знаний.

По мнению участников дискуссии, даже если мы не понимаем «аллиенность» (нечеловеческую природу) решений ИИ, мы можем использовать их результаты так же, как используем данные с мощных телескопов, к разрешающей способности которых наши органы чувств не приспособлены.