Крис Лу и Роберт Ланге: «ИИ должен искать новые идеи самостоятельно»

Machine Learning Street Talk 27 тыс. 1 ч 37 мин 3 мин 01.03.2025
Главное

🤖 Эволюция автоматизированной науки: когда ИИ начинает исследовать сам себя 0:00

Исследователи искусственного интеллекта Крис Лу (Университет Оксфорда), Роберт Ланге (TU Berlin, Sakana AI) и Цун Лу (Университет Британской Колумбии) в интервью каналу Machine Learning Street Talk обсуждают новую парадигму в разработке алгоритмов, где большие языковые модели (LLM) выступают не просто инструментом для генерации текста, а активными участниками научного поиска. Главная идея заключается в использовании языковых моделей для автоматического создания, оптимизации и оценки новых методов обучения, что позволяет выйти за рамки человеческих интуиций и ускорить темпы научных открытий.


🔬 Дискретность против интуиции: новые методы оптимизации 2:09

Крис Лу и Роберт Ланге представили подход, в котором LLM используются для «изобретения» алгоритмов оптимизации предпочтений (как, например, в их работе Discovering Preference Optimization Algorithms). Вместо того чтобы полагаться на ручную разработку функций потерь экспертами, исследователи поручают эту задачу модели.

По мнению гостей, LLM демонстрируют «интеллектуальное исследование» пространства алгоритмов, смешивая концепции из разных дисциплин (физика, химия, экономика), к которым у человека в узкой области машинного обучения может не быть доступа.


🏗️ Автоматизированные агентные системы (ADIS) 48:17

Цун Лу обсудил свою работу Automated Design of Agentic Systems (ADIS). Если раньше агентные системы (например, инструменты для литературого обзора) создавались вручную месяцами, то теперь ИИ может «проектировать» другие ИИ-системы, перебирая огромные пространства промптов и рабочих процессов.


🎮 Интеллектуальный «Go-Explore» и вкус к открытиям 1:09:31

Цун Лу рассказал об адаптации известного алгоритма Go-Explore (2017) для современных моделей. В классическом RL-обучении (например, в игре Montezuma’s Revenge) была нужна кропотливая ручная разработка «функции интересности».


📜 «ИИ-ученый»: к полной автоматизации науки 1:20:01

Проект The AI Scientist — попытка автоматизировать весь цикл научной работы: от идеи до написания статьи и рецензирования.

По мнению участников дискуссии, даже если мы не понимаем «аллиенность» (нечеловеческую природу) решений ИИ, мы можем использовать их результаты так же, как используем данные с мощных телескопов, к разрешающей способности которых наши органы чувств не приспособлены.

💬 Цитаты

«Модели могут генерировать идеи так же успешно, как и люди-исследователи.»

«Мы используем LLM как своего рода очень сильный и интеллектуальный мутационный оператор.»

Роберт Ланге 5:43

«Может быть, в будущем PhD-студенты будут больше похожи на нынешних профессоров, которые консультируют большую группу «ИИ-ученых».»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Blackbox optimization
Метод оптимизации, при котором алгоритм не знает структуры целевой функции и действует через пробы.
In-context learning
Способность модели обучаться или решать задачи на основе контекста из промпта без обновления весов.
Mode collapse
Ситуация, когда генеративная модель перестает выдавать разнообразие и начинает повторять одни и те же ограниченные типы ответов.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Sakana AI The AI Scientist LLM автоматизация науки