Чэнлэй Си: «9 из 10 лучших научных идей в нашем тесте сгенерировал ИИ»

The Cognitive Revolution 1,5 тыс. 1 ч 23 мин 5 мин 23.10.2024
Главное

В области искусственного интеллекта автоматизация научных исследований считается «святым граалем». Если ИИ сможет самостоятельно генерировать, проверять и внедрять новые идеи, это откроет путь к рекурсивному самосовершенствованию и потенциальному взрыву интеллекта. В новом эпизоде подкаста The Cognitive Revolution ведущий Натан Лабенц обсуждает с Чэнлэем Си (Chenglei Si), докторантом Стэнфордского университета, его прорывное исследование о способности больших языковых моделей (LLM) создавать инновационные научные концепции.

🧬 Автоматизация науки: от помощника до полноценного исследователя 5:43

Чэнлэй Си начал заниматься исследованиями в области обработки естественного языка (NLP) ещё во время бакалавриата, а перейдя в Стэнфорд, решил сфокусироваться на амбициозной цели — полной автоматизации научного процесса . По мнению Чэнлэя Си, современные модели достигли уровня, когда они могут не просто помогать в написании кода или поиске литературы, но и предлагать гипотезы, которые ранее считались прерогативой человеческого интеллекта .

Этот интерес подогревается дискуссиями о «ситуационной осведомленности» (situational awareness) и прогнозами о достижении уровня «автоматизированного Алека Рэдфорда» (ведущего автора работ по GPT в OpenAI) к 2028 году . Чэнлэй Си отмечает, что хотя полная автоматизация учёного такого калибра — задача экстремальной сложности, его исследование ставит более приземлённую, но важную цель: сравнить возможности ИИ с уровнем среднестатистического аспиранта (PhD student) ведущих вузов .

В контексте предыдущих работ собеседники выделяют несколько ключевых вех:

🧪 Методология: ИИ против 100 докторантов 25:54

Для получения объективного ответа на вопрос о креативности ИИ, Чэнлэй Си и его коллеги организовали масштабное исследование, на которое ушло около года . В эксперименте участвовали более 100 исследователей в области NLP, преимущественно докторантов .

Механика исследования включала три ветки генерации идей:

  1. Человеческие идеи: участники получали $300 за участие и боролись за призы в $1000 за лучшие предложения .
  2. Идеи ИИ (Claude 3.5 Sonnet): модель генерировала тысячи идей, которые затем ранжировались самой системой .
  3. Идеи ИИ + переранжирование человеком: Чэнлэй Си лично просматривал сгенерированные ИИ варианты, чтобы отобрать лучшие, так как автоматическое ранжирование всё ещё несовершенно .

Чтобы избежать предвзятости рецензентов, все идеи проходили через «агента по стилю» . Этот агент приводил тексты к единому академическому формату, исправляя грамматические ошибки людей и сглаживая специфические «маркеры» ИИ-текста, такие как частое использование слова "delve" .

Конвейер генерации ИИ

Процесс создания идей моделью Claude 3.5 Sonnet был многоступенчатым :

Чэнлэй Си отмечает поразительный уровень избыточности: из 4000 сгенерированных ИИ идей только около 200 оказались уникальными и содержательными . Стоимость получения одной качественной идеи составила около нескольких долларов в токенах API .

📊 Результаты: превосходство в новизне и азарте 56:38

Оценка идей проводилась экспертами вслепую по пяти критериям: новизна, «увлекательность» (excitement), осуществимость (feasibility), эффективность и общая оценка . Результаты оказались неожиданными для многих скептиков.

Ключевые цифры исследования:

Чэнлэй Си характеризует идеи ИИ как более «нестандартные» (out-of-the-box). В то время как люди склонны предлагать инкрементальные улучшения существующих методов, ИИ чаще выдаёт концепции, менее привязанные к текущей литературе, что эксперты воспринимают как более высокую новизну .

Одним из примеров «умной» идеи от Claude 3.5 Sonnet стал метод калибровки неопределённости моделей. Вместо простого голосования большинством ИИ предложил строить граф отношений между ответами и использовать метрики центральности графа для оценки достоверности .

⚖️ Проблема оценки и «галлюцинации одобрения» 1:01:50

Несмотря на триумфальные цифры, авторы признают наличие серьёзных методологических вызовов. Оценка научных идей — крайне субъективный процесс. Исследование показало, что корреляция между рецензентами-людьми составляет около 66-71%, в то время как ИИ-рецензенты соглашаются с людьми лишь в 56% случаев .

Существует риск «сикофантства» или подстройки под ожидания: модели могут использовать слова-маркеры, которые звучат инновационно, фактически не предлагая ничего ценного . Однако Чэнлэй Си парирует это тем, что использование единого стиля для всех участников должно было минимизировать этот эффект .

Ещё один важный нюанс — уровень человеческой базы. Чэнлэй Си признаёт, что идеи докторантов, предложенные «на ходу» за вознаграждение, могут не отражать пик человеческой гениальности. В будущем он планирует сравнить генерации ИИ со статьями, уже принятыми на топовые конференции, такие как ACL или NeurIPS .

🚀 Будущее: агенты-исполнители и модель o1 1:18:43

Следующим шагом Чэнлэй Си называет переход от генерации идей к их автоматическому исполнению. Сейчас его команда запускает проект по реализации предложенных идей в реальный код и эксперименты .

Проблемы текущих агентов-исполнителей:

Натан Лабенц предполагает, что новая серия моделей OpenAI o1 с улучшенным рассуждением (reasoning) может радикально изменить ситуацию как в генерации, так и в оценке идей . По мнению ведущего, способность o1 критиковать собственные подходы и предлагать лучшие альтернативы в кодинге уже сейчас впечатляет .

Чэнлэй Си даёт амбициозный прогноз: достижение «момента эврики» — когда система полностью автономно создаст проект, который получит награду "Best Paper" на крупной конференции — может занять от 3 до 4 лет . По его словам, средний уровень публикаций ИИ может достичь уже в ближайшее время .

💬 Цитаты

«Если мы объединим генерацию идей с автоматическим исполнением и масштабируем это, мы сможем найти идеи уровня Best Paper, которые реально работают.»

«Среди топ-10 идей девять были от ИИ и только одна от человека.»

👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Рекурсивное самосовершенствование
Процесс, при котором ИИ использует свои способности для создания ещё более совершенных версий самого себя.
Сикофантство (Sycophancy)
Склонность модели поддакивать пользователю или выдавать ответы, которые кажутся привлекательными, вместо объективно верных.
Inference scaling
Улучшение результатов модели за счёт увеличения вычислительных затрат на этапе генерации ответа (например, через многократные попытки).
📊 Цифры
🗓 Хронология
  1. 2023 Чэнлэй Си поступает в Стэнфорд и начинает проект по автоматизации науки.
  2. Октябрь 2024 Публикация исследования и обсуждение результатов в подкасте.
  3. 2028 Прогнозируемый Леопольдом Ашенбреннером срок появления 'автоматизированного Алека Рэдфорда'.
⚖️ Другая сторона
Искусственный интеллект Чэнлэй Си Claude 3.5 Sonnet автоматизация исследований OpenAI o1 The Cognitive Revolution