Янник Килхер о Promptbreeder: „Система просто переносит проблему в другой домен“

Yannic Kilcher 37,8 тыс. 46 мин 3 мин 07.10.2023
Главное

Автоматизация промпт-инжиниринга: самообучающийся метод Promptbreeder 0:00

Разработчики из Google DeepMind представили систему Promptbreeder — механизм самореферентного самообучения, предназначенный для автоматизации создания и оптимизации промптов для больших языковых моделей (LLM). В отличие от классических методов, где инструкции для моделей пишутся людьми вручную, Promptbreeder использует эволюционный алгоритм, позволяющий моделям самостоятельно эволюционировать, адаптировать свои промпты и даже совершенствовать методы их генерации. По мнению автора видео, исследователя Янника Килхера, хотя представленные результаты выглядят многообещающе, подход переносит проблему ручного проектирования в домен мета-промптов, оставляя открытым вопрос о том, действительно ли система нашла универсальное решение.

Проблема ручных стратегий и автоматизация 2:14

Традиционные методы, такие как Chain-of-Thought (цепочка рассуждений) или побуждение модели «думать пошагово», значительно повышают качество логических задач. Однако разработка подобных стратегий остается трудоемким процессом, требующим участия человека.

Архитектура системы и «самореференция» 10:46

Promptbreeder работает за счет взаимодействия трех компонентов: промптов для решения задачи (task prompts), промптов-мутаторов (mutation prompts) и фиксированного набора «стилей мышления» (thinking styles).

Методы эволюции и «странные трюки» 21:02

Для управления популяцией промптов исследователи внедрили девять различных операторов мутации. Среди них Янник Килхер выделяет весьма необычные подходы:

  1. Линейная сортировка: Модели подается список текущих промптов, отсортированный по качеству.
  2. Целенаправленное введение в заблуждение: В одном из случаев исследователи сообщают модели, что список отсортирован по возрастанию фитнеса (хотя на деле — по убыванию), чтобы заставить модель генерировать более разнообразные варианты, а не просто копировать лучший результат.

По словам Килхера, подобные манипуляции вызывают вопросы к чистоте исследования. Хотя они повышают итоговый балл, автор видео считает, что это скорее «трюки», а не фундаментальное решение проблемы автоматизации.

Анализ эффективности и выводы 36:07

При тестировании на задачах классификации (например, hate speech detection) Promptbreeder достиг точности 89%, в то время как «ручной» промпт показал 80%. Тем не менее, Килхер отмечает, что разница в 9 процентных пунктов достигается огромными вычислительными затратами и использованием обучающих данных, к которым «нулевой» промпт не имел доступа.

💬 Цитаты

«Это уже не ручной процесс, когда нам нужно сидеть и думать: «Как написать промпт?» — всё это теперь делается механизмом.»

Янник Килхер 3:48

«Мы не решили проблему, мы просто перенесли её в другой домен.»

Янник Килхер 1:33
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Эволюционный алгоритм
Метод оптимизации, основанный на принципах естественного отбора: мутации, скрещивании и отборе наиболее «приспособленных» решений.
Zero-shot
Метод использования ИИ, при котором модель выполняет задачу без предварительных примеров, основываясь только на промпте.
Few-shot
Метод, при котором модели предоставляется несколько примеров выполнения задачи внутри промпта для улучшения качества результата.
Chain-of-Thought
Техника промптинга, заставляющая модель пошагово прописывать ход своих рассуждений перед выдачей финального ответа.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Promptbreeder Google DeepMind LLM Prompt Engineering