Райли Гудсайд о промпт-инжиниринге: «Модели не думают, они фристайлят»

The TWIML AI Podcast with Sam Charrington 1,4 тыс. 52 мин 2 мин 23.10.2023
Главное

Искусство промпт-инжиниринга: ментальные модели и стратегии от Райли Гудсайда 🧠 0:00

В мире, где большие языковые модели (LLM) стремительно меняют ландшафт технологий, умение эффективно «общаться» с ИИ становится ключевым навыком. Райли Гудсайд, эксперт по промпт-инжинирингу в Scale AI, в рамках подкаста The TWIML AI Podcast делится своими взглядами на то, как устроены эти системы и как с ними продуктивно работать, избегая типичных ловушек.

🛠 Три фундаментальные ментальные модели 15:12

Гудсайд подчеркивает, что для понимания работы LLM недостаточно одной теории. Он выделяет три базовых подхода, которые помогают предсказывать поведение модели:

  1. «Мультивселенная художественной литературы» (Multiverse of Fiction): Модель представляет собой блок данных, а каждый токен промпта — это «вырезание» ненужных пластов из этого блока. Цель промпта — ограничить пространство вероятностей до желаемого результата.
  2. RLHF как фильтр одобрения: Обучение с подкреплением на основе отзывов людей (RLHF) делает модель предсказателем того, что «нам» (пользователям) понравится, а не просто статистическим зеркалом обучающей выборки. Это часто важнее, чем данные, на которых модель училась изначально.
  3. Авторегрессионный процесс: Поскольку модели генерируют текст токен за токеном, процесс не является мгновенным «озарением». Это «фристайл-рэп» ИИ, который не может остановиться и подумать, поэтому он часто ошибается, если не задать структуру.

📉 Почему промпты «ломаются» и как это исправить 40:37

Гудсайд предупреждает: попытки заставить модель «думать» через сложные лингвистические конструкции часто проваливаются. Эффективность промпта зависит не от красноречия, а от структуры.

🚀 Прогнозы и развитие технологий 36:06

Собеседник отмечает, что область развивается слишком быстро, чтобы полагаться на книги. Тем не менее, он выделяет несколько интересных направлений, таких как использование «пауз-токенов» (pause tokens) для повышения качества ответов и методы «отката» (backspace token) в случае генерации мусора, что позволяет модели «передумать».

По мнению Гудсайда, антропоморфизация («модель думает», «модель знает») неизбежна, но важно помнить: за этим не стоит человеческое сознание. Это лишь способ описания статистических процессов, и эффективный промпт-инженер — это не поэт, а архитектор контекста, который знает границы возможностей модели.

💬 Цитаты

«Модель не разговаривает с нами, она читает фристайл-рэп.»

Райли Гудсайд 35:11

«Промпт-инжиниринг — это редко окончательный ответ. Это строительные леса.»

Райли Гудсайд 43:07
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
LLM
Большая языковая модель, способная понимать и генерировать человеческий текст.
RLHF
Обучение с подкреплением на основе отзывов людей для настройки поведения ИИ.
Few-shot prompting
Метод обучения модели, при котором в промпт включаются примеры правильных ответов.
Zero-shot prompting
Запрос к модели без предоставления примеров выполнения задачи.
Авторегрессия
Процесс генерации текста, где каждый следующий токен зависит от предыдущих.
📊 Цифры
🗓 Хронология
  1. Начало 2022 Райли Гудсайд начинает эксперименты с LLM после ухода из Grinder.
  2. Июнь 2022 Статья Дугласа Хофштадтера в The Economist о непонимании мира моделью GPT-3.
  3. Конец 2022 Выход ChatGPT, который резко изменил подходы к промпт-инжинирингу.
⚖️ Другая сторона
Искусственный интеллект Riley Goodside ChatGPT Prompt Engineering LLM RLHF