Раза Хабиб о внедрении AI: почему RLHF переоценен

The Cognitive Revolution 2,3 тыс. 1 ч 21 мин 3 мин 27.04.2023
Главное

🏗️ Разрыв между API и готовым продуктом: Уроки от Humanloop 2:12

Раза Хабиб, сооснователь Y Combinator-стартапа Humanloop, утверждает, что внедрение языковых моделей (LLM) — это задача, где 90-95% работы составляют не базовое обучение, а настройка и поддержка. Несмотря на кажущуюся простоту начала работы с API, создание надежного продукта требует глубокой работы с данными, сбора обратной связи, мониторинга ошибок и экспериментов.

Для многих компаний переход от прототипа к стабильному приложению остается главным барьером, преодоление которого требует не только инженерных навыков, но и инструментов для итерации.

🛠️ Инструментарий для разработчиков и Founders 6:11

Основная аудитория Humanloop — это технические специалисты, разработчики и фаундеры, стремящиеся превратить «сырые» возможности API в полезный продукт. Раза Хабиб выделяет три ключевые проблемы, с которыми сталкиваются команды:

По мнению Хабиба, работа в интерактивной среде (плейграундах) дает гораздо лучшее понимание возможностей модели, чем простое изучение бенчмарков.

📊 Роль обратной связи в жизненном цикле модели 33:09

Анализ того, насколько хорошо работает модель, становится критически важным для масштабируемых приложений. В Humanloop для этого используют комбинацию методов сбора данных:

  1. Явные сигналы: «Лайки» или дизлайки от пользователей (аналогично ChatGPT), хотя их использует лишь небольшая часть аудитории.
  2. Неявные действия: Анализ поведения пользователей — отправили ли они сгенерированный email, нажали ли кнопку «регенерация» или скопировали результат.
  3. Текстовые исправления: Захват правок, которые пользователь вносит в сгенерированный текст перед использованием.

Хабиб подчеркивает, что инструменты мониторинга позволяют компаниям заметить эффект от смены модели практически в реальном времени, превращая догадки «стало вроде лучше» в измеримые показатели удовлетворенности пользователей.

📉 Fine-tuning против RLHF: Что нужно бизнесу сегодня 48:46

Раза Хабиб дает неожиданную характеристику текущему ажиотажу вокруг RLHF (обучения с подкреплением на основе отзывов людей): по его мнению, это «как секс в старшей школе — все говорят об этом, но почти никто этим на самом деле не занимается».

Аргументы гостя против спешки с RLHF:

При этом он прогнозирует, что дообучение моделей станет гораздо более распространенным в ближайшем будущем по мере удешевления инфраструктуры.

🤖 Будущее агентов и «агентная» проблема 56:28

Обсуждая текущие «агентные» системы, которые должны автономно выполнять цепочки действий, Хабиб отмечает их главную уязвимость: накопление ошибок.

🚀 Прогнозы развития индустрии 1:18:09

Раза Хабиб выражает сдержанный оптимизм. Он ожидает, что AI станет мощным ускорителем научной работы — от медицины до новых материалов, а также кардинально снизит стоимость качественного образования за счет персонализированных тьюторов.

Тем не менее, он предупреждает о рисках концентрации политической власти и систематизации социальных предвзятостей, особенно в задачах автоматического скрининга кандидатов или принятия решений, влияющих на жизнь людей. С точки зрения бизнеса, он считает, что те компании, которые не внедрят LLM-технологии, рискуют безнадежно отстать от конкурентов, которые сделают это быстрее.

💬 Цитаты

«RLHF — это как секс в школе: все говорят об этом, но почти никто не занимается.»

Раза Хабиб 49:14

«Если цепочка действий длинная, надежность системы стремится к нулю.»

Раза Хабиб 56:57
👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
RLHF
Обучение с подкреплением на основе отзывов людей — метод настройки моделей для лучшего соответствия человеческим предпочтениям.
Mode collapse
Ситуация, когда модель начинает генерировать однотипные, скучные ответы, теряя разнообразие.
Stochastic
Случайный характер процессов, при котором одно и то же действие может приводить к разным результатам.
📊 Цифры
⚖️ Другая сторона
Стартапы и бизнес Humanloop Raza Habib LLM implementation RLHF Agentic workflows