Шон Тейлор: «Модели должны возвращать решения, а не предсказания»

The TWIML AI Podcast 3,2 тыс. 58 мин 2 мин 24.05.2021
Главное

Практика причинно-следственных моделей в Lyft: взгляд Шона Тейлора 0:00

Масштабирование аналитических систем и внедрение причинно-следственного (каузального) моделирования в бизнес-процессы стали ключевыми темами интервью с Шоном Тейлором, специалистом по анализу данных (Staff Data Scientist) в Lyft. В беседе с ведущим The TWIML AI Podcast Сэмом Шаррингом эксперт поделился опытом работы в команде Rideshare Labs, рассказал об эволюции методов прогнозирования в условиях маркетплейса и объяснил, почему для бизнеса важно мыслить не категориями предсказаний, а категориями принятия решений.

🧪 Лаборатория инноваций в Lyft 2:21

Команда Rideshare Labs выполняет роль внутреннего инкубатора Lyft, позволяя ученым работать над «большими ставками» — идеями с потенциально высокой отдачей, даже если вероятность их успеха составляет менее 25–50%.

Основные принципы работы лаборатории:

📈 Прогнозирование как система принятия решений 10:40

По словам Тейлора, прогнозирование в Lyft — это не просто экстраполяция временных рядов, а человекоцентричная система, где учитываются ответные действия бизнеса.

Ключевые аспекты моделирования:

🧪 Экспериментирование в маркетплейсах 23:46

Одной из главных проблем Lyft является «шум» в данных, затрудняющий оценку эффективности алгоритмов.

🧠 Нейронные сети и гетерогенные эффекты 35:18

Хотя деревья решений (LightGBM, XGBoost) остаются надежным инструментом, команда Lyft активно исследует нейронные сети.

Преимущества нейросетей для Lyft:

  1. Гибкость функций потерь: легко адаптировать под разные типы данных.
  2. Многозадачность: возможность совместного обучения на разных исходах (отмена поездки, жалоба, успешное выполнение).
  3. Гетерогенные эффекты (HTE): использование архитектур, подобных «Dragonnet» (разработка Клаудии Ши, Виктора Вейча и Дэвида Блая), позволяет понять, для каких сегментов пользователей конкретный стимул (например, купон) работает лучше всего.
💬 Цитаты

«Мы не строим модель, мы строим систему для построения моделей, которая будет развиваться со временем.»

Шон Тейлор 18:24

«Модели не должны возвращать прогнозы, они должны возвращать решения.»

Шон Тейлор 39:12
👥 Спикеры
📚 Упомянутые книги
🔗 Упомянутые сайты и проекты
📖 Термины
Switchback-тест
Метод тестирования алгоритмов в маркетплейсах путем переключения условий по времени, что позволяет избежать интерференции между группами.
DAG (Directed Acyclic Graph)
Направленный ациклический граф, используемый для моделирования причинно-следственных связей.
Гетерогенные эффекты (HTE)
Анализ того, как воздействие (интервенция) по-разному влияет на разных людей, а не только на средний показатель по популяции.
📊 Цифры
⚖️ Другая сторона
Искусственный интеллект Sean Taylor Lyft Causal Modeling Rideshare Labs PyTorch