Видьют Наваре о будущем ИИ в PayPal: «Мы ищем новые горизонты»

The TWIML AI Podcast 1,3 тыс. 37 мин 3 мин 26.09.2022
Главное

Инновации и прикладные исследования в PayPal: взгляд Видьюта Наваре 0:00

Искусственный интеллект и машинное обучение (ИИ/МО) стали фундаментом современной финансовой инфраструктуры, позволяя компаниям уровня PayPal масштабировать сервисы и обеспечивать безопасность миллионов пользователей. Видьют Наваре, директор по исследованиям в области ИИ и МО в PayPal, обсудил с Сэмом Черрингтоном, как компания выстраивает процессы прикладных исследований, где проходит граница между академическими разработками и практическими задачами бизнеса, и какие технологии — от квантовых вычислений до Federated Learning — определяют будущее финтеха.

🌐 Экосистема ИИ в PayPal 5:28

PayPal представляет собой сложную двустороннюю сеть, объединяющую около 395 млн клиентов и до 35 млн мерчантов. Столь масштабная инфраструктура требует внедрения ИИ-решений во все ключевые продукты, включая платформы Braintree и сервис трансграничных денежных переводов Xoom.

По словам Видьюта Наваре, работа подразделения ИИ сфокусирована на пяти основных направлениях:

🛠 Четыре столпа прикладных исследований 10:39

Видьют Наваре классифицирует ландшафт ИИ-исследований в PayPal на четыре уровня, каждый из которых требует инноваций:

  1. Аппаратный уровень (Hardware/Compute): Оптимизация вычислений и снижение затрат на инфраструктуру.
  2. Алгоритмический уровень (Core Algorithms): Адаптация передовых академических наработок под специфику финансовых данных.
  3. Прикладной уровень (Application Layer): Обеспечение ответственного использования ИИ, включая вопросы этики и безопасности.
  4. Инструментарий и платформы (MLOps): Единая экосистема, связывающая все части процесса в автоматизированный конвейер.

🤖 Технологический стек и перспективные направления 12:23

Федеративное обучение (Federated Learning) PayPal активно инвестирует в технологии, позволяющие переносить часть вычислений и инференса непосредственно на устройства пользователей или мерчантов. Это не только снижает нагрузку на центральные дата-центры, но и критически важно для соблюдения конфиденциальности и регуляторных норм. В данный момент команда фокусируется на инференсе на устройствах, рассматривая обучение (training) на устройствах как перспективную, но более отдаленную цель.

Причинно-следственный ИИ (Causal ML) Одной из главных проблем машинного обучения в бизнесе остается опора на корреляции, которые со временем ослабевают из-за дрейфа данных (data drift). По мнению Наваре, внедрение методов причинно-следственного вывода позволяет строить более робастные модели. Это особенно перспективно в маркетинге, где действия компании должны приводить к конкретным изменениям в поведении пользователей (концепция «обработки и эффекта»).

Графовые нейронные сети (GCN) Для PayPal графы — естественное представление данных о транзакциях. Команда использует GCN для обучения эмбеддингов, что помогает выявлять сложные виды мошенничества, такие как сговор покупателей и продавцов. Главный вызов здесь — масштабируемость: необходимо эффективно обучать модели на графе с миллиардами транзакций в год.

Квантовые вычисления Исследовательская группа провела серию пилотных проектов с IBM и D-Wave, пытаясь применить квантовые алгоритмы для задач отбора признаков (feature selection), которые являются комбинаторными задачами оптимизации. Результаты показали, что текущие квантовые мощности пока не превосходят классические методы, поэтому компания ожидает дальнейшего созревания этой технологии.

⚖️ Ответственный ИИ и роль MLOps 30:35

Прикладные исследования в PayPal тесно связаны с принципами «ответственного ИИ» (Responsible AI). Это включает разработку механизмов объяснимости (explainability), обеспечения справедливости (fairness) и защиты от состязательных атак (adversarial learning).

Подразделение MLOps выполняет роль «клея» для всей системы. Видьют Наваре отмечает, что примерно 50% ресурсов команды уходит на операционную деятельность и внедрение моделей в эксплуатацию, а остальные 50% — на R&D, направленное на автоматизацию этапов обучения и доставки моделей. Объединение MLOps-функции с группой прикладных исследований позволяет быстрее проверять гипотезы и эффективнее переводить инновации в продакшн.

💬 Цитаты

«Это та самая область, где мы имеем самые продвинутые, самые сложные ИИ-системы в эксплуатации.»

Видьют Наваре 07:42

«Мы верим, что вместо того, чтобы рассматривать эти проблемы как чисто предиктивные, их лучше формулировать как задачи обработки и эффекта.»

Видьют Наваре 22:19

«Именно здесь MLOps пытается автоматизировать как можно больше этапов разработки и доставки модели.»

Видьют Наваре 34:21
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
Federated Learning
Подход к машинному обучению, при котором модель обучается на децентрализованных данных, расположенных на устройствах пользователей, без их передачи в центральное хранилище.
Causal ML
Методы машинного обучения, сфокусированные на выявлении причинно-следственных связей, а не просто статистических корреляций.
Data Drift
Явление, при котором статистические свойства целевой переменной, на которую обучена модель, меняются со временем, что приводит к снижению точности предсказаний.
GCN (Graph Convolutional Networks)
Тип нейронных сетей, предназначенный для работы с данными, представленными в виде графов (связей между узлами).
MLOps
Набор практик и инструментов для автоматизации процессов обучения, тестирования и развертывания моделей машинного обучения.
📊 Цифры
🗓 Хронология
  1. 2020 Пилотный проект с командой Сьюзан Эйти (Stanford) по применению Causal ML.
  2. до 2023 Работа Видьюта Наваре в компаниях Qualcomm и NIO.
  3. 2023–2026 Текущий период работы в PayPal, расширение фокуса на MLOps и R&D.
⚖️ Другая сторона
Искусственный интеллект Vidyut Naware PayPal Federated Learning Causal ML MLOps