Джозеф Уильямс о будущем ИИ-коучинга: «Сделать из человека экспериментатора»

Stanford Online 6,6 тыс. 1 ч 10 мин 3 мин 21.11.2024
Главное

Искусство адаптироваться: как менять поведение через эксперименты 0:05

В современной цифровой среде любая точка взаимодействия с пользователем — от текста письма до объяснения концепции на сайте — может стать инструментом для изменения поведения. Джозеф Джей Уильямс, приглашенный лектор из Stanford University, представил концепцию «адаптивных вмешательств» (intelligent interventions), способных сделать из привычных интерфейсов «микролаборатории» для постоянного обучения и улучшения пользовательского опыта. Главная цель исследовательской программы Уильямса — к 2034 году создать системы персональных ИИ-коучей, которые измеримо помогают людям в обучении, борьбе со стрессом и поддержании здоровых привычек.

🛠 Адаптивные инструменты: от почты до веба 2:27

Фундамент подхода Уильямса — фреймворк AdapComp. Его задача — превратить статические элементы интерфейса в динамические инструменты, которые постоянно тестируют различные идеи.

По словам исследователя, такой подход не просто формальная статистика, а развитие привычки принимать решения осознанно, взвешивая альтернативы.

📈 Проблема принятия решений: почему «лучшее» не всегда верно 12:00

Люди склонны к двоичному мышлению: мы либо отправляем одно «идеальное» сообщение всем (100% уверенности), либо тестируем два варианта 50/50, не имея гипотез. Уильямс утверждает, что правильнее использовать взвешенную рандомизацию: если мы уверены в успехе одного варианта на 70%, стоит показывать его 70% аудитории.

🧠 Алгоритмы: за пределами простого Thompson Sampling 30:40

В своей работе Уильямс фокусируется на алгоритмах обучения с подкреплением, в частности на Thompson Sampling (метод вероятностного сопоставления). Однако он отмечает, что стандартный Thompson Sampling не лишен проблем: он может завышать вероятность успеха одного варианта и приводить к высокой доле ложноположительных результатов.

Для решения этих проблем лектор предлагает:

  1. Epsilon-Thompson Sampling: С заданной вероятностью ($\epsilon$) алгоритм проводит равномерную рандомизацию (uniform random), что защищает от ошибок при изменении контекста.
  2. TS-Postdiff: Адаптивная версия, где значение $\epsilon$ меняется в зависимости от уверенности алгоритма в разнице между вариантами.
  3. Algorithm-attuned analysis: Анализ данных должен учитывать, какой именно алгоритм использовался для их сбора. Это позволяет сохранять фиксированный уровень ложноположительных результатов (5%) при высокой статистической мощности.

🚀 Зачем нам это нужно? 27:50

Джозеф Джей Уильямс убежден: математика наиболее красива, когда она помогает решать реальные человеческие проблемы. «Даже пять человек, которым не пришлось участвовать в вашем эксперименте благодаря более эффективным алгоритмам — это успех», — подчеркивает ученый. Он призывает студентов не просто строить красивые модели, а создавать интерфейсы, которые делают мощные инструменты адаптивного тестирования доступными для 8 миллиардов человек.

💬 Цитаты

«Мы — бинарные существа, живущие в вероятностном мире.»

Джозеф Джей Уильямс 12:56

«Если кто-то говорит вам, что построил интеллектуальную систему без непрерывного обучения — у меня есть много «змеиного масла», которое я хотел бы вам продать.»

Джозеф Джей Уильямс 04:55
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
AdapComp
Фреймворк, превращающий статические элементы интерфейса в инструменты для автоматизированного тестирования.
Thompson Sampling
Метод рандомизации, при котором выбор действия пропорционален вероятности того, что это действие лучше остальных.
Контекстуальные бандиты
Модель обучения с подкреплением, учитывающая контекст (состояние пользователя) при выборе действия.
📊 Цифры
🗓 Хронология
  1. 2012-2024 Разработка фундамента фреймворка AdapComp.
  2. 2013 Запуск первых экспериментов в Khan Academy.
  3. 2034 Целевой срок реализации концепции ИИ-коучей.
⚖️ Другая сторона
Искусственный интеллект AdapComp Thompson Sampling Epsilon-Thompson Sampling Stanford University ABScribe