Берр Сеттлс: «Мы используем ИИ, чтобы залезть пользователю в голову»

The TWIML AI Podcast 911 1 ч 4 мин 25.09.2020
Главное

Использование искусственного интеллекта в образовании часто воспринимается как футуристическая концепция, однако для Duolingo это повседневная реальность уже более десяти лет. В подкасте TWIML AI Берр Сеттлс, директор по исследованиям в Duolingo, рассказал ведущему Сэму Чаррингтону, как компания превратилась из стартапа при Университете Карнеги — Меллона в глобальную платформу, где алгоритмы заменяют персональных репетиторов для 500 миллионов пользователей.

🎓 Философия «цифрового репетитора» 9:05

Берр Сеттлс пришел в компанию в 2013 году, когда в штате было всего 20 человек. С самого начала миссия Duolingo заключалась в демократизации образования. По мнению Сеттлса, лучший способ выучить что угодно — это индивидуальные занятия с экспертом . Однако живой репетитор — ресурс дорогой и дефицитный. AI призван масштабировать этот опыт, имитируя три ключевых качества хорошего учителя:

Вся научно-исследовательская деятельность Duolingo структурирована вокруг этих трех направлений. Сеттлс подчеркивает, что в отличие от большинства образовательных технологий, сфокусированных на краткосрочных семестровых результатах, Duolingo строит модели для «обучения длиною в жизнь», где фактор забывания является критически важным .

📊 Масштабируемый контент и стандарт CEFR 17:23

Для оценки прогресса пользователей Duolingo использует общеевропейские компетенции владения иностранным языком (CEFR), которые делят уровни на A1 (начальный) до C2 (свободное владение) . Проблема заключалась в том, что ресурсы для разметки слов по этим уровням существовали только для английского языка.

Чтобы автоматизировать создание курсов для других языков, команда Сеттлса разработала инструмент Birdbrain (внутреннее название) и публичный сервис CEFR.duolingo.com . Основные технические детали:

  1. Мультиязычные эмбеддинги: используются векторы слов, обученные на данных Википедии и субтитрах к фильмам .
  2. Перенос обучения: модель обучается на английских данных и проецирует уровни сложности на испанский, французский или португальский языки .
  3. Контроль качества: алгоритмы проверяют, чтобы в уроке для новичков (A1) внезапно не появилось слово уровня C2 (например, «crepuscular» — сумеречный), заменяя его более простыми аналогами .

Сеттлс вспоминает, что на заре компании курсы могли содержать странные наборы слов просто потому, что их составляли инженеры-носители без педагогического опыта. Например, пользователю могли предложить выучить слово «панголин» на испанском в самом первом блоке обучения просто потому, что оно было в общем списке животных . Сейчас AI-инструменты фильтруют контент на соответствие реальной частотности употребления.

🧠 Активное обучение и «Взлом» забывания 32:09

Ключевой технологический прорыв Duolingo связан с концепцией интервальных повторений (spaced repetition). До 2013 года приложение использовало систему Лейтнера, разработанную еще в 1970-х для физических карточек . Сеттлс, чья докторская диссертация была посвящена активному обучению (active learning), пересмотрел этот подход.

В 2016 году команда опубликовала статью о методе Half-Life Regression (HLR) . Суть метода:

По словам гостя, активное обучение позволяет модели не просто предлагать задания, а выбирать те, что находятся в «зоне ближайшего развития» — на грани того, что человек уже знает и того, что его слегка путает .

🛡️ Борьба с читерством и английский тест 43:30

Важным источником дохода и применения ML стал Duolingo English Test (DET) — цифровая альтернатива TOEFL и IELTS. Традиционные тесты требуют личного присутствия в центрах, что дорого и неудобно: Сеттлс приводит пример жителя сельской Амазонии, которому нужно 14 часов ехать на автобусе до Сан-Паулу, чтобы сдать экзамен .

AI в DET решает две задачи:

  1. Безопасность данных: Благодаря автоматической генерации айтемов (заданий), их база настолько огромна, что вероятность увидеть один и тот же вопрос дважды составляет менее 0,1% . Это делает бессмысленным «слив» вопросов в сеть.
  2. Компьютерное адаптивное тестирование: Тест подстраивается под уровень сдающего в реальном времени. Если вы ответили правильно на вопрос уровня B1, следующий будет уровня B2 или C1 .

Для оценки устной речи (speaking) компания долго использовала сторонние сервисы (Google ASR, Siri), но недавно начала разработку собственных инхаус-решений для учета различных акцентов и вокальных регистров, чтобы избежать дискриминации пользователей по полу или происхождению .

🔔 Психология уведомлений: Бандитские алгоритмы 53:16

Одной из самых обсуждаемых (и иногда раздражающих) функций Duolingo являются пуш-уведомления. Сеттлс признается, что компания экспериментировала с использованием ML для определения идеального времени отправки сообщения, но выяснилось, что простые эвристики работают не хуже сложных моделей .

Однако содержание пушей выбирается с помощью многоруких бандитов (multi-armed bandits) . Проблемы, которые пришлось решить:

Сейчас в арсенале Duolingo сотни вариантов сообщений на десятках языков, и AI постоянно тестирует, какой призыв к действию сработает лучше для конкретной культурной группы .

💬 Цитаты

«Лучший вид образования — это один на один с репетитором, и мы верим, что лучший способ масштабировать этот опыт — это ИИ.»

Берр Сеттлс 09:57

«Вам пришлось бы пройти тест тысячу раз, чтобы в среднем снова увидеть тот же самый вопрос.»

Берр Сеттлс 49:30
👥 Спикеры
🔗 Упомянутые сайты и проекты
📖 Термины
CEFR
Общеевропейские компетенции владения иностранным языком — стандарт для определения уровней навыков (A1–C2).
Half-Life Regression
Математическая модель, предсказывающая вероятность того, что пользователь вспомнит конкретный элемент обучения через определенное время.
Многорукие бандиты
Тип алгоритма обучения с подкреплением, который выбирает действие (например, текст уведомления) для максимизации награды.
📊 Цифры
🗓 Хронология
  1. 2013 Берр Сеттлс присоединяется к команде Duolingo (сотрудник №20).
  2. 2014 Запуск Duolingo English Test как доступной альтернативы традиционным экзаменам.
  3. 2016 Публикация научной статьи о модели Half-Life Regression на конференции ACL.
  4. 2020 Публикация статьи о бандитских алгоритмах для пуш-уведомлений на конференции KDD.
⚖️ Другая сторона
Искусственный интеллект Duolingo Burr Settles Machine Learning Active Learning NLP