# Как вузы собирают данные учащихся и почему провалился проект InBloom

Источник: https://www.youtube.com/watch?v=tnnuIwgXAt8
Канал: MIT OpenCourseWare
Опубликовано: 16.09.2025

---

В рамках курса MIT OpenCourseWare преподаватель Джастин вместе со студентами разбирает этические дилеммы, связанные с масштабным сбором цифровых данных в образовательных учреждениях. Центральной темой дискуссии становится «токсичная сила данных» — концепция, описывающая баланс между возможностями масштабных научных исследований и рисками тотальной слежки. На примерах краха проекта InBloom и запуска новой инициативы Safe Insights участники исследуют, как контролировать и использовать информацию, не превращая её в инструмент психологического давления.

## 🎓 Цифровой след студента: что знает университет?
[[JUMP:0:12]]

Современные высшие учебные заведения, включая Массачусетский технологический институт (MIT), аккумулируют колоссальные объёмы информации о своих студентах. В рамках практического эксперимента Джастин предложил аудитории составить список данных, которые хранятся на серверах института. Результат получился внушительным и затронул практически все сферы жизни учащихся.

Ключевые категории собираемых данных:

* Финансовая информация: сведения о доходах родителей и самих студентов, номера банковских счетов.
* Медицинская карта: история вакцинации, выписанные рецепты, аллергии, визиты к психотерапевтам и медицинская страховка.
* Личные особенности: информация о сексуальной ориентации и активности.
* Регистрационные данные: номера социального страхования (SSN), домашние адреса, номера телефонов и данные о партийной регистрации.
* Академическая успеваемость: оценки, посещаемость, результаты тестов и логи абсолютно всех действий (кликов) в образовательной системе Canvas.

По словам Джастина, за последние 10 лет детализация академических записей изменилась кардинально. Если в 1980 году «студенческий рекорд» состоял лишь из итоговых оценок и списка прослушанных курсов, то сегодня вузы отслеживают каждое действие студента в онлайн-среде.

Помимо учебы, институты фиксируют физическое перемещение студентов: геолокацию устройств через Wi-Fi, время использования электронных пропусков на входах в здания и общежития. Более того, через списки гостей, которых студенты регистрируют в своих комнатах, можно полностью реконструировать социальную сеть университета. Вузы также знают об участии в спортивных клубах и даже о политических симпатиях, которые легко считываются по вовлеченности в недавние протесты на кампусе.

В распоряжении администрации находится и вся электронная почта. Преподаватель поделился личной историей: в прошлом году конгресс потребовал предоставить материалы его исследований, и юридический отдел MIT (Office of General Counsel) провёл полный аудит его переписки по ключевым словам, не требуя его личного согласия. 

Сбор данных доходит до бытовых мелочей: автоматические прачечные на кампусе работают через мобильное приложение, фиксируя частоту стирок. На кампусе проводятся визуальные инспекции комнат ради безопасности, что, по мнению некоторых студентов, выглядит как вторжение в частную жизнь. Университет отслеживает историю покупок по ID-картам (например, покупку суши или кофе в Dunkin' Donuts) и логистику доставок через почтовое отделение. Один из студентов отметил, что такое положение дел вызывает грусть, однако его поколение выросло в цифровой среде и уже привыкло к постоянному сбору информации.

## ☣️ Концепция «токсичных данных» Брюса Шнайера
[[JUMP:17:38]]

Термин «токсичная сила данных» Джастин позаимствовал у известного исследователя в области кибербезопасности Брюса Шнайера. По мнению Шнайера, огромные массивы информации обладают колоссальной силой, подобно химиотерапии, которая спасает жизни, но сама по себе является ядом. 

Основная опасность «токсичных данных»:

* Уязвимость для утечек: чем дольше компания или организация хранит архивы, тем выше риск их компрометации.
* Злоупотребление со стороны третьих лиц: к накопленным массивам могут получить доступ злоумышленники или государственные органы.
* Избыточность хранения: организации часто собирают информацию «про запас», превращая её в опасный балласт.

Шнайер утверждает, что компании совершают ошибку, исповедуя слишком емкий подход к коллекционированию данных. По его мнению, правильная стратегия заключается в том, чтобы брать только то, что необходимо для текущей работы, и немедленно уничтожать остальное.

## 📱 Смартфоны и благополучие: норвежский масштабный эксперимент
[[JUMP:18:40]]

Для ученых-исследователей тотальный сбор данных — это повод для профессионального оптимизма, поскольку он снимает любые ограничения на глубину анализа. В качестве примера Джастин привёл недавнее исследование норвежского докторанта, посвященное запрету смартфонов в средних школах Норвегии. 

Результаты запрета смартфонов показали серьезный социальный эффект:

1.  У девочек существенно снизилось количество обращений к системе здравоохранения по поводу психологических симптомов и заболеваний.
2.  Уровень буллинга (травли) снизился среди представителей обоих полов.
3.  Средний балл (GPA) у девочек улучшился, а также выросла вероятность их поступления в старшие школы академического профиля.
4.  Наиболее ярко выраженный позитивный эффект наблюдался среди учащихся из семей с низким социально-экономическим статусом.

Джастин подчеркнул, что для проведения такого исследования государству потребовалось аккумулировать колоссальный объём личной информации. Властям необходимо было сопоставить оценки каждого ученика, траектории их поступления в колледжи, фиксацию каждого визита в медицинские учреждения Норвегии, характер жалоб, а также ежегодные опросы о самочувствии и буллинге. Это наглядный пример компромисса: массовый сбор данных позволяет делать точные социально значимые выводы ради блага самих граждан.

## 🧪 Эксперименты Pearson над «образом мышления» студентов
[[JUMP:21:40]]

В 2018 году крупное издательство учебной литературы Pearson провело эксперимент, добавив социально-психологические сообщения в своё программное обеспечение для изучения компьютерных наук. Исследование базировалось на теории о двух типах мышления: фиксированном (уверенность, что интеллект врождён и неизменен) и гибком, или мышлении роста (growth mindset, идея о том, что умственные способности можно развивать).

Издательство случайным образом разделило студентов: часть из них при совершении ошибок получала стандартные уведомления («неверно»), а экспериментальная группа — мотивирующие сообщения в духе гибкого мышления («это неправильно, но продолжай пытаться, и ты научишься большему»).

Студентка Дана выразила мнение, что подобные тесты не этичны, поскольку контрольная группа умышленно лишается потенциально полезной поддержки. Другие участники дискуссии посчитали «криповым» и манипулятивным тот факт, что за их психологическими реакциями наблюдали без их ведома и согласия. Социально-психологические триггеры в интерфейсе напомнили студентам пропаганду.

Джастин выступил в защиту Pearson, назвав их подход образцовым. По его словам, если бы компания просто внедрила эти сообщения для всех, никто бы не возмутился. Однако проведение рандомизированного исследования — единственный способ доказать, работает ли методика на конкретной аудитории. Преподаватель напомнил, что любая оценка учителя, любой красный крестик или зелёная галочка в edX — это такое же социально-психологическое воздействие, и никто не требует от родителей согласия на слова одобрения со стороны педагогов. В законодательстве США (Common Rule) исследования типичных образовательных практик официально освобождены от жестких требований о получении информированного согласия, которые применяются, например, в медицине.

## 🎲 Магия рандомизации и цифровое «шпионство» в ИТ-гигантах
[[JUMP:34:24]]

Студенты готовы мириться с тем, что программа меняется от года к году, но разделение пользователей внутри одного потока часто воспринимается как дискриминация. Джастин пояснил, что образовательная система не может развиваться без вариативности учебных планов. Задача рандомизированных контролируемых исследований — сделать эту вариативность систематической, чтобы извлекать из неё научные уроки.

В качестве параллели преподаватель привел примеры из коммерческого сектора:

* Amazon: при каждом сотом посещении сайта цвет кнопки покупки может меняться (например, с синего на зелёный), чтобы зафиксировать изменение конверсии.
* Google: поисковые алгоритмы постоянно варьируются на случайных выборках пользователей для оценки релевантности ответов и кликабельности рекламы.

ИТ-гиганты проводят миллиарды подобных экспериментов, и именно эта инфраструктура делает их сервисы удобными. При этом пользователи Amazon не испытывают того чувства дискомфорта, которое возникает у них при тестировании образовательных платформ.

Проблема приватности обострилась в период пандемии, когда вузы начали массово внедрять программы для удаленного прокторинга экзаменов. Студенты MIT вспомнили, как на первом курсе во время теста по Си-программированию веб-камера заставляла их сканировать всю комнату. Такое ПО воспринималось учащимися как настоящее шпионское оборудование (spyware), установленное на личные компьютеры за их же деньги. Джастин добавил, что у людей нет реальной альтернативы: сотовые операторы продают данные о геолокации, и вы не можете отказаться от мобильной связи или от учебы в колледже, если хотите добиться успеха в социуме.

## 📉 Провал InBloom: почему благие намерения пугают общество
[[JUMP:45:56]]

В 2013 году благотворительный фонд Била и Мелинды Гейтс совместно с рядом организаций запустил амбициозный проект InBloom. Разработчики заметили, что сотни коммерческих ИТ-поставщиков имеют доступ к разрозненным «осколкам» данных школьников, поскольку каждый округ заключает контракты индивидуально. 

Идея InBloom заключалась в том, чтобы аккумулировать абсолютно все данные учащихся в единой некоммерческой базе данных. Это позволило бы гибко настраивать персонализированное обучение для каждого ребенка. Сторонники идеи полагали, что специализированная некоммерческая структура справится с кибербезопасностью и обработкой информации гораздо лучше, чем 13 тысяч разрозненных школьных округов США, у которых часто нет квалифицированных ИТ-специалистов.

Однако проект столкнулся с яростным сопротивлением родителей и активистов. Слоган «мы соберем все данные о детях в одном месте» спровоцировал панику. Ситуация усугубилась общим историческим контекстом: 2013 год стал эпохой разоблачений Эдварда Сноудена, когда общество впервые осознало масштабы государственной слежки. Штаты один за другим начали выходить из соглашения. Главным итогом краха InBloom стало принятие жестких региональных законов о защите конфиденциальности учащихся, заблокировавших создание подобных мега-баз. Джастин резюмировал: пытаясь исправить плохую, но незаметную систему, авторы InBloom привлекли к проблеме излишнее внимание, и общество предпочло остаться с небезопасным, но привычным статус-кво.

## 🚀 Safe Insights: перезагрузка на 90 миллионов долларов
[[JUMP:57:15]]

Несмотря на прошлые неудачи, идея использования больших данных для модернизации образования жива. Национальный научный фонд США (NSF) выделил рекордный грант в размере 90 миллионов долларов Университету Райса (Rice University) на запуск платформы Safe Insights. Этот проект создается той же командой, которая успешно реализовала OpenStax — популярную инициативу по выпуску бесплатных учебников с открытым исходным кодом.

В промо-ролике Safe Insights делается упор на инклюзивность и безопасность исследований, проводимых непосредственно в цифровых классах. Студенты MIT отметили, что современное поколение пользователей, привыкшее к алгоритмам TikTok, отнесется к проекту лояльнее, чем их родители. Важным фактором доверия выступает авторитет Университета Райса, в отличие от частного фонда Гейтса, вызывавшего теории заговора.

Технологические отличия Safe Insights от провального InBloom:

* Отсутствие единого хранилища: проект не собирает все данные в одну базу.
* Федеративные запросы и дифференциальная приватность: исследователи могут запускать аналитические алгоритмы поверх распределенных баз данных (оценок, логов платформ), получая обезличенные инсайты без прямого доступа к личным делам студентов.
* Риторический акцент: платформа позиционирует себя не как «депозитарий данных», а как «генератор инсайтов».
* Широкое партнерство: к проекту привлечено 39 институтов, причем 77% из них — это вузы, обучающие расовые и национальные меньшинства.

Грант в 90 миллионов долларов сопоставим по масштабам с финансированием глобальных инфраструктурных проектов, таких как постройка гигантских радиотелескопов. По мнению Джастина, единственный способ избавить общество от страха перед образовательными экспериментами — это открытый диалог с родителями и демонстрация реальных результатов. Если Safe Insights сможет доказать, что благодаря их технологиям студенты начинают учить математику на 33% быстрее, баланс пользы и рисков в общественном сознании мгновенно изменится.