# Как парадокс Берксона обманывает ученых-медиков и искажает статистику

Источник: https://www.youtube.com/watch?v=8rUm46mk0Yo
Канал: Talks at Google
Опубликовано: 03.05.2024

---

На встрече Talks at Google известный профессор и специалист по анализу данных Аллен Дауни представил свою новую книгу «Probably Overthinking It». Центральной темой выступления стал парадокс Берксона и порождаемое им коллайдерное смещение — статистические иллюзии, способные полностью перевернуть выводы научных исследований. Спикер подробно разобрал, как ошибки выборки приводят к ложным медицинским открытиям, мешают борьбе с курением и искажают результаты бизнес-аналитики.

## 📉 Парадоксы медицины, которые стоят человеческих жизней
[[JUMP:03:13]]

В 1971 году калифорнийский исследователь Джейкоб Йерушалми опубликовал работу, изучающую влияние курения матерей на здоровье новорожденных. Выводы подтвердили общеизвестный факт: дети курящих женщин в среднем на 6% легче и чаще попадают в категорию малого веса при рождении. Смертность среди младенцев с малым весом в 1970-х годах составляла внушительные 170 на 1000 по сравнению с базовым уровнем 8 на 1000. 

Однако ученый обнаружил аномалию: если изолированно рассматривать только младенцев с малым весом, то у курящих матерей смертность детей оказалась почти на 50% ниже, чем у некурящих. Это привело автора к ошибочному выводу о том, что курение может не быть экзогенным вредным фактором. Пресса подхватила тезис, выпустив материалы под заголовками «В защиту курящих мам». Ретроспективный анализ 2014 года показал, что эта статистическая ошибка затормозила внедрение антитабачных мер примерно на десятилетие, что повлекло за собой человеческие жертвы.

Аналогичные ложные паттерны возникали и позже. В 1999 году исследование выявило «парадокс ожирения»: среди пациентов, проходящих лечение от болезней почек, люди с избыточным весом жили дольше. Это породило многолетние споры в научной литературе с 2006 по 2019 годы. В 2000 году был зафиксирован «парадокс близнецов»: при преждевременных родах двойни и тройни демонстрировали более высокую выживаемость, чем одиночные младенцы на том же сроке. По словам Аллена Дауни, все эти медицинские загадки объясняются не биологическими механизмами, а системной ошибкой выборки — парадоксом Берксона.

## 🎓 Геометрия отбора: как возникает парадокс Берксона
[[JUMP:08:35]]

Чтобы наглядно объяснить природу парадокса, Аллен Дауни привел пример с результатами стандартизированных тестов SAT или ACT. В общей популяции между математическими и вербальными навыками существует сильная положительная корреляция около 0.7. Если у человека вербальный балл равен 600 (на 100 выше среднего), его математический балл ожидаемо составит около 570.

Ситуация кардинально меняется при прохождении жесткого отбора. Профессор выделил два наглядных сценария:

* В элитном университете, куда принимают студентов только с суммой баллов от 1320 и выше, корреляция между тестами падает до -0.3.
* В условном «колледже второго эшелона», отбирающем студентов с суммой баллов от 1200, но теряющем лучших кандидатов с баллами выше 1300, корреляция превращается в жесткие -0.8.

Этот эффект возникает из-за геометрии отбора. Парадокс Берксона начинает работать всегда, когда объекты попадают в выборку по одной из двух независимых причин. Спикер проиллюстрировал это известными примерами:

* Матрица знакомств Джордана Элленберга: если оценивать мужчин по шкале от «привлекательный» до «добрый», то в условный треугольник приемлемых партнеров красивые мужчины попадают с любым характером, а вот подсознательно отбираемые невзрачные мужчины обязаны быть исключительно добрыми.
* Парадокс Ханны Фрай о книгах и фильмах: экранизация романа кажется хуже первоисточника просто потому, что фильмы по плохим книгам снимают только в том случае, если сам фильм получается шедевральным. Плохие фильмы по плохим книгам до массового зрителя просто не доходят.

## 🗺️ Причинно-следственные диаграммы: разоблачение медицинских аномалий
[[JUMP:16:01]]

Разгадка медицинских парадоксов кроется в понятии «коллайдерного смещения» (collider bias). В 2006 году исследователи Эрнандес-Диас, Шистерман и Эрнан опубликовали работу, где применили причинно-следственные диаграммы для разбора аномалии малого веса. Ученые использовали данные Национального центра статистики здравоохранения США, охватившие 3 миллиона младенцев, родившихся в 1991 году.

На графике выживаемости отчетливо видна точка пересечения в районе 2000 граммов: выше нее смертность детей курящих матерей ожидаемо выше, а ниже — траектории меняются местами. Причинно-следственная диаграмма этого процесса выглядит следующим образом: есть два независимых фактора, ведущих к малому весу ребенка, — курение матери и иные тяжелые риски (например, генетические дефекты). 

Когда исследователи искусственно сужают выборку и анализируют *только* младенцев с малым весом, факторы начинают конкурировать. Аллен Дауни объясняет это через метафору «тостера Берксона»:

> «Если вы почувствовали запах дыма на кухне и обнаружили подгоревший тост, вы испытаете облегчение. Из всех возможных причин дыма на кухне сгоревший тост — наименее опасная».

Точно так же, если у младенца зафиксирован малый вес, но известно, что его мать курила, это парадоксальным образом снижает вероятность того, что дефект вызван куда более смертоносным генетическим заболеванием. Курение вредно, но оно оказывается меньшим из двух зол в изолированной группе патологий.

Аналогичным образом в 2017 году был деконструирован парадокс ожирения: избыточный вес провоцирует сердечную недостаточность, которая ведет к смерти, но у сердечной недостаточности есть и другие, куда более агрессивные скрытые причины. А в 2000 году сопутствующая статья в медицинском журнале объяснила парадокс близнецов: многоплодная беременность — это самый безобидный фактор преждевременных родов из всех возможных.

## ⚠️ Ловушки регрессионного анализа: коллайдеры, конфаундеры и медиаторы
[[JUMP:22:28]]

Причинно-следственные диаграммы вводят строгую терминологию для работы со статистикой:

* **Коллайдер (Collider):** переменная, на которую направлены стрелки от двух независимых причин (A → B ← C).
* **Медиатор (Mediator):** промежуточное звено в цепочке причинности (A → B → C).
* **Конфаундер (Confounder):** скрытый общий фактор, влияющий на обе исследуемые переменные одновременно (A ← B → C).

Профессор Дауни предупреждает об опасном заблуждении, распространенном среди аналитиков: убеждении, что включение максимального количества контролирующих переменных в регрессионную модель всегда повышает ее точность. На самом деле, контроль конфаундера — это необходимость, но контроль коллайдера или выборка по нему полностью уничтожают валидность данных, переворачивая корреляцию с ног на голову. 

В качестве примера избыточного контроля Дауни приводит «парадокс Эвереста»: если при оценке погодных условий на вершине горы зафиксировать и контролировать высоту (медиатор), то математическая модель покажет, что атмосфера на пике Эвереста якобы составляет комфортные и теплые 70 градусов по Фаренгейту. Исследователь просто исключает из уравнения ключевой фактор, через который передается эффект.

Спикер выразил скепсис по поводу недавних громких публикаций. По мнению Дауни, заголовки вроде «Употребление мороженого диабетиками снижает риск сердечных заболеваний» или «Молочные десерты уменьшают инсулинорезистентность у людей с лишним весом» с высокой долей вероятности являются прямым следствием коллайдерного смещения, возникшего из-за некорректно изолированных групп участников.

## 🍕 Парадокс Берксона в повседневной жизни: от буррито до бизнес-аналитики
[[JUMP:26:08]]

Статистические искажения подстерегают менеджеров и маркетологов при анализе клиентских баз. Изучая удовлетворенность аудитории, компании часто забывают ответить на вопрос: как именно человек стал их клиентом? По мнению Дауни, существует как минимум два пути: клиент либо искренне любит продукт, либо у него просто нет альтернативы. По мере роста рыночной доли бизнеса доля второй группы неизбежно растет, что ведет к кажущемуся падению индекса удовлетворенности и ложным корреляциям внутри выборки.

В повседневной жизни парадокс Берксона формирует наши бытовые стереотипы. Дауни вспомнил популярную в соцсетях шутку про забегаловку с буррито, которая выглядит грязной, еда там жирная, а сайт выдает ошибку 404, но еда при этом невероятно вкусная. Математическое объяснение простое: ресторан выживает на конкурентном рынке, если у него либо отличный интерьер и сервис, либо потрясающая кухня. Если первого нет, то заведение держится исключительно на качестве блюд.

Опираясь на эту логику, экономист Тайлер Коуэн сформулировал ироничное правило для ресторанов: всегда заказывать самое неаппетитное и странное блюдо в меню. Если позиция звучит плохо, но ее до сих пор не убрали из меню, значит, она обладает неожиданно великолепным вкусом. 

В финале лекции Аллен Дауни в шутку объединил эти статистические законы в «руководство по идеальному свиданию»:

> «Найдите непривлекательного человека, ведь по закону отбора он наверняка окажется очень добрым. Пригласите его в сомнительный ресторан в торговом центре и закажите там самое невзрачное блюдо. А затем отправляйтесь на фильм, снятый по мотивам ужасной книги».

## 🏃‍♂️ Эффект инспекции и «проблема оверфинкинга»: вопросы слушателей
[[JUMP:29:21]]

В ходе сессии вопросов и ответов сотрудник Google Дэн Марго поинтересовался, существуют ли геометрии отбора, которые не искажают выборку. Дауни согласился, что если вуз стремится набрать максимально сбалансированных студентов (где разница между математическим и вербальным баллом минимальна), то такая выборка в виде диагональной полосы по центру графика, напротив, искусственно завысит и укрепит положительную корреляцию.

Отвечая на вопрос о происхождении названия своего блога и книги «Probably Overthinking It» («Возможно, я слишком много об этом думаю»), Аллен Дауни поделился личной историей. Во время участия в эстафетном забеге в Нью-Гэмпшире он обратил внимание на странное явление: на трассе он стремительно обгонял медленных бегунов, а его самого как стоячего обходили сверхбыстрые спортсмены. Бегунов со средней скоростью вокруг себя он почти не видел. 

В состоянии кислородного голодания профессор предположил, что средний темп просто непопулярен, но позже осознал, что столкнулся с еще одной статистической ловушкой — эффектом инспекции (или парадоксом длины выборки). Вероятность встретить человека на трассе пропорциональна разности ваших скоростей. Бегуны с той же скоростью движутся параллельно и никогда не пересекаются с наблюдателем, если только не стартовали одновременно с ним. 

Аллен Дауни резюмировал, что его цель — не заронить в умах тотальный нигилизм в духе «вся статистика врет». Напротив, наука планомерно очищает знание от шелухи и искажений. Ярким примером эффективности работы с данными спикер назвал неоспоримый научный факт: вакцины эффективно предотвращают болезни и спасают человеческие жизни, а отрицание этого факта несет прямую угрозу здоровью.