Статистика — это не просто сухие цифры, а мощный инструмент для понимания хаоса окружающего мира. Известный статистик Дэвид Шпигельхалтер в стенах The Royal Institution объясняет, как научный подход к вероятности помогает принимать решения в условиях тотальной неизвестности: от планирования военных операций до оценки рисков пандемии.
🧠 Природа неопределенности: осознанное невежество 2:20
Дэвид Шпигельхалтер определяет неопределенность не как свойство физического мира, а как «осознанное осознание собственного невежества» . Это субъективные отношения между человеком и реальностью. Спикер подчеркивает, что даже если мир детерминирован (на что намекают законы физики), для нас он остается неопределенным просто потому, что мы многого не знаем .
В статистике выделяют два ключевых типа неопределенности:
- Алеаторная неопределенность (случайность): классический пример — подбрасывание монеты до того, как она упала. Мы не можем предсказать результат .
- Эпистемическая неопределенность (незнание): ситуация, когда монета уже упала и накрыта рукой. Результат уже зафиксирован (орел или решка), но наблюдатель его не знает .
На примере «трюка» с монетой с двумя орлами статистик демонстрирует, что любая вероятность базируется на предположениях. Когда аудитория уверенно называет шанс 50/50, она делает необоснованное предположение о честности монеты и ведущего . Таким образом, любая статистическая модель — это лишь отражение наших знаний и допущений, а не истина в последней инстанции .
🔫 Трудности перевода: от Карибского кризиса до MI5 5:45
Неправильная коммуникация рисков может иметь катастрофические последствия. В качестве примера Дэвид Шпигельхалтер приводит операцию в заливе Свиней в 1961 году . Объединенный комитет начальников штабов США оценивал шансы на успех как 30 к 70 (70% вероятность провала), однако в финальном отчете для президента Кеннеди эти цифры заменили на расплывчатую фразу «хорошие шансы на успех» (a fair chance of success) . Кеннеди одобрил вторжение, закончившееся фиаско.
Чтобы избежать подобных ошибок, современные спецслужбы используют жестко заданные шкалы соответствия слов и цифр:
- В британских MI5 и MI6 слово likely (вероятно) официально означает вероятность от 55% до 75% .
- Слово unlikely (маловероятно) соответствует диапазону 25–35% .
По мнению статистика, использование таких стандартов критически важно для принятия государственных решений. В 2011 году при планировании рейда на убежище Усамы бен Ладена в Абботтабаде президент Обама использовал данные нескольких независимых групп аналитиков . Группы давали разные оценки вероятности нахождения цели: от 30–40% до 80–90% .
Дэвид Шпигельхалтер убежден, что Обама поступил правильно, не требуя от советников «единого мнения» . Если эксперты не согласны друг с другом, лидер должен знать о масштабах этого разногласия, так как вариативность мнений сама по себе является индикатором высокой неопределенности .
🦠 Моделирование пандемии и «мандатная наука» 11:11
Во время пандемии COVID-19 в Великобритании за оценку числа R (индекс репродукции вируса) отвечали восемь различных статистических команд, использовавших 12 различных моделей . Дэвид Шпигельхалтер отмечает, что результаты этих групп часто не пересекались, что доказывает: каждая модель была слишком самоуверенной и основывалась на собственных допущениях .
Основные выводы по работе с моделями:
- Все модели ошибочны. Доверительные интервалы в статистических пакетах обычно слишком узкие, так как они предполагают, что модель верна, хотя на самом деле это не так .
- Независимость — залог качества. Специалист считает, что климатологи и эпидемиологи не должны координировать свои действия слишком тесно; только независимые модели позволяют увидеть реальный разброс неопределенности .
- Право на отказ. В рамках «мандатной науки» (когда ученых заставляют давать ответы на острые вопросы) важно уметь признавать нехватку данных. Например, в ходе расследования скандала с зараженной кровью Шпигельхалтер отказался называть число зараженных гепатитом B, заявив, что улики слишком слабы .
🎲 Анатомия удачи: три вида везения 23:04
Удача, по определению Дэвида, это «случайность, воспринятая на свой счет» . Опираясь на труды философов, он выделяет три типа удачи:
- Конститутивная удача (Constitutive luck): Самый важный тип. Это то, кем вы родились: ваши гены, родители, эпоха, среда. У человека нет контроля над этими факторами, но они определяют всю его жизнь .
- Обстоятельственная удача (Circumstantial luck): Нахождение в нужном (или ненужном) месте в конкретный момент времени .
- Результативная удача (Outcome luck): Чистое везение в конкретном эпизоде, «слепой случай» .
В качестве примера приводится история деда статистика, Сесила Шпигельхалтера, в Первой мировой войне. Он служил офицером по газовой защите в 1918 году — на должности с ожидаемой продолжительностью жизни в две недели . После ранения он был признан негодным к службе на передовой, что спасло ему жизнь: позже его батальон попал под масштабное немецкое наступление и был практически уничтожен .
🃏 Магия чисел и парадокс дней рождения 28:52
Статистик приводит поразительный факт: количество возможных комбинаций при перемешивании колоды из 52 карт составляет $52!$ (52 факториал). Это число примерно равно $10^{68}$ . Это сопоставимо с количеством атомов в нашей галактике . Дэвид Шпигельхалтер утверждает, что с огромной долей вероятности любая колода, которую вы только что тщательно перемешали, находится в порядке, который никогда не встречался за всю историю человечества .
Разбирая тему совпадений, спикер объясняет «парадокс дней рождения»:
- В группе из 23 человек вероятность того, что у двоих совпадут дни рождения, составляет 51% .
- В группе из 80 человек это практически неизбежно .
Для быстрой оценки редких событий Шпигельхалтер предлагает использовать «Полезное правило» (Useful Rule) на основе распределения Пуассона: вероятность того, что событие НЕ произойдет, примерно равна $e^{-M}$, где $M$ — ожидаемое среднее количество таких событий .
Пример с аудиторией (около 400 человек):
- Шпигельхалтер ожидает, что при сравнении последних двух цифр номера телефона у 23 случайно выбранных людей вероятность совпадения хотя бы у одной пары составит 94% . Эксперимент в зале подтвердил это: в нескольких группах нашлось по 2–3 пары с одинаковыми цифрами .
🪄 Иллюзия случайности: Деррен Браун и Euler 31:53
Иногда то, что кажется невероятным везением, является результатом упорства. Спикер вспоминает трюк иллюзиониста Деррена Брауна, который подбросил монету 10 раз подряд и все 10 раз выпал «орел» . Шпигельхалтер объясняет: вероятность этого события при одной попытке — 1 к 1024. Браун потратил 9 часов непрерывных попыток, сделав около 1600 бросков, пока не добился нужной последовательности . По статистическим меркам (геометрическое распределение), Брауну даже не слишком везло — он потратил больше времени, чем средний ожидаемый результат .
В завершение лекции Дэвид раскрывает секрет «невозможного» совпадения с шестью двухжелтковыми яйцами в одной коробке . Хотя вероятность найти такое яйцо — 1 на 1000 (и шанс на 6 штук подряд кажется астрономическим), на самом деле существуют специальные упаковки, состоящие только из двухжелтковых яиц, которые можно купить в супермаркетах за £2–3 . Это еще раз доказывает главный тезис Шпигельхалтера: за каждой цифрой стоят скрытые предположения, и понимание этих допущений — единственный способ не дать себя обмануть.