# Как клип группы OK Go подтвердил математический закон Мерфи

Источник: https://www.youtube.com/watch?v=047B4UrEaNw
Канал: MIT OpenCourseWare
Опубликовано: 22.07.2025

---

В лекции профессора Эрика Демейна из MIT рассматриваются фундаментальные понятия теории вероятностей — математическое ожидание и дисперсия. На ярких примерах, включая знаменитый клип рок-группы OK Go и архитектуру процессоров, демонстрируется, как оценивать риски и почему статистика может вводить в заблуждение. Профессор подробно объясняет, как строгие математические законы помогают принимать эффективные решения в реальной жизни, от инженерии до инвестиций.

## 🧮 Возврат к основам: три формулы математического ожидания
[[JUMP:0:00]]

Изучение теории вероятностей невозможно без глубокого понимания математического ожидания. Для случайной величины $X$, заданной на пространстве исходов $S$ и возвращающей вещественные числа, существуют три основные формулы расчета в зависимости от сценария.

Первая формула — это классическое определение математического ожидания как суммы по всем возможным исходам $\omega$:

$$E[X] = \sum_{\omega \in S} P(\omega) \cdot X(\omega)$$

Второй эквивалентный вариант группирует слагаемые по уникальным значениям, которые принимает случайная величина $X$:

$$E[X] = \sum_{x \in \text{Range}(X)} P(X = x) \cdot x$$

Третий случай применим, когда случайная величина принимает только значения из множества натуральных чисел. Тогда математическое ожидание можно представить в виде бесконечного ряда через функцию распределения:

$$E[X] = \sum_{i=1}^{\infty} P(X \ge i)$$

Для индикаторных случайных величин (принимающих значения 0 или 1) формула упрощается до предела: математическое ожидание равно вероятности того, что событие произойдет ($P(X = 1)$).

Главным рабочим инструментом лектора выступает свойство линейности математического ожидания. Оно позволяет вносить константы и знаки суммирования внутрь оператора ожидания и выносить их наружу:

$$E[aX + bY] = aE[X] + bE[Y]$$

## 📉 Границы вероятностей: за пределами простого подсчета
[[JUMP:2:34]]

Чтобы понять, как эти формулы работают на практике, профессор предлагает рассмотреть систему из $n$ произвольных событий $E_1, E_2, \dots, E_n$. Эти события могут отражать как позитивные сценарии, так и негативные — например, различные варианты критического сбоя компьютерного алгоритма.

Если определить случайную величину $N$ как общее число произошедших событий, то её математическое ожидание рассчитывается по формуле:

$$E[N] = \sum_{i=1}^{n} P(E_i)$$

Для доказательства этого утверждения Демейн использует стандартный аналитический прием: разбивает сложную случайную величину на сумму простейших индикаторов $I_i$ для каждого отдельного события. Поскольку $N = \sum I_i$, по свойству линейности мы получаем сумму их математических ожиданий, которые равны вероятностям $P(E_i)$. 

Частным случаем этой теоремы является классическая задача о монетах: если подбросить смещенную монету $n$ раза с вероятностью выпадения орла $p$, то ожидаемое число орлов составит $np$.

Однако для инженеров важнее знать не просто среднее число сбоев, а вероятность того, что произойдет хотя бы один отказ системы. На помощь приходит граница объединения (Union bound). Она утверждает, что вероятность наступления хотя бы одного события (вероятность объединения множеств) не превышает сумму их индивидуальных вероятностей:

$$P(N \ge 1) \le E[N]$$

Этот закон универсален и работает даже для зависимых событий. Но у него есть существенный недостаток: если событий много, их суммарная вероятность может оказаться больше 1, что делает верхнюю границу абсолютно бесполезной для практического анализа.

## ⛓️ Закон Мерфи в формулах: что может пойти не так
[[JUMP:10:53]]

Если граница объединения дает верхнюю оценку вероятности, то для нижней оценки существует математическая формализация знаменитого «закона Мерфи»: если процессы взаимно независимы, то все, что может пойти не так, обязательно пойдет не так.

Строгая математическая формулировка гласит: если $n$ событий взаимно независимы, то вероятность того, что случится хотя бы одно из них, подчиняется следующему неравенству:

$$P(N \ge 1) \ge 1 - \frac{1}{e^{E[N]}}$$

Из этого уравнения видно, что знаменатель дроби растет экспоненциально по мере увеличения математического ожидания $E[N]$. Это означает, что при большом ожидаемом числе событий вероятность столкнуться хотя бы с одним из них стремительно приближается к 100%.

Чтобы доказать закон Мерфи, профессор Демейн предлагает пойти от обратного и рассчитать вероятность того, что не произойдет ни одного события ($N = 0$). Для взаимно независимых событий их дополнения (отрицания) также независимы. Используя правило произведения и классическое приближение Тейлора $1 - x \le e^{-x}$, мы получаем:

$$P(N = 0) = \prod_{i=1}^n (1 - P(E_i)) \le \prod_{i=1}^n e^{-P(E_i)} = e^{-\sum P(E_i)}$$

Вычитая этот результат из единицы, мы приходим к итоговой экспоненциальной нижней границе успеха (или неудачи).

Для иллюстрации важности фактора независимости Демейн сравнивает два примера из прошлой лекции:

* **Случайная перестановка телефонов:** если студентам возвращают телефоны в случайном порядке, то вероятность того, что никто не получит свой аппарат, рассчитывается через последовательное сокращение дробей и составляет $1 - 1/n$. Этот результат близок к границе объединения и указывает на высокую степень независимости исходов.
* **Вращающийся стол (Lazy Susan):** если все телефоны лежат на вращающемся столе, исходы становятся жестко зависимыми. Либо все студенты одновременно получат свои телефоны (с вероятностью $1/n$), либо никто (с вероятностью $1 - 1/n$). В данном сценарии вероятность успеха равна всего лишь $1/n$, что грубо нарушает нижнюю границу закона Мерфи (0.63) именно из-за тотальной взаимосвязи событий.

## 🎬 Рок-н-ролл и математика: безумный эксперимент OK Go
[[JUMP:24:42]]

Теория вероятностей позволяет по-новому взглянуть на современную поп-культуру. В качестве примера профессор демонстрирует культовый клип рок-группы OK Go на песню *«This Too Shall Pass»*. Видео представляет собой гигантскую, непрерывную цепную реакцию — машину Руба Голдберга, состоящую из множества каскадных элементов: от катящихся шаров до падающих домино.

> «Я дружу с Дамианом, солистом группы, — делится личной историей Эрик Демейн. — Я спросил его, как им вообще удалось заставить эту штуку работать?»

По словам музыканта, конструкция насчитывала порядка 130 последовательных компонентов. Профессор предлагает провести несложные расчеты: если предположить, что каждый элемент спроектирован качественно и имеет высокий шанс на успех в 90% (вероятность сбоя $p = 10\%$), какова вероятность того, что вся машина отработает без единой ошибки?

Точный расчет по формуле $1 - (1 - p)^n$ дает шокирующий результат: вероятность общего сбоя составляет **99.99989%**. Шанс получить идеальный дубль равен примерно 1 из 1 000 000.

Как же музыканты сняли этот клип? Дамиан признался профессору, что их главный секрет заключался в том, чтобы «считать математику уже после того, как видео снято, а не до этого».

Если бы инженерам удалось снизить вероятность отказа каждого компонента до 1%, общий шанс провала составил бы 73%. Это вполне рабочий сценарий: в среднем из четырех дублей один окажется удачным. При надежности узлов в 99.9% общая вероятность брака падает до комфортных 12%.

В реальности авторов клипа спасли законы физики: ближе к финалу масштаб взаимодействий увеличивался. Тяжелые шары для боулинга практически не подвержены влиянию сквозняков в помещении, поэтому их надежность стремилась к абсолютным 100%. Хуже всего дело общалось с коварными костяшками домино в самом начале видео — по слухам, их пересобирали около 6 миллиардов раз. Тем не менее, вопреки колоссальному математическому давлению закона Мерфи, группе удалось зафиксировать один идеальный дубль.

## ✖️ Умножение и опасности деления случайных величин
[[JUMP:33:34]]

Для независимых случайных величин действует удобное правило произведения: математическое ожидание их произведения равно произведению их индивидуальных математических ожиданий:

$$E[X \cdot Y] = E[X] \cdot E[Y]$$

Это легко доказывается через перегруппировку слагаемых по парам значений $(x, y)$ и применение правила произведения вероятностей для независимых событий.

Если запустить гипотетическую игру с броском двух независимых честных шестигранных костей, где итоговый счет равен произведению выпавших граней, то ожидаемый результат составит $3.5 \cdot 3.5 = 12.25$. Однако, если мы попытаемся умножить результат кости самой на себя ($E[D_1^2]$), условие независимости нарушится самым радикальным образом. Расчет через сумму квадратов исходов дает совершенно другое, гораздо большее число — примерно $15.1666$.

Если умножение независимых величин математически прозрачно, то с делением ситуация критическая. Профессор формулирует жесткое правило:

> «Никогда не делите случайные величины. Вообще никогда. Я покажу вам почему».

Математическое ожидание дроби $1/X$ почти никогда не равно перевернутому ожиданию $1/E[X]$. Рассмотрим простейший пример: случайная величина $X$ с равной вероятностью 50% принимает значения 1 или -1. Ее математическое ожидание $E[X] = 0$. Попытка рассчитать $1/E[X]$ приводит к делению на ноль и уходит в бесконечность. При этом величина $1/X$ по-прежнему принимает значения 1 или -1, и ее реальное математическое ожидание $E[1/X]$ остается равным нулю.

Демейн приводит реальный пример деструктивного влияния этой ошибки из научной публикации по компьютерной архитектуре. Исследователи сравнивали производительность двух процессоров ($P_1$ и $P_2$) на базе трех одинаковых бенчмарков с равной вероятностью выполнения.

В средних абсолютных значениях времени выполнения оба процессора показали одинаковый результат — 10 секунд, то есть их отношение в среднем равно 1 (они равны по эффективности). Однако авторы статьи решили посчитать математическое ожидание *отношения* скоростей $E[P_1 / P_2]$ и получили значение $10/9$, из чего сделали ложный вывод, будто процессор $P_2$ эффективнее. Ирония в том, что обратное ожидание $E[P_2 / P_1]$ для тех же чисел тоже составило $10/9$, что математически доказывало прямо противоположное — превосходство $P_1$.

Это наглядная демонстрация того, как с помощью некорректных операций над случайными величинами можно манипулировать статистикой и фальсифицировать любые научные выводы.

## ⚖️ Дисперсия и мера риска: почему квадрат имеет значение
[[JUMP:46:33]]

Математическое ожидание эффективно сжимает сложную функцию распределения до одного понятного числа. Однако его недостаточно для оценки реальной картины. Чтобы понять, насколько точным и надежным является это среднее значение, вводится вторая важнейшая характеристика — дисперсия (Variance).

Классический пример, иллюстрирующий необходимость дисперсии — инвестиции (или, как иронично подмечает профессор, азартные игры). Представим стратегию $X_i$, где инвестор с вероятностью 50% удваивает вложенные средства ($+i$), а с вероятностью 50% теряет их ($-i$).

Для любого объема инвестиций — будь то 1 доллар или 1 миллиард долларов — математическое ожидание прибыли всегда будет равно нулю ($E[X] = 0$). Но очевидно, что риск потери миллиарда несопоставимо выше. Математическое ожидание полностью слепо к этому риску, в то время как дисперсия призвана его зафиксировать.

Формула дисперсии случайной величины выглядит следующим образом:

$$\text{Var}(X) = E[(X - E[X])^2]$$

Внутри формулы мы сначала берем отклонение величины от ее среднего значения ($X - E[X]$). Математическое ожидание этой центрированной разности всегда равно нулю, поскольку $E[X]$ является константой и $E[E[X]] = E[X]$. Чтобы избавиться от нулевого результата, разность возводят в квадрат, а затем берут математическое ожидание от полученной конструкции.

Для нашего инвестиционного примера дисперсия стратегии $\text{Var}(X_i)$ будет в точности равна $i^2$. Квадрат эффективно нивелирует знаки, одинаково трактуя как взлеты, так и падения инвестора. Чтобы вернуть метрику к исходной размерности, используют стандартное отклонение (Standard deviation, $\sigma_X$), равное квадратному корню из дисперсии. В данном случае $\sigma = i$, что дает точную, линейную оценку масштаба риска инвестиций.

Профессор Демейн подробно отвечает на вопрос, почему в формуле используется именно квадрат, а не модуль или более высокая степень $p$:

1.  **Высшие центральные моменты:** если возводить отклонение в степень $p > 1$, мы получаем центральные моменты распределения. Третий момент определяет асимметрию («скошенность» или skew) распределения, а четвертый имеет сложное название эксцесс (kurtosis). Все они по-своему полезны, но дисперсия остается базовой метрикой.
2.  **Аналитическое удобство:** в отличие от модуля, функция квадрата является гладкой и бесконечно дифференцируемой, что критически важно для строгого математического анализа.
3.  **Природа нормального распределения:** согласно Центральной предельной теореме, сумма большого количества независимых испытаний Бернулли (подбрасываний монет) стремится к распределению Гаусса (колоколообразной кривой). Для полного описания нормального распределения достаточно знать всего два параметра — математическое ожидание и дисперсию.
4.  **Геометрический смысл:** «Поскольку я геометр, я не могу не отметить: мы живем в евклидовом мире, где принято все возводить в квадрат», — шутит лектор. Если представить случайную величину как вектор в $|S|$-мерном пространстве исходов, то стандартное отклонение — это в точности геометрическое расстояние между вектором случайной величины и вектором ее среднего значения.

## 💼 Свойства дисперсии и диверсификация портфеля
[[JUMP:1:01:18]]

Дисперсия обладает рядом уникальных математических свойств, которые лектор предлагает подробно разобрать перед окончанием занятия.

Первое важнейшее свойство — инвариантность к сдвигу (translation invariance). Если к случайной величине прибавить константу, ее математическое ожидание послушно сдвинется, но дисперсия останется неизменной, так как константы полностью сокращаются внутри уравнения:

$$\text{Var}(X + c) = \text{Var}(X)$$

Второе свойство — альтернативная и крайне удобная формула вычисления, которую студенты будут доказывать на практических занятиях:

$$\text{Var}(X) = E[X^2] - (E[X])^2$$

С ее помощью можно легко найти дисперсию индикаторной величины (например, броска монеты с вероятностью орла $p$). Поскольку для индикатора $H^2 = H$, формула сводится к элегантному виду: $p - p^2 = p(1 - p)$.

Третье свойство касается масштабирования: при умножении случайной величины на константу дисперсия увеличивается в квадрат этой константы:

$$\text{Var}(cX) = c^2 \text{Var}(X)$$

Четвертое свойство — дисперсия суммы. В отличие от линейного математического ожидания, сложить дисперсии двух величин можно **только при условии их независимости**:

$$\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y)$$

Для $n$ независимых бросков монет общая дисперсия числа выпавших орлов составит $np(1 - p)$.

В финале лекции профессор Демейн связывает эти свойства с фундаментальным правилом управления финансами. Предположим, у инвестора есть $n$ долларов, которые он хочет распределить между $k$ различными независимыми акциями (активами). Каждая акция ведет себя как независимая случайная величина $S_i$ и с равной вероятностью может принести $+1$ или $-1$ к вложенному доллару.

Если инвестор разделит капитал поровну, вложив в каждую акцию по $n/k$ долларов, совокупный исход его портфеля опишется суммой $\sum \frac{n}{k} S_i$. Используя свойства выноса квадрата константы и сложения независимых дисперсий, Демейн выводит итоговую дисперсию (риск) портфеля:

$$\text{Var}(\text{Portfolio}) = \sum_{i=1}^n \left(\frac{n}{k}\right)^2 \cdot \text{Var}(S_i) = n \cdot \frac{n^2}{k^2} \cdot 1 = \frac{n^3}{k^2}$$

Извлекая квадратный корень для получения стандартного отклонения, мы видим, что совокупный риск портфеля обратно пропорционален числу активов $k$.

Именно поэтому финансисты настойчиво рекомендуют диверсифицировать свой инвестиционный портфель. Распределение средств по независимым активам напрямую, математически снижает совокупный риск инвестора. На реальном рынке активы часто взаимозависимы, что несколько снижает эффект, но базовый математический принцип диверсификации остается незыблемым и главным правилом сохранения капитала.