Теория математического ожидания: от бросания костей до зомби-апокалипсиса

В лекции из цикла MIT OpenCourseWare профессор Эрик Демейн подробно разбирает концепцию математического ожидания в теории вероятностей. На понятных примерах — от бросков игральных костей до анализа азартных игр и раздачи телефонов в популярном корейском сериале про зомби — он демонстрирует, как сложные вероятностные функции можно эффективно свести к одному понятному числу. Главным фокусом занятия становится линейность математического ожидания — фундаментальное свойство, способное кардинально упростить даже самые громоздкие математические вычисления.

🎲 Что такое случайная величина и её среднее значение 0:00

Изучение теории вероятностей невозможно без понимания того, что такое случайная величина. Профессор Эрик Демейн напоминает аудитории парадоксальный, но важный тезис: случайная величина на самом деле не является ни случайной, ни переменной. С математической точки зрения это строго определенная функция, которая отображает пространство элементарных исходов эксперимента на множество действительных чисел. Этот инструмент используется для численного представления результатов различных вычислений в рамках одного эксперимента. Похожая концепция ранее встречалась в курсе при изучении конечных автоматов, где производные переменные также представляли собой функции от состояний машины к числам.

Особое место в теории вероятностей занимает индикаторная случайная величина. Её выходное значение всегда равно либо 0, либо 1. Единица указывает на то, что целевое событие произошло, а ноль — на то, что событие не состоялось. Поскольку функции в пространстве вероятностей могут быть чрезвычайно сложными и требовать вычисления огромного количества чисел (по одному для каждого возможного исхода), математикам необходим способ лаконичного описания этих функций.

Математическое ожидание — это как раз тот метод, который позволяет сжать комплексную функцию до одного-единственного информативного числа. Ожидание не показывает наиболее вероятный исход эксперимента, вопреки бытовому пониманию этого слова. Оно представляет собой среднее значение всех возможных исходов, взвешенное по их вероятностям. Формально математическое ожидание случайной величины $X$ в пространстве исходов $S$ записывается как сумма по всем элементарным исходам омега произведения вероятности этого исхода на значение функции $X$ от этого исхода. Если все исходы равновероятны, то математическое ожидание превращается в обычное среднее арифметическое.

Для иллюстрации этого принципа профессор Демейн приводит простейший пример с броском честной шестигранной кости. Каждое из значений от 1 до 6 имеет одинаковую вероятность выпадения — 1/6. Чтобы рассчитать математическое ожидание, необходимо сложить произведения каждого значения на его вероятность:

$(1/6 \cdot 1) + (1/6 \cdot 2) + \dots + (1/6 \cdot 6)$.

Вынеся общую дробь 1/6 за скобки, профессор применяет знаменитую формулу Гаусса для вычисления суммы треугольного числа (суммы чисел от 1 до 6). В результате несложных сокращений получается значение 7/2, или 3,5.

Этот пример наглядно доказывает важный теоретический нюанс: математическое ожидание часто бывает величиной, которую в реальности получить невозможно. На гранях игрального кубика нет числа 3,5, однако именно оно является средним ожидаемым результатом при долгой серии бросков.

При расчете математического ожидания для индикаторной случайной величины $I$ формулы значительно упрощаются. Несмотря на то, что пространство исходов может включать в себя миллионы элементов, индикатор делит их всего на две группы: где событие произошло (умножение на 1) и где оно не произошло (умножение на 0). Вся часть суммы с нулевыми коэффициентами исчезает, а оставшаяся часть представляет собой просто сумму вероятностей исходов, входящих в целевое событие. Таким образом, математическое ожидание индикаторной случайной величины всегда в точности равно вероятности того, что эта величина примет значение 1.

🎰 Математика азартных игр и заговор ассистентов 8:54

Исторически теория вероятностей зарождалась как инструмент для анализа азартных игр. Чтобы продемонстрировать практическую силу математического ожидания, лектор предлагает студентам сыграть в импровизированную настольную игру с банком и ставками. Вместо реальных денег в качестве валюты используются покерные фишки и конфеты.

Правила игры выглядят следующим образом:

В каждом раунде принимают участие три игрока.
Каждый участник вносит в общий банк (пот) фиксированную сумму в размере 2 долларов.
Каждый игрок тайно или последовательно выбирает одну из сторон монеты — «орел» (Heads) или «решка» (Tails).
Ведущий производит бросок честной монеты.
Общий банк поровну распределяется между всеми, кто угадал правильный исход.
Если никто не угадал исход, банк делится поровну между всеми участниками (игроки забирают свои деньги назад).

Для участия в эксперименте вызываются два волонтера: студентка Клео и ассистентка профессора (TA) по имени Дженни. Роль монеты выполняет огромный игральный кубик, в котором значения 1, 2 и 3 интерпретируются как «решка» (tiny), а 4, 5 и 6 — как «орел» (huge).

В ходе демонстрации Дженни принимает решения молниеносно. Профессор иронично признается, что заранее подговорил её пойти на жульничество с целью его «разорения». Стратегия Дженни заключалась в том, чтобы всегда называть сторону, противоположную выбору Клео или профессора. В результате серии бросков Клео выигрывает практически все конфеты, а профессор Демейн шутит, что не сильно расстроен, так как у него непереносимость лактозы.

Математический анализ этой игры с помощью дерева решений показывает скрытые механизмы распределения выигрыша. Если бы все три игрока выбирали стороны абсолютно случайно и независимо друг от друга с вероятностью 50/50, то чистый ожидаемый доход каждого составил бы ровно 0 долларов. Это пример так называемой «честной игры» (fair game), где на дистанции каждый участник остается при своих.

Однако в условиях, когда Дженни намеренно выбирала позицию, противоположную выбору Клео, математическое ожидание профессора драматически изменилось. Из-за такой стратегии в игре всегда присутствовали и «орел», и «решка» со стороны оппонентов Демейна. Это гарантировало, что профессор никогда не сможет стать единственным уникальным победителем и забрать весь банк в 6 долларов. Его максимальный выигрыш ограничивался разделением банка с кем-то еще (чистая прибыль +1 доллар), в то время как при проигрыше он терял полные 2 доллара. Математическое ожидание чистого дохода профессора при такой стратегии соперников составило минус 0,5 доллара за раунд. Для двух кооперирующихся игроков (Клео и Дженни) игра, напротив, стала гарантированно прибыльной с суммарным ожиданием +0,5 доллара.

🎟️ Как обыграть лотерею: опыт Германа Чернова 25:15

Описанная выше игровая модель с распределением банка между победителями может показаться искусственной, однако именно по такому принципу долгое время функционировала государственная лотерея штата Массачусетс (Massachusetts lottery). В ней участники пытались угадать последовательность из четырех цифр. Если выигрышных билетов оказывалось много, главный приз делился между ними поровну.

Знаменитый профессор MIT Герман Чернов (Herman Chernoff) подробно изучил эту систему и опубликовал фундаментальную работу под названием «Как обыграть массачусетскую игру чисел». Даже с учетом того, что государство забирало себе колоссальную долю прибыли (от 40% до 60%), Чернову удалось разработать математически выигрышную стратегию и заработать на этом деньги.

Суть стратегии основывалась на предсказуемости человеческой психологии. Поскольку все комбинации чисел имели абсолютно одинаковую вероятность выпадения, для максимизации математического ожидания выигрыша следовало выбирать те числовые последовательности, которые реже всего выбирались остальными людьми. Из архивных данных Чернов выяснил, что люди крайне неохотно выбирали комбинации с цифрами 0 и 9, отдавая предпочтение более мелким цифрам. Ставя на непопулярные числа (в основном от 5 до 8), профессор минимизировал риск деления джекпота с другими гипотетическими победителями, что делало математическое ожидание его билета положительным. Впоследствии аналогичные, но усовершенствованные стратегии успешно применялись группами студентов MIT для получения крупной прибыли на измененных версиях массачусетской лотереи.

📐 Теоремы и формулы: упрощение вычислений 27:16

Чтобы избавить математиков от необходимости каждый раз просчитывать гигантские пространства элементарных исходов, существует важная теорема. Согласно ей, математическое ожидание можно вычислять как сумму произведений конкретных значений случайной величины на вероятность того, что величина примет именно эти значения. Это сокращает количество слагаемых от размера всего пространства исходов до размера области значений функции. Например, при расчете ожидания суммы двух игральных костей вместо перебора 36 парных исходов достаточно оперировать лишь возможными суммами.

Профессор демонстрирует применение этой теоремы на классической задаче комбинаторики: расчет ожидаемого количества карт масти черви в руке из 3 карт, случайно сданных из стандартной колоды в 52 карты без возвращения. Случайная величина здесь может принимать только четыре значения: 0, 1, 2 или 3 червей.

Вероятность для каждого случая рассчитывается через биномиальные коэффициенты. Так, для 3 червей формула выглядит как отношение числа способов выбрать 3 карты из 13 червей колоды к общему числу способов вытащить 3 карты из 52:

$\binom{13}{3} / \binom{52}{3}$.

Подставив все рассчитанные вероятности в формулу математического ожидания, после сокращения огромных факториалов ученые получают удивительно изящный и точный ответ: 3/4.

В специальном случае, когда кодоменом (областью значений) случайной величины являются только натуральные числа (0, 1, 2, 3 и так далее), формулу математического ожидания можно преобразовать еще глубже. Профессор Эрик Демейн выводит два альтернативных представления через кумулятивную функцию распределения (CDF): сумму вероятностей того, что величина больше или равна $i$ (где $i$ идет от 1 до бесконечности), либо сумму вероятностей того, что величина строго больше $i$ (где $i$ идет от 0 до бесконечности).

Для доказательства этого тождества лектор расписывает бесконечные ряды в виде таблицы-матрицы. При сложении элементов по вертикальным столбцам исходные вероятности группируются таким образом, что перед каждой вероятностью $P(X = i)$ возникает в точности коэффициент $i$. Профессор настойчиво предостерегает студентов от типичной ошибки на экзаменах: попытки смешать эти формулы и ошибочно умножить вероятность $P(X \ge i)$ на индекс $i$, что приводит к абсолютно неверным результатам.

⏳ Время до отказа и увлечение автоматами Гатяпон 41:01

Одной из важнейших концепций в прикладной статистике является «среднее время до отказа» (Mean time to failure). В более позитивном ключе этот же инструмент называют «средним временем до достижения успеха». Задача формулируется следующим образом: у нас есть монета с вероятностью выпадения орла, равной $p$. Сколько в среднем раз нужно подбросить эту монету, чтобы впервые выпал орел?

Эта модель напрямую применяется в инженерном деле и IT. Например, зная, что в любой конкретный день вероятность выхода из строя жесткого диска ноутбука составляет одну миллионную, можно рассчитать, сколько дней диск прослужит в среднем до поломки. Аналогично концепция работает в анализе рандомизированных алгоритмов: если алгоритм находит решение задачи с определенной вероятностью $p$, а в остальных случаях выдает ошибку, среднее время до успеха показывает, сколько раз его придется перезапустить.

Для решения этой задачи через выведенную ранее формулу CDF рассматривается событие «для получения орла потребовалось строго больше $i$ бросков». Это эквивалентно утверждению, что все первые $i$ бросков завершились выпадением решки. Вероятность такого исхода для независимых испытаний равна $(1 - p)^i$. Подставив это в бесконечную геометрическую прогрессию, математики получают фундаментальную формулу: среднее количество испытаний до первого успеха равно $1/p$.

Если вероятность выпадения орла на честной монете равна 0,5, то среднее число бросков до его появления равно 2. Профессор напоминает, что в реальном эксперименте со студентами ранее потребовалось целых 7 бросков для смены стороны, что лишний раз подчеркивает: среднее значение не гарантирует точного совпадения в единичном опыте. Такое распределение вероятностей в математике называется геометрическим распределением.

Остроумным примером применения геометрического распределения в реальной жизни является так называемая «задача коллекционера купонов», которая сегодня невероятно актуальна в контексте видеоигр и популярной азиатской культуры «гача» (gacha). Само слово происходит от японских автоматов «гашапон» (gashapon), торгующих случайными игрушками в пластиковых капсулах за 200 иен. Профессор Демейн признается, что сам тратит много свободного времени на подобные игры, но настоятельно призывает студентов не увлекаться ими из-за сильной психологической зависимости.

В простейшем случае «гачи» с двумя абсолютно равновероятными игрушками (вероятность каждой 50/50) первый же ход гарантированно приносит коллекционеру одну новую игрушку. После этого задача сводится к монете: какова вероятность вытащить вторую, отличную от первой игрушку? Она равна 0,5, а значит, по формуле $1/p$ потребуется в среднем еще 2 попытки. Суммарное ожидаемое число ходов для сбора коллекции из двух предметов составляет 3. При увеличении числа уникальных предметов задача усложняется, поскольку собрать самые последние редкие экземпляры становится все труднее, а в расчетах начинает фигурировать гармонический ряд и логарифмический фактор.

⚡ Суперсила линейности математического ожидания 52:41

Профессор Эрик Демейн открыто заявляет: если из всего курса теории вероятностей студенты должны запомнить только одну вещь, то это обязана быть линейность математического ожидания. Это свойство он называет одновременно самым красивым и самым полезным инструментом во всей дисциплине.

Математическая суть линейности проста: математическое ожидание суммы нескольких случайных величин всегда строго равно сумме их индивидуальных математических ожиданий. Магическая сила этой теоремы кроется в полном отсутствии каких-либо предварительных условий. Для её применения случайные величины:

НЕ обязаны быть независимыми друг от друга;
НЕ обязаны быть несовместными или дисъюнктными;
Должны быть просто функциями, заданными на одном и том же пространстве исходов.

В этом заключается колоссальное отличие линейности от других законов вероятности, таких как правило умножения вероятностей (требующее строгой независимости событий) или закон полной вероятности (требующий несовместности).

Линейность ожидания позволяет элегантно решать задачи, которые в лоб потребовали бы громоздких расчетов. Например, если мы бросаем две честные шестигранные кости, то ожидаемое значение их суммы рассчитывается моментально: ожидание первой кости (3,5) плюс ожидание второй кости (3,5) дает в сумме 7.

Самое поразительное, что этот результат останется неизменным, даже если кости будут квантово запутаны или намертво склеены друг с другом так, что значение одной жестко определяет значение другой. Склеивание кардинально изменит само распределение вероятностей, но никак не повлияет на математическое ожидание суммы.

Основной метод использования линейности на практике заключается в декомпозиции: разбиении одной сложной и комплексной случайной величины на сумму множества простых величин, чаще всего индикаторных. Так, задачу о поиске среднего числа бросков монеты до получения двух орлов можно представить как сумму двух независимых шагов: время до первого орла ($1/p$) плюс время от первого до второго орла ($1/p$), что дает лаконичный ответ $2/p$ (а для $k$ орлов — $k/p$). Если же мы фиксированно бросаем монету $n$ раз, то общее ожидаемое число орлов по принципу линейности будет равно просто $n \cdot p$, причем это правило сработает даже для зависимых между собой бросков.

📱 Проблема перепутанных телефонов и зомби-апокалипсис 1:11:07

Финальным аккордом лекции становится разбор классической комбинаторной задачи, поданной через призму современной поп-культуры. Профессор ссылается на корейский сериал о зомби-апокалипсисе в старшей школе «Мы все мертвы» (All of Us are Dead). В азиатских школах распространена практика, когда ученики сдают свои мобильные телефоны при входе в здание. Представим гипотетический сценарий, в котором из-за нашествия зомби администрация школы в панике возвращает гаджеты детям абсолютно случайно. Сколько школьников в среднем получат назад именно свои собственные телефоны?

Для решения этой задачи напрямую через пространство исходов пришлось бы оперировать понятием субфакториала и беспорядков (derangements), что крайне сложно. Однако метод декомпозиции и линейность ожидания решают её в несколько строк. Мы вводим индикаторную случайную величину для каждого из $n$ учеников, которая равна 1, если ребенок получил свой телефон, и 0 в противном случае.

Вероятность для любого конкретного школьника получить свой телефон из общей кучи равна ровно $1/n$. Поскольку всего у нас $n$ учеников, мы складываем эти вероятности $n$ раз:

$1/n + 1/n + \dots + 1/n = 1$.

Таким образом, в среднем ровно один школьник получит свой телефон назад, независимо от того, учится в школе 10 детей или 10 000.

Чтобы окончательно разграничить понятия математического ожидания и распределения вероятностей, профессор Демейн предлагает альтернативный сценарий с телефонами. Представьте, что группа из $n$ посетителей ресторана выкладывает свои смартфоны на вращающийся круглый стол для китайских блюд («Ленивая Сьюзан»). Стол раскручивают uniformly at random, и он останавливается в одном из $n$ дискретных положений.

В этой модели распределение исходов радикально отличается от предыдущего: здесь возможны всего два варианта. Либо стол повернется на 0 градусов, и тогда абсолютно ВСЕ участники (все $n$ человек) получат свои телефоны, либо стол сместится, и тогда вообще НИКТО (0 человек) не получит свой гаджет. Вероятность идеального совпадения равна $1/n$, а вероятность полного провала — $(n-1)/n$.

Если рассчитать математическое ожидание для этой игры ужинающих людей по классическому определению, мы умножаем исход «все получили телефоны» ($n$) на его вероятность ($1/n$) и прибавляем исход «никто не получил» ($0$):

$n \cdot (1/n) + 0 \cdot ((n-1)/n) = 1$.

Математическое ожидание снова в точности равно единице.

Этот пример ярко резюмирует философию лекции: две игровые ситуации имеют совершенно разные законы распределения, полярное поведение и кардинально разные риски, однако их математическое ожидание идентично. Одно единственное число способно дать удобную среднюю оценку, но оно принципиально не может описать всю полноту и нюансы вероятностной картины. Именно детальному изучению того, что происходит за границами математического ожидания, профессор обещает посвятить следующие лекции курса.