Бринмор Чэпмен: «Случайная величина — это просто функция»

MIT OpenCourseWare 3,3 тыс. 1 ч 10 мин 9 мин 22.07.2025
Главное

В рамках курса Массачусетского технологического института (MIT OpenCourseWare) преподаватель Бринмор Чэпмен представляет глубокий анализ одного из самых неоднозначных понятий теории вероятностей — случайных величин. Вопреки исторически сложившемуся названию, эти объекты не содержат в себе элемента случайности и не являются переменными в привычном смысле. Лектор подробно объясняет математическую суть концепции, иллюстрирует её прикладное значение на примере создания выигрышных алгоритмов и демонстрирует силу математической аппроксимации для сложных распределений.

🎲 Парадокс названия: почему случайная величина вовсе не случайная 0:00

В начале своего выступления Бринмор Чэпмен сразу обращает внимание аудитории на лингвистический парадокс: термин «случайная величина» (random variable) является очевидным мисномерном, закрепившимся в науке исключительно по историческим причинам. На самом деле этот математический объект не является ни случайным, ни переменным. С технической точки зрения, случайная величина — это обыкновенная детерминированная функция, которая отображает элементы пространства исходов случайного эксперимента в множество вещественных чисел.

Для демонстрации этого тезиса Чэпмен предлагает рассмотреть классический мысленный эксперимент с одновременным подбрасыванием трех симметричных, физически независимых монет. Пространство исходов данного эксперимента представляет собой упорядоченные тройки, состоящие из «орлов» (heads) и «решек» (tails) — всего существует восемь равновероятных комбинаций.

На этом пространстве исходов можно определить несколько различных случайных величин:

Каждая из этих функций берет конкретный, уже зафиксированный исход эксперимента и по строгим правилам сопоставляет ему число, что полностью исключает элемент неопределенности на этапе работы самой функции.

📊 Индикаторы и порождение новых событий 5:06

Особое место в теории вероятностей занимают функции, подобные $g(\omega) и h(\omega)$, область значений которых ограничена строго нулем и единицей. Преподаватель дает им фундаментальное определение — индикаторы, или бинарные случайные величины. По словам Чэпмена, индикаторы и классические случайные события находятся в неразрывной математической взаимосвязи.

Любой индикатор естественным образом порождает событие: подмножество исходов, на которых функция принимает значение 1, эквивалентно наступлению исследуемого события, а подмножество исходов со значением 0 формирует его дополнение. Справедливо и обратное утверждение.

Для любого произвольного события $A$ можно сконструировать собственный индикатор, обозначаемый в математической литературе как $\mathbb{1}_A$. Данная функция будет равна единице для всех исходов, входящих в подмножество $A$, и нулю для исходов вне его.

Обобщая эту логику на любые случайные величины, Чэпмен вводит стандартную вероятностную нотацию. Если имеется функция $f$ и некоторое число $x$, математики могут зафиксировать событие, записываемое как $f = x$. Под этой лаконичной записью скрывается полноценное множество исходов эксперимента $\omega$, для которых выполняется равенство $f(\omega) = x$. Аналогичным образом конструируются более сложные предикаты, например, события вида $f \ge x$ или утверждение о принадлежности значения функции некоторому подмножеству вещественных чисел.

🔗 Условная вероятность и тонкости независимости 11:22

Поскольку математические выражения, построенные на основе случайных величин, по сути описывают классические события, к ним применимы все базовые инструменты теории вероятностей, включая кондиционирование (вычисление условной вероятности) и анализ независимости. Чэпмен иллюстрирует условную вероятность на примере ранее созданных функций для трех монет. Если необходимо найти вероятность того, что функция количества «орлов» $f$ равна двум, при условии, что индикатор совпадения всех монет $h$ равен единице, математическая запись примет вид $P(f=2 \mid h=1)$.

Развернув формулу условной вероятности через отношение пересечения событий к вероятности условия, становится очевидно, что искомое значение равно нулю. По мнению лектора, этот результат интуитивно понятен: если известно, что все три монеты упали одинаково, то выпадение ровно двух «орлов» становится физически невозможным.

Однако при переходе к понятию независимости случайных величин математический аппарат начинает заметно усложняться. Чэпмен подчеркивает принципиальное различие: две случайные величины $f$ и $g$ признаются независимыми тогда и только тогда, когда условие независимости выполняется для всех возможных пар значений $x$ и $y$, которые эти функции могут принять. Математически это выражается через равенство:

$$P(f = x, g = y) = P(f = x) \cdot P(g = y)$$

Для обычных событий достаточно проверить независимость одной конкретной пары подмножеств. Для случайных величин требуется тотальная квантификация по всей области значений. В качестве альтернативы лектор предлагает использовать эквивалентное определение через условную вероятность: знание того, какое именно значение приняла величина $g$, не должно менять безусловную вероятность для величины $f$.

Анализируя базовый пример с тремя монетами, Чэпмен вместе со студентами приходит к следующим выводам:

📈 От пространства исходов к распределениям: PMF и CDF 21:57

Историческое развитие математики привело к тому, что ученые научились абстрагироваться от сложной внутренней структуры исходного пространства исходов и переключили внимание непосредственно на поведение значений случайных величин. Инструментом для такой абстракции выступает понятие распределения, которое описывает вероятности, с которыми случайная величина принимает те или иные значения.

Для детального описания распределения дискретных случайных величин используется функция вероятностной массы (PMF), определяющая точную вероятность равенства функции конкретному числу: $p_f(x) = P(f = x)$. Чэпмен делает важную терминологическую ремарку: в некоторых учебниках, включая используемый в курсе MIT текст, эту функцию называют PDF (функцией плотности вероятности).

Однако лектор призыват разделять эти понятия. Плотность (PDF) необходима для непрерывных величин, где вероятность попасть в конкретную точку всегда равна нулю — подобно дротику, который никогда не попадет в идеальную математическую точку на мишени. Для дискретных же систем использование термина PMF является более строгим и корректным.

Параллельно с PMF вводится кумулятивная функция распределения (CDF), которая рассчитывается как вероятность того, что случайная величина не превысит заданное значение $x$:

$$F_f(x) = P(f \le x) = \sum_{y \le x} P(f = y)$$

Чэпмен наглядно демонстрирует поведение этих функций на базовых примерах:

🍬 Задача о коробках с конфетами: как обыграть случайность 33:15

Чтобы продемонстрировать практическое могущество теории вероятностей в компьютерных науках, Бринмор Чэпмен предлагает студентам интерактивную задачу-игру. Представьте две закрытые коробки, в которые лектор поместил разное количество конфет (в диапазоне от 0 до 10). Задача игрока — выбрать коробку с наибольшим содержимым, разрешив при этом открыть и посмотреть внутрь только одной из них. На первый взгляд кажется, что шансы на успех детерминированно ограничены чистым угадыванием с вероятностью 1/2.

Чэпмен предлагает упростить условия: предположим, игроку гарантируют, что в одной из коробок точно больше 5 конфет, а в другой — меньше или равно 5. В таком сценарии стратегия становится тривиальной: игрок открывает случайную коробку, и если там обнаруживается более 5 конфет, он оставляет её себе. Если же конфет оказывается меньше, игрок уверенно забирает вторую коробку. Данная стратегия гарантирует стопроцентный выигрыш.

Но как действовать в условиях полной неопределенности, когда никакого априорного порога не задано? Решением становится внедрение искусственной случайности в сам процесс принятия решений. Чэпмен формулирует алгоритм: игроку необходимо случайным образом выбрать собственный порог (число от 0 до 10), притвориться, что этот порог истинен, и реализовать вышеописанную стратегию.

Для расчета эффективности этого подхода применяется формула полной вероятности. Математический расчет выглядит следующим образом:

$$P(\text{выигрыша}) = P(\text{выигрыша} \mid \text{угадал порог}) \cdot P(\text{угадал порог}) + P(\text{выигрыша} \mid \text{не угадал}) \cdot P(\text{не угадал})$$

Если выбранный игроком порог случайно оказался верным разделителем между содержимым коробок (вероятность чего составляет как минимум 1/10), стратегия дает стопроцентную победу. Если же порог оказался ошибочным, игрок все равно побеждает в половине случаев — когда изначально выбранная коробка чисто случайно оказывается большей. Итоговая вероятность математически рассчитывается как:

$$1 \cdot \frac{1}{10} + \frac{1}{2} \cdot \frac{9}{10} = 0.55$$

Таким образом, общая вероятность успеха возрастает до 55%. По мнению Чэпмена, этот пример наглядно иллюстрирует концепцию вероятностных (рандомизированных) алгоритмов. Введение контролируемой случайности в детерминированные задачи позволяет кардинально повышать их эффективность и преодолевать жесткие ограничения стандартных подходов, что активно используется в современных алгоритмах обработки данных.

🪙 Биномиальное распределение и магия аппроксимации Стирлинга 47:39

В финальной части лекции Чэпмен переходит к разбору биномиального распределения $\text{Bin}(n, p)$, которое является базовой моделью для множества процессов в ИТ-индустрии, включая оценку надежности сложных систем и подсчет отказов независимых компонентов. Данное распределение описывает поведение случайной величины $X$, равной числу успешных исходов в серии из $n$ независимых испытаний, в каждом из которых успех достигается с фиксированной вероятностью $p$.

Функция вероятностной массы для биномиального распределения вычисляется по классической комбинаторной формуле:

$$P(X = x) = \binom{n}{x} p^x (1-p)^{n-x}$$

Она учитывает количество возможных последовательностей испытаний и индивидуальную вероятность каждой цепочки. Кумулятивная функция CDF в данном случае представляет собой обычную сумму значений PMF от нуля до целой части $x$. Однако на практике проведение таких прямых вычислений для больших выборок (например, при $n = 100$ и более) сопряжено с колоссальными вычислительными трудностями из-за расчета факториалов.

Для преодоления этой проблемы лектор демонстрирует метод аппроксимации с использованием знаменитой формулы Стирлинга для факториалов: $n! \approx \sqrt{2\pi n} (n/e)^n$. Заменяя в биномиальном коэффициенте каждый факториал его приближением и подставляя долю успехов $\alpha = x/n$, Чэпмен осуществляет ряд последовательных алгебраических преобразований. Переходя к логарифмическому базису, итоговую формулу PMF удается свести к изящному экспоненциальному виду:

$$f(\alpha n) \approx \frac{1}{\sqrt{2\pi \alpha(1-\alpha)n}} \cdot 2^{n \left[ \alpha \log_2 \frac{p}{\alpha} + (1-\alpha) \log_2 \frac{1-p}{1-\alpha} \right]}$$

Анализируя полученный показатель экспоненты, Чэпмен обращает внимание на его фундаментальное свойство: данное выражение всегда строго отрицательно, за исключением единственной точки, где доля успехов совпадает с истинной вероятностью ($\alpha = p$), превращая показатель в ноль. Это означает, что график распределения имеет четко выраженный пик в области математического ожидания и экспоненциально стремительно затухает при удалении в область экстремальных значений («хвосты» распределения).

Чтобы проиллюстрировать этот математический факт, Чэпмен приводит конкретные цифровые расчеты для серии из 100 подбрасываний монеты с вероятностью успеха 0.5:

Из этого экспоненциального затухания вытекает крайне парадоксальный и контрнтуитивный вывод теории вероятностей: в глубоком хвосте распределения вероятность получить точное пограничное значение оказывается выше, чем вероятность получить в сумме все значения, лежащие еще дальше за этим порогом. Математически вероятность экстремального выброса $P(X \le 24)$ оказывается строго меньше, чем вероятность единичного исхода $P(X = 25)$.

При этом в центре распределения действует прямо противоположная логика: вероятность получить менее 50 «орлов» составляет около 46%, что многократно превышает вероятность выпадения ровно 50 «орлов». Завершая занятие, Бринмор Чэпмен анонсирует, что подробный анализ этих пограничных зон и вычисление строгих математических границ для хвостов распределений (tail bounds) станут главными темами следующей лекции.

💬 Цитаты

«К сожалению, случайная величина не является ни случайной, ни переменной. Это название закрепилось исключительно по историческим причинам.»

Бринмор Чэпмен 00:25

«Вы можете добиться гораздо лучших результатов, если введете случайность в свой алгоритм и будете делать случайный выбор.»

Бринмор Чэпмен 46:35
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Случайная величина
Функция, сопоставляющая каждому исходу случайного эксперимента определенное число.
Индикатор
Бинарная случайная величина, принимающая значение 1, если событие произошло, и 0 в противном случае.
PMF (Probability Mass Function)
Функция вероятностной массы, задающая вероятность того, что дискретная случайная величина примет конкретное значение.
CDF (Cumulative Distribution Function)
Кумулятивная функция распределения, показывающая вероятность того, что случайная величина примет значение, меньшее или равное заданному.
Вероятностный алгоритм
Алгоритм, использующий генератор случайных чисел для оптимизации процесса поиска решений.
📊 Цифры
⚖️ Другая сторона
Математика и физика Бринмор Чэпмен MIT OpenCourseWare случайная величина биномиальное распределение