# Линейная алгебра и теория вероятностей на службе инвестора: разбор лекции MIT

Источник: https://www.youtube.com/watch?v=mtXTs2U1uMA
Канал: MIT OpenCourseWare
Опубликовано: 03.12.2025

---

В лекции, прочитанной в рамках открытого курса MIT OpenCourseWare, профессор Питер Кемпторн (Peter Kempthorne) детально разбирает фундаментальные математические концепции, связывающие линейную алгебру и теорию вероятностей с практическими задачами финансового анализа. На примере моделирования доходности портфелей акций, оценки опционов и анализа главных компонент (PCA) лектор демонстрирует, как абстрактные теоремы превращаются в мощные инструменты для инвесторов и аналитиков. Разбираемые методы помогают не только эффективно диверсифицировать риски, но и находить скрытые закономерности в огромных массивах рыночных данных.

## 📐 Собственные значения и диагонализация матриц: фундамент системной динамики
[[JUMP:00:12]]

Линейная алгебра предлагает мощный аппарат для работы с многомерными системами, и одними из наиболее полезных понятий в прикладных задачах являются собственные значения и собственные векторы [0:27]. Когда матрица $A$ умножается на свой собственный вектор $v$, результатом является простое масштабирование этого вектора на величину собственного значения $\lambda$ [0:53]:

$$Av = \lambda v$$

Для нахождения этой пары решается характеристическое уравнение, в котором определитель матрицы $(A - \lambda I)$ приравнивается к нулю [1:31]. Нулевой детерминант означает, что полученная матрица не является обратимой [1:46]. Если матрица обратима, ее определитель отличен от нуля, а обратная матрица выражается через алгебраические дополнения. Чтобы собственный вектор $v$ не был тривиальным (нулевым), параметр $\lambda$ обязан удовлетворять этому полиномиальному уравнению [2:23]. Профессор отмечает, что в среде программирования R корни любого подобного полинома вычисляются чрезвычайно просто [2:51].

Если матрица $A$ имеет линейно независимые собственные векторы, их можно объединить в качестве столбцов матрицы $S$ [3:24]. Тогда произведение матрицы $A$ на $S$ будет эквивалентно произведению $S$ на диагональную матрицу собственных значений $\Lambda$ [3:41]:

$$AS = S\Lambda \implies A = S\Lambda S^{-1}$$

Подобная процедура называется диагонализацией матрицы $A$ и возможна только тогда, когда матрица $S$ обратима (то есть ее столбцы линейно независимы) [3:57].

Этот математический аппарат находит прямое отражение в уравнениях фильтров Калмана и моделировании динамических систем [4:41]. Если матрица $A$ описывает переход системы из состояния во время $t-1$ в состояние во время $t$, то состояние системы через $t$ шагов от начального $u_0$ выражается степенью матрицы $A^t$ [4:58]. Если представить начальное состояние как линейную комбинацию собственных векторов, то динамика процесса сведется к сумме их степенных масштабирований [5:43].

Математический анализ такого перехода показывает:

*   Если абсолютно все собственные значения матрицы $\lambda_i$ по модулю строго меньше единицы, то при стремлении времени к бесконечности состояние системы неизбежно стремится к нулевому вектору [6:13].

*   Если хотя бы одно собственное значение равно единице, а остальные меньше единицы, система стабилизируется в предельном состоянии, пропорциональном первому собственному вектору [6:30].

В реальных финансовых и физических задачах часто встречаются ситуации, когда наибольшее собственное значение в точности равно единице, что позволяет получать элегантные аналитические решения для предельного поведения систем [6:45].

Симметричные вещественные матрицы обладают особыми свойствами: все их собственные значения вещественны [7:30], а собственные векторы, соответствующие различным собственным значениям, ортогональны друг другу [7:47]. Это позволяет использовать их в качестве идеального ортогонального базиса для описания многомерных пространств [10:18].

## 🧩 Сингулярное разложение (SVD) и теорема Перрона-Фробениуса
[[JUMP:11:13]]

Сингулярное разложение (SVD) является одним из ключевых результатов линейной алгебры. Любая матрица $A$ может быть представлена в виде произведения трех матриц [12:37]:

$$A = UDV^T$$

Матрицы $U$ и $V$ являются ортогональными (их столбцы образуют ортонормированные базисы), а $D$ представляет собой диагональную матрицу с неотрицательными сингулярными числами на главной диагонали [12:04]. Геометрически этот оператор осуществляет ортогональный поворот осей координат, их растяжение или сжатие, а затем проецирование на новый базис [13:26].

Если рассмотреть матрицу данных $A$ размерности $m \times n$ (где $m$ — наблюдения, а $n$ — переменные), то произведение $A^T A$ будет симметричной вещественной матрицей [13:58]. Ее можно диагонализировать в виде $VD^2V^T$, где столбцы $V$ выступают собственными векторами, а диагональные элементы $D^2$ — собственными значениями [14:31]. Количество ненулевых диагональных элементов строго ограничено рангом исходной матрицы $A$ [15:25].

В практическом анализе данных SVD ценится за возможность снижения размерности [16:29]. Если вариативность данных сосредоточена в подпространстве меньшей размерности (например, ранга 2 или 3), то SVD позволяет легко выделить этот базис и отбросить малозначимый «шум». Матрицу можно представить в виде суммы одноранговых слагаемых, взвешенных по сингулярным числам [17:08]:

$$A = \sum_{i=1}^{r} \sigma_i u_i v_i^T$$

Еще одним важным математическим результатом для анализа положительных квадратных матриц (где все элементы строго больше нуля) является теорема Перрона-Фробениуса [18:11]. Согласно этой теореме:

1. Существует единственное вещественное максимальное собственное значение $\lambda_0$, которое строго больше по модулю, чем все остальные собственные значения матрицы [18:28].

2. Ему соответствует собственный вектор $v$, все элементы которого строго положительны [18:54].

Этот результат незаменим при работе с марковскими цепями и матрицами переходов в экономике.

## 💻 Практикум в RStudio: моделирование портфеля акций и дилемма ребалансировки
[[JUMP:19:40]]

Для демонстрации теоретических выкладок Питер Кемпторн обращается к программированию в среде RStudio [20:37]. Профессор рекомендует использовать платформу RStudio Cloud (Cloud Rstudio), которая избавляет студентов от необходимости локально устанавливать библиотеки и позволяет запускать готовые скрипты в один клик [21:21]. Источником исторических цен акций выступает Yahoo Finance, а для чтения качественной аналитики лектор советует оформить подписку на Wall Street Journal, бесплатную для студентов MIT через институтский Kerberos ID [20:05].

В рамках практического кейса разбираются два взаимосвязанных скрипта:

*   `Script_SP500` — загружает библиотеки, скачивает котировки акций из индекса S&P 500 и сохраняет рабочее пространство R [22:32].

*   `Equal Weighted Portfolios` — считывает сохраненные данные котировок для последующего бэктеста инвестиционных стратегий [22:50].

Эксперимент строится вокруг гипотетического вложения $1000 на начале 2019 года [23:47]. Рассматриваются две альтернативы:

1. Инвестирование в равных долях во все акции из индекса S&P 500.

2. Равновзвешенный портфель из популярных в то время технологических гигантов — Amazon, Apple, NVIDIA (или Netflix, как уточняет спикер) и Google [24:14].

Результаты симуляции показывают, что точечный выбор фаворитов мог принести доходность, существенно опережающую широкий индекс S&P 500, однако платой за это становится кратно возросший риск [24:39]. Из-за отсутствия глубокой диверсификации портфель технологических гигантов на графике демонстрирует глубокие просадки в определенные периоды [25:08].

Особый интерес представляет динамика структуры портфеля без вмешательства инвестора. За пятилетний период акции Apple выросли значительно сильнее остальных активов [25:55]. В результате их доля в портфеле превысила первоначальные 25%, что привело к снижению диверсификации и росту концентрации риска на одной компании.

Решением данной проблемы выступает ребалансировка. Профессор ставит перед аудиторией вопрос: стоит ли проводить ребалансировку ежедневно?

По мнению Кемпторна, слишком высокая частота ребалансировки вредна [27:06]. Ежедневное выравнивание долей приводит к тому, что инвестор систематически забирает деньги у растущих активов («победителей») и направляет их в падающие («проигравшие»), тем самым лишая портфель возможности зарабатывать на краткосрочных трендах. Для поддержания стабильного уровня риска лектор считает оптимальным проведение периодической ребалансировки (например, ежемесячно или ежеквартально) [27:52].

## 🎲 Теория вероятностей: от дискретных событий к непрерывным распределениям
[[JUMP:28:26]]

Во второй части лекции профессор Кемпторн переходит к экспресс-обзору теории вероятностей. В прикладных финансах крайне важно разделять дискретные и непрерывные случайные величины [28:41]. 

К дискретным событиям относятся дефолт контрагента по обязательствам или решение ФРС США по процентной ставке [29:08]. Даже поток внутридневных ордеров на покупку или продажу акций исторически описывался дискретными величинами (размер ордера в штуках акций), хотя сегодня появление дробных акций размывает эту границу [29:44]. 

К непрерывным величинам относятся рыночная стоимость активов, а также время ожидания между событиями (например, интервал времени до прихода следующего ордера по акциям Apple) [30:55]. 

Существуют и смешанные случайные величины. Наглядным примером служит стоимость акций компании: в обычных условиях она непрерывна, но имеет дискретную вероятность упасть до нуля в случае внезапного банкротства [31:09].

Фундаментальным инструментом описания распределений выступает кумулятивная функция распределения (CDF) [31:37]:

$$F_X(c) = P(X \le c)$$

Эта функция монотонно возрастает, принимая значения от 0 до 1, и однозначно определяет закон распределения случайной величины [32:13].

Интересным математическим фактом является теорема о преобразовании вероятностей (Probability Integral Transform) [32:50]. Если случайная величина $X$ имеет непрерывную функцию распределения $F_X$, то новая случайная величина $Y = F_X(X)$ всегда распределена равномерно на отрезке $[0, 1]$ [33:36]. Это свойство незаменимо на практике: если у исследователя есть выборка данных и он предполагает, что они подчиняются определенному закону распределения, применение функции CDF к этим данным должно дать равномерное распределение. Отклонение от равномерности сигнализирует о несоответствии выбранной модели реальности [34:20].

Для количественной оценки распределений используются моменты случайных величин [34:51]:

*   Математическое ожидание (первый момент) — средневзвешенное по вероятностям значение.

*   Дисперсия — мера неопределенности вокруг среднего значения, рассчитываемая как разность математического ожидания квадрата величины и квадрата ее ожидания [35:30]:

$$Var(X) = E[X^2] - (E[X])^2$$

Поскольку дисперсия измеряется в квадратных единицах, для сопоставления масштаба с исходными данными на практике используют стандартное отклонение (квадратный корень из дисперсии) [36:01].

Для детального анализа формы распределения, отличной от классической симметричной колоколообразной кривой, применяются стандартизированные моменты высших порядков — асимметрия (skewness) и эксцесс (kurtosis) [36:33]. Если стандартизировать случайную величину как $Z = (X - \mu)/\sigma$ [37:18], то коэффициент асимметрии запишется как $\gamma = E[Z^3]$, а эксцесс — как $\kappa = E[Z^4]$ [37:51]. Асимметрия указывает на смещение распределения влево или вправо, а эксцесс характеризует «тяжесть» хвостов распределения. Для нормального (гауссовского) распределения $\gamma = 0$, а $\kappa = 3$ [38:32].

## 🔔 Гауссовские и логнормальные модели на финансовых рынках
[[JUMP:39:01]]

Формула плотности нормального распределения обязана быть знакомой каждому студенту [39:14]:

$$f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{1}{2}\left(\frac{x-\mu}{\sigma}\right)^2}$$

Максимум функции плотности достигается в точке математического ожидания $\mu$, а точки перегиба (где вторая производная меняет знак) находятся строго на расстоянии одного стандартного отклонения $\sigma$ в обе стороны от центра [39:57]. Согласно эмпирическому правилу, в пределах одного стандартного отклонения лежит около 68% всех исходов, двух — 95%, трех — 99.7% [40:41].

Несмотря на популярность нормального распределения, его прямое применение к моделированию цен активов ограничено тем, что область определения случайной величины в гауссовской модели включает отрицательные значения. Цены акций не могут быть меньше нуля. Решением становится логнормальное распределение: предполагается, что нормальному закону подчиняется не сама цена, а логарифм цены [41:51]. Если случайная величина $X$ распределена нормально, то $Y = e^X$ будет иметь логнормальное распределение [42:18].

Логнормальное распределение тесно связано с концепцией броуновского движения — важнейшего стохастического процесса на финансовых рынках [42:48]. В модели броуновского движения приращения процесса за фиксированные промежутки времени распределены нормально, а с увеличением временного интервала меняются как среднее значение, так и дисперсия процесса [43:03].

Математический метод замены переменных позволяет строго вывести плотность логнормального распределения [43:58]. Если функция $g$ связывает переменные $Y = g(X)$, а $h = g^{-1}$ — обратная к ней функция (например, логарифм для экспоненты), то плотность распределения $Y$ выражается через плотность исходной величины с использованием цепного правила дифференцирования [45:30]. В результате плотность логнормального распределения приобретает вид [46:56]:

$$f_Y(y) = \frac{1}{y\sqrt{2\pi}\sigma} e^{-\frac{1}{2}\left(\frac{\ln y - \mu}{\sigma}\right)^2}$$

Профессор Кемпторн приводит практический пример с параметрами $\mu = 0.2$ и $\sigma = 0.4$ на логарифмической шкале [47:28]. Финансовый смысл такой модели заключается в описании изменения цены актива за один год с ожидаемой непрерывной доходностью около 20% и годовой волатильностью (стандартным отклонением) в 40% [48:47]. График такого распределения ярко асимметричен, что наглядно демонстрируют несимметричные квантили (5-й и 95-й процентили) [49:18].

## 🏒 Расчет стоимости опционов и производящие функции моментов
[[JUMP:49:34]]

Логнормальное распределение лежит в основе классической оценки стоимости европейских опционов [49:48]. Для call-опциона с ценой исполнения (страйком) $K$ и ценой базового актива на момент экспирации $X$ функция выплаты (payoff) выглядит как $\max(X - K, 0)$ [50:14]. График этой функции напоминает хоккейную клюшку (hockey stick payoff) — термин, который часто используют соавторы курса Василий и Джейк [50:58].

Математическое ожидание выплаты по опциону при известной плотности распределения цены актива $f(x)$ и функции распределения $F(x)$ рассчитывается через интегрирование по частям [51:37]:

$$E[\max(X - K, 0)] = \int_{K}^{\infty} (1 - F(x)) dx$$

Выбор конкретного вероятностного закона (нормального или логнормального) критически важен, так как он напрямую определяет расчетную справедливую стоимость опциона [53:22].

Для упрощения аналитической работы с моментами распределений в теории вероятностей применяются производящие функции моментов (MGF), определяемые как математическое ожидание экспоненты от случайной величины [54:07]:

$$M_X(t) = E[e^{tX}]$$

Разложив экспоненту в ряд Тейлора и взяв математическое ожидание от каждого члена, можно последовательно находить моменты любого порядка через производные функции $M_X(t)$ в точке $t=0$ [54:21].

Однако производящая функция моментов существует не всегда. Если хвосты распределения слишком тяжелые (как у распределения Коши), интеграл расходится и принимает бесконечное значение [55:57]. В таких случаях математики переходят к более универсальному инструменту — характеристической функции [56:13]:

$$\phi_X(t) = E[e^{itX}] = E[\cos(tX)] + i E[\sin(tX)]$$

Благодаря свойствам комплексных чисел, характеристическая функция существует абсолютно для любого распределения случайных величин [56:55]. Она обладает теми же ключевыми свойствами, что и MGF:

*   Если две случайные величины имеют идентичные характеристические функции (или производящие функции моментов, если они существуют), их законы распределения полностью совпадают [57:28].

*   Если последовательность производящих функций моментов сходится к некоторой предельной функции, то и последовательность случайных величин сходится по распределению к соответствующему закону [57:56].

Для стандартного нормального распределения $Z \sim N(0, 1)$ производящая функция моментов вычисляется путем выделения полного квадрата в показателе экспоненты под интегралом [1:00:23]. Результат вычислений предельно прост [1:01:39]:

$$M_Z(t) = e^{\frac{1}{2}t^2}$$

Применяя линейное преобразование случайной величины $Y = \mu + \sigma Z$, можно получить MGF для любого общего нормального распределения [1:02:07]:

$$M_Y(t) = e^{t\mu + \frac{1}{2}t^2\sigma^2}$$

Что примечательно, данное выражение фактически представляет собой математическое ожидание логнормальной случайной величины. Подставляя $t = 1$, инвестор получает среднее значение логнормального распределения, а при $t = 2$ — его второй момент, что позволяет легко рассчитывать дисперсию цены активов [1:03:09].

## 🕸️ Многомерные случайные векторы и математика диверсификации
[[JUMP:1:03:47]]

Переходя от анализа единичных активов к портфельному менеджменту, необходимо оперировать системами случайных величин. Две случайные величины $X$ и $Y$ независимы, если вероятность их совместного попадания в любые интервалы равна произведению индивидуальных вероятностей [1:04:02]. В терминах плотностей это выражается в расщеплении совместной плотности на произведение маргинальных плотностей [1:04:36]:

$$f(x, y) = f_X(x) f_Y(y)$$

Степень линейной взаимосвязи между переменными оценивается ковариацией и корреляцией [1:05:11]. Корреляция представляет собой ковариацию стандартизированных случайных величин и нормирована в границах от -1 до +1 [1:06:40]. Кемпторн подчеркивает: равенство ковариации нулю означает отсутствие линейной связи, но не гарантирует полную независимость случайных величин [1:06:58].

Для описания системы из $n$ активов вводится случайный вектор $X$ с вектором математических ожиданий $\mu$ и матрицей ковариаций $\Sigma$ размерности $n \times n$ [1:08:03]:

$$\Sigma = E[(X - \mu)(X - \mu)^T]$$

Если инвестор формирует портфель с весами активов, заданными вектором $a$, то доходность портфеля является линейной комбинацией $Y = a^T X$ [1:10:10]. Математическое ожидание доходности такого портфеля выражается как $a^T \mu$ [1:10:26], а его дисперсия рассчитывается по квадратичной форме [1:11:13]:

$$Var(Y) = a^T \Sigma a$$

На этом уравнении базируется математическое доказательство пользы диверсификации портфеля. Если рассмотреть частный случай, когда ковариация между всеми различными активами равна нулю ($\Sigma$ диагональна), а веса распределены поровну ($a_i = 1/n$) [1:12:03], то дисперсия портфеля примет вид [1:13:21]:

$$Var(Y) = \frac{1}{n} \sigma^2$$

Дисперсия равновзвешенного портфеля из некоррелированных активов с одинаковой волатильностью снижается ровно в $n$ раз по сравнению с дисперсией отдельного актива [1:13:36]. Это математически иллюстрирует, как диверсификация эффективно устраняет индивидуальный риск инструментов.

## 📊 Анализ главных компонент (PCA) в управлении портфелем
[[JUMP:1:14:16]]

В реальности финансовые активы сильно коррелируют между собой, из-за чего матрица ковариаций $\Sigma$ содержит множество ненулевых внедиагональных элементов. Для анализа структуры этих взаимосвязей применяется метод анализа главных компонент (PCA) [1:14:16].

Исходный вектор данных $X$ размерности $m \times 1$ характеризуется вектором средних $\alpha$ и симметричной вещественной ковариационной матрицей $\Sigma$ [1:14:56]. Важнейшим свойством ковариационной матрицы является то, что она всегда является положительно полуопределенной [1:15:41]. Это напрямую следует из физического смысла дисперсии: для любого вектора весов $a$ дисперсия портфеля не может быть отрицательной [1:16:09]:

$$a^T \Sigma a \ge 0$$

Следовательно, все собственные значения ковариационной матрицы $\lambda_1, \dots, \lambda_m$ вещественны и неотрицательны [1:15:23]. Ортонормированные собственные векторы $\gamma_i$ нормируются к единичной длине и взаимно ортогональны [1:17:51].

PCA вводит новые переменные (главные компоненты $P_i$) путем проецирования центрированного вектора данных на собственные векторы ковариационной матрицы [1:18:34]:

$$P_i = \gamma_i^T (X - \alpha)$$

Новые переменные обладают уникальными свойствами:

*   Их математическое ожидание в точности равно нулю [1:19:06].

*   Они абсолютно некоррелированы друг с другом, то есть их ковариационная матрица строго диагональна и содержит собственные значения $\lambda_i$ на главной диагонали [1:19:20].

*   Если упорядочить собственные значения от наибольшего к наименьшему ($\lambda_1 \ge \lambda_2 \ge \dots \ge \lambda_m$), то первая главная компонента будет объяснять максимальную долю совокупной дисперсии системы активов, вторая — чуть меньше, и так далее [1:19:53].

В результате многомерное и сильно скоррелированное пространство доходностей проецируется на ортогональный базис [1:20:07]. Это дает возможность отбросить компоненты с близкими к нулю собственными значениями, радикально снизив размерность задачи без существенной потери информации [1:20:34]. Именно принципы PCA лежат в основе построения современных многофакторных моделей оценки активов и управления рисками на финансовых рынках [1:21:00].