# Профессор MIT об анализе временных рядов: от S&P 500 до отрицательных цен на нефть

Источник: https://www.youtube.com/watch?v=qlytPllimpQ
Канал: MIT OpenCourseWare
Опубликовано: 03.12.2025

---

В современной финансовой аналитике и эконометрике анализ временных рядов занимает центральное место, позволяя не только описывать прошлые состояния рынков, но и строить математически обоснованные прогнозы. В лекции MIT OpenCourseWare профессор Питер Кемпторн (Peter Kempthorne) раскрывает фундаментальные концепции этой дисциплины, переходя от строгих определений стационарности к практическим аспектам моделирования рыночных индексов и акций.

## 📈 Введение в анализ временных рядов
[[JUMP:0:00]]

Анализ временных рядов — это мощная статистическая методология, которая особенно эффективна при моделировании финансовых рынков [0:14]. Временной ряд представляет собой стохастический процесс, где $X_t$ соответствует значению процесса в момент времени $t$. Временные периоды могут быть как дискретными (что встречается чаще всего), так и непрерывными [0:59].

Основная задача моделирования заключается в определении вероятностной модели для любой совокупности значений во временных точках. По словам Кемпторна, это подразумевает способность специфицировать совместную плотность вероятности для любого конечного набора из $m$ временных точек [1:46].

## ⚖️ Понятие стационарности: строгость против практики
[[JUMP:2:26]]

Одной из ключевых концепций в анализе является стационарность. Профессор выделяет два её типа:

*   **Строгая стационарность:** Распределение любого набора временных точек остается неизменным при сдвиге на константу $\tau$ [2:43]. Это означает, что среднее значение и разброс данных остаются горизонтальными и постоянными во всех временных окнах [3:53].
*   **Слабая стационарность (ковариационная):** Более мягкое условие, сфокусированное на ожиданиях первого и второго порядка [5:24]. В этом случае:
    1.  Математическое ожидание $\mu$ постоянно для всех $t$.
    2.  Дисперсия не зависит от времени.
    3.  Ковариация между значениями, разделенными интервалом $\tau$, зависит только от величины этого интервала, а не от конкретного момента времени [6:07].

Лектор подчеркивает, что стационарность критически важна для статистики: если параметры распределения одинаковы на всем диапазоне данных, их можно оценить последовательно и с высокой точностью [5:04].

## 📊 Финансовые данные и «тонкие» хвосты распределений
[[JUMP:8:18]]

При анализе реальных данных, таких как индекс S&P 500, становится очевидно, что они не являются стационарными из-за выраженных временных трендов [8:54]. Для работы с ними аналитики используют трансформацию в логарифмическую доходность (log returns).

Кемпторн приводит примеры трансформаций для различных активов:

*   **S&P 500:** Логарифмирование превращает экспоненциальный рост в линейный [12:09]. Месячные логарифмические доходности выглядят как стационарный процесс с уровнем около нуля и постоянной дисперсией [12:48].
*   **Amazon:** На графике акций компании виден значительный экспоненциальный рост. После взятия логарифма вариативность данных становится более сопоставимой на разных участках времени, что является преимуществом для моделирования [16:34].

Особое внимание профессор уделяет несовершенству нормальной модели (Гаусса) для описания доходностей. На гистограммах S&P 500 отчетливо видна **лептокуртрозис** (leptokurtosis) — свойство распределения иметь более высокий пик в центре и «тяжелые хвосты» [14:14]. По мнению Кемпторна, нормальная модель часто недооценивает вероятность экстремальных событий в хвостах распределения [14:01].

## 🛢️ Аномалии рынка: отрицательные цены на нефть
[[JUMP:18:23]]

В качестве экстраординарного примера нестационарности и рыночного шока лектор приводит ситуацию с фьючерсами на сырую нефть в 2020 году. Тогда стоимость контракта стала отрицательной, что стало шоком для брокеров и трейдеров [18:58].

Последствия этого события:

*   Инвесторы внезапно оказались должны своим брокерам суммы, кратные отрицательной цене [19:13].
*   Системы многих брокеров технически не могли отображать позиции, так как не были запрограммированы на работу с отрицательными ценами [19:29].
*   Стандартная математическая трансформация через логарифм стала невозможной для этого периода, так как логарифм отрицательного числа не определен [19:42].

## 📉 Автокорреляция и проверка адекватности моделей
[[JUMP:24:08]]

Для оценки зависимости значений ряда от их прошлых состояний используется автокорреляционная функция (ACF). Лектор отмечает следующие важные моменты:

*   **Интервалы значимости:** На графиках ACF синие полосы обозначают область, внутри которой значения корреляции считаются статистически неотличимыми от нуля [26:32].
*   **Возврат к среднему (Mean reversion):** Отрицательная автокорреляция (например, лаг 5 для недельных данных S&P 500) может указывать на эффект возврата к среднему: если цена выросла слишком сильно, она имеет тенденцию скорректироваться вниз [28:58].
*   **Белый шум:** Остатки (residual series) хорошей модели должны представлять собой белый шум — иметь нулевое среднее, постоянную дисперсию и быть некоррелированными [33:24]. Если в остатках сохраняется значимая автокорреляция, модель не завершена и требует доработки [38:29].

Для проверки совокупности лагов на равенство нулю используется **тест Бокса-Пирса** (Box-Pierce test), основанный на распределении хи-квадрат [37:43].

## 🛠️ Теорема Волда и операторы сдвига
[[JUMP:38:46]]

Профессор представляет «экстраординарную», по его словам, теорему Волда (Wold Representation Theorem). Согласно ей, любой ковариационно-стационарный процесс может быть разложен на две части:

1.  **Линейно-детерминированный процесс ($V_t$):** Значение может быть представлено как линейная комбинация прошлых значений (например, периодические функции типа косинуса) [41:45].
2.  **Процесс скользящего среднего ($S_t$):** Взвешенная сумма текущих и прошлых значений «белого шума» [39:48].

Для математического удобства вводится **лаговый оператор** ($L$), который сдвигает индекс времени назад на один период ($L X_t = X_{t-1}$) [52:43]. Использование полиномов от лаговых операторов позволяет компактно записывать сложные модели временных рядов [54:15].

## 🏗️ Модели ARMA и условия устойчивости
[[JUMP:59:12]]

Кемпторн переходит к описанию моделей ARMA(p, q), сочетающих в себе авторегрессию (AR) и скользящее среднее (MA):

*   **AR(p):** Текущее значение ряда линейно зависит от $p$ его предыдущих значений и ошибки [1:02:49].
*   **MA(q):** Ряд представляется как взвешенная сумма текущей и $q$ прошлых ошибок [1:15:09].

Важным условием для модели AR(p) является её стационарность. Для этого корни характеристического уравнения должны лежать **вне единичного круга** в комплексной плоскости [1:05:36]. В частном случае для модели AR(1) это означает, что абсолютное значение коэффициента $\phi$ должно быть меньше единицы [1:08:19].

Если $\phi = 1$, процесс превращается в случайное блуждание, которое не является стационарным [1:10:15]. Если $\phi > 1$, процесс становится «взрывным» (explosive) [1:10:25].

## 🔧 Методы оценки и дифференцирование
[[JUMP:1:11:31]]

Для оценки параметров AR-моделей лектор предлагает два подхода:

1.  **Линейная регрессия:** Использование лагов ряда в качестве объясняющих переменных [1:11:46].
2.  **Уравнения Юла-Уокера (Yule-Walker):** Метод, основанный на принципе моментов, где выборочные автоковariaции приравниваются к теоретическим для нахождения параметров модели [1:12:03].

В завершение лекции обсуждается борьба с нестационарностью через **взятие разностей** (differencing) [1:17:41]. Первая разность ($\Delta Y_t = Y_t - Y_{t-1}$) позволяет устранить линейный тренд в данных [1:19:10]. Вторая разность эффективна для удаления квадратичного тренда [1:19:24]. По сути, дифференцирование — это переход к анализу динамики наклона (первой или второй производной) временного ряда [1:20:03].