Регрессионный анализ в MIT: от теории Гаусса — Маркова до регуляризации LASSO

MIT OpenCourseWare 1,8 тыс. 1 ч 22 мин 5 мин 03.12.2025
Главное

В одиннадцатой лекции курса MIT по статистическим аспектам машинного обучения профессор Питер Кемпторн углубляется в продвинутые методы регрессионного анализа. Основное внимание уделяется переходу от классической теории метода наименьших квадратов к техникам регуляризации, робастным оценкам и эмпирической проверке финансовых моделей на реальных рыночных данных.

📐 Теоретические основы и проверка статистических гипотез 0:13

Профессор Кемпторн начинает с повторения свойств нормальной линейной регрессионной модели. В этой модели оценка коэффициентов $\hat{\beta}$ (beta hat) распределена как многомерная нормальная случайная величина . Её среднее значение соответствует истинному параметру регрессии, а ковариационная матрица определяется через матрицу объясняющих переменных $X$ и дисперсию ошибок $\sigma^2$ .

Важным аспектом является независимость оценки $\hat{\beta}$ и вектора остатков $\hat{\epsilon}$. Это свойство позволяет математически обосновать использование t-статистик для проверки значимости отдельных коэффициентов .

Основные инструменты проверки гипотез в регрессии:

При нарушении предположений Гаусса — Маркова (например, если ошибки коррелированы), применяется обобщенный метод наименьших квадратов (GLS) . Он трансформирует данные так, чтобы они соответствовали стандартным допущениям о нулевом среднем и постоянной дисперсии .

🧪 Метод максимального правдоподобия и робастные оценки 11:07

Метод максимального правдоподобия (MLE) позволяет идентифицировать параметры, при которых наблюдаемые данные наиболее вероятны . По словам Кемпторна, MLE является оптимальной оценкой с минимальной дисперсией в больших выборках .

Интересной альтернативой классической регрессии являются обобщенные M-оценки. Вместо минимизации суммы квадратов остатков они минимизируют произвольную функцию $Q$ :

  1. Наименьшие квадраты: функция потерь — квадрат ошибки.
  2. Абсолютные отклонения: минимизация суммы модулей ошибок (робастный подход).
  3. Квантильная регрессия: позволяет оценивать не среднее значение, а, например, 90-й процентиль распределения . Для этого используется асимметричная функция потерь, где положительные и отрицательные остатки масштабируются по-разному .

Робастные оценки (Robust Estimators) особенно полезны, когда данные загрязнены аномалиями или распределение ошибок имеет «тяжелые хвосты», отличные от нормального .

📉 Регуляризация: методы Ridge и LASSO 22:40

Когда количество переменных велико или они сильно коррелированы между собой, стандартный метод наименьших квадратов становится нестабильным. Для решения этой проблемы используются методы сжатия (shrinkage).

Ридж-регрессия (Ridge Regression) добавляет к минимизируемой сумме квадратов штраф, пропорциональный квадрату длины вектора коэффициентов $\beta$ . Кемпторн подчеркивает важность предварительной стандартизации переменных: все предикторы должны иметь нулевое среднее и единичную дисперсию, чтобы шкала измерений не влияла на размер штрафа . С точки зрения байесовского подхода, ридж-регрессия эквивалентна наложению априорного нормального распределения на коэффициенты с нулевым средним .

LASSO (Least Absolute Shrinkage and Selection Operator) использует штраф в виде суммы абсолютных значений коэффициентов (L1-нормирование) . Ключевое отличие LASSO заключается в том, что этот метод способен занулять некоторые коэффициенты, тем самым исключая лишние переменные из модели . Геометрически это объясняется тем, что область ограничений LASSO имеет «вершины» на осях координат .

📊 Кейс-стади: Анализ ETF и хеджирование рисков 37:35

Профессор демонстрирует применение регрессии на примере цен биржевых фондов (ETF), привязанных к секторам американского рынка (энергетика, финансы, здравоохранение) и широким индексам (S&P 500, NASDAQ) .

Цель такого анализа может быть двоякой:

Сравнение методов на этих данных показывает, что при больших выборках результаты Ridge и LASSO часто схожи, однако Ridge дает более плавное сжатие, а LASSO эффективнее отсеивает незначимые факторы .

📈 Модель CAPM и её проверка на данных S&P 500 53:08

Центральная часть лекции посвящена эмпирическому анализу модели оценки капитальных активов (CAPM). Согласно теории, ожидаемая доходность акции должна зависеть только от безрисковой ставки и коэффициента «бета» ($\beta$), отражающего рыночный риск .

Уравнение регрессии выглядит так: доходность актива за вычетом безрисковой ставки регрессируется на избыточную доходность рынка. В этой модели:

При анализе акций General Electric (GE) Кемпторн обнаружил, что остатки модели не совсем соответствуют нормальному распределению . Использование робастных оценок позволило лучше описать «центр» данных, хотя в экстремальных значениях (верхний и нижний 1%) модель все равно давала сбои .

Изменение режимов и долгосрочный анализ

Профессор указывает на то, что параметры модели могут меняться со временем (смена режимов). На примере той же GE было показано, что при разделении данных на два периода коэффициенты $\alpha$ и $\beta$ существенно различаются . Бета компании выросла с 0.77 до более чем 1.1, что говорит о значительном изменении профиля риска компании .

Результаты по всему индексу S&P 500 (около 380-400 акций):

В завершение лекции Кемпторн упоминает более сложные модели, такие как факторы Фама — Френча, которые расширяют CAPM для более точного объяснения доходности активов .

💬 Цитаты

«Метод максимального правдоподобия дает наилучшую оценку в терминах наименьшей дисперсии на больших выборках.»

Питер Кемпторн 12:40

«Если мы не можем отклонить нулевую гипотезу об альфе, равной нулю, то ценообразование актива можно считать равновесным.»

Питер Кемпторн 57:29
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
Гетероскедастичность
Ситуация, когда дисперсия ошибок модели не является постоянной, что нарушает допущения метода наименьших квадратов.
L1-регуляризация (LASSO)
Метод добавления штрафа в виде суммы модулей коэффициентов, который зануляет слабые признаки.
Коэффициент Бета (β)
Мера рыночного риска актива относительно широкого индекса.
📊 Цифры
🗓 Хронология
  1. 2019 Приблизительная точка перегиба в накопленных остатках регрессии для акций GE, указывающая на смену режима.
  2. Lect. 11 Проведение лекции по продвинутой регрессии в рамках курса MIT.
⚖️ Другая сторона
Наука MIT OpenCourseWare Peter Kempthorne CAPM LASSO regression Ridge regression