В новом выпуске подкаста Excess Returns исследователи Эндрю Чен и Алехандро Лопес-Лира обсуждают результаты своей научной работы, которая ставит под сомнение фундамент современной теории ценообразования активов. Их исследование показывает, что сложные академические теории, прошедшие через многолетние рецензирования, предсказывают доходность акций не лучше, чем случайный поиск закономерностей в данных (дата-майнинг).
📊 Суть конфликта: Академическая теория против «грубого» поиска данных 1:45
Центральная идея исследования Эндрю Чена и Алехандро Лопеса-Лиры заключается в проверке ценности академического знания. На протяжении десятилетий финансовые экономисты искали «аномалии» — закономерности в поведении акций, которые позволяют получать избыточную доходность . Традиционно считается, что если стратегия (например, инвестирование в «дешевые» акции стоимости или покупка растущих активов в рамках моментума) подкреплена теорией и опубликована в престижном журнале, она имеет больше шансов на успех в будущем .
Однако исследователи обнаружили обратное:
- Стратегии, выведенные из сложных экономических моделей, показывают такой же результат «вне выборки» (после момента их открытия), как и стратегии, найденные случайным перебором бухгалтерских показателей .
- По словам Эндрю Чена, если построить график доходности стратегий, найденных через дата-майнинг, они выглядят почти идентично графикам опубликованных академических аномалий .
- Это ставит под сомнение необходимость сложного теоретизирования для практического инвестирования. По мнению гостей подкаста, результат работы «стажера», который просто перебирает данные, может быть сопоставим с трудом обладателя докторской степени (PhD) .
🔍 Определения: Аномалии, Факторы и риск 4:32
Для понимания контекста дискуссии Алехандро Лопес-Лира и Эндрю Чен разъяснили ключевые термины, используемые в эмпирических финансах. Понятие «аномалия» само по себе является спорным и часто зависит от того, какую модель рынка использует исследователь .
Основные концепции:
- Аномалия — это паттерн доходности акций, который невозможно объяснить существующими моделями (например, моделью CAPM) . Это то, что наука пока не знает, как обосновать фундаментальными факторами риска .
- Фактор — переменная, которая должна объяснять доходность и иметь под собой экономическое обоснование . Как отмечает Алехандро Лопес-Лира, в финансах существует путаница: факторы часто путают со статистическими переменными, но настоящий фактор — это то, что мы используем как объясняющую переменную .
- Риск-ориентированное объяснение — гипотеза о том, что инвестор получает высокую доходность просто как компенсацию за некий систематический риск. «Вы не получаете бесплатный обед, вы просто подставляете плечо под риск обвала рынка», — поясняет Эндрю Чен .
- Поведенческое объяснение — гипотеза о том, что аномалии возникают из-за ошибок инвесторов, их медленной реакции на новости или когнитивных искажений .
🤖 Эксперимент с 29 000 сигналов: Как «сломать» систему 18:38
Чтобы доказать свою правоту, исследователи провели масштабный эксперимент по дата-майнингу. Они взяли стандартную базу данных Compustat, содержащую около 240 бухгалтерских переменных с 1960-х годов .
Процесс поиска сигналов выглядел следующим образом:
- Исследователи создавали комбинации, деля одну переменную на другую (например, запасы, деленные на стоимость реализованной продукции) .
- Они использовали «первые разности» (изменения показателей во времени), а не только абсолютные значения .
- Единственным жестким ограничением было правило «не делить на ноль» .
- В итоге было получено 29 000 торговых сигналов .
Результат оказался ошеломляющим: многие из этих «бессмысленных» комбинаций в прошлом показывали такую же высокую доходность, как знаменитые факторы стоимости (Value) или моментума (Momentum) . Например, переменная «отношение расходов на оборудование к капитальным затратам» могла приносить столько же, сколько стратегии Нобелевских лауреатов .
📉 Исчезновение доходности после публикации 31:05
Одной из самых важных находок стало то, как стратегии ведут себя после того, как период их «тестирования» заканчивается. В финансовой науке это называется «распадом» (decay).
Алехандро Лопес-Лира и Эндрю Чен сравнили:
- Академические аномалии: После публикации их доходность в среднем падает на 50% .
- Случайные стратегии дата-майнинга: Их доходность падает примерно так же или даже чуть меньше .
Эндрю Чен утверждает, что это обесценивает «человеческий капитал» в Asset Pricing: нет разницы, потратили ли вы годы на обоснование стратегии теорией или нашли её за пять минут с помощью компьютера — результат «вне выборки» будет одинаковым . Причина этого распада, по мнению Алехандро Лопеса-Лиры, заключается в том, что рынки становятся эффективнее: как только сигнал становится статистически значимым, его начинают эксплуатировать и ученые (пишут статьи), и хедж-фонды (зарабатывают деньги), что в итоге уничтожает избыточную прибыль .
🧠 Теория против Машинного обучения: Смена парадигмы 44:16
В ходе беседы участники затронули вопрос того, почему экономическая теория так часто ошибается. Алехандро Лопес-Лира провел аналогию с современными технологиями, такими как ChatGPT. При создании нейросетей разработчики не «скармливают» им лингвистические теории Ноама Хомского — они просто дают модели огромное количество данных, чтобы она сама нашла паттерны .
Основные тезисы участников о роли теории:
- Теория заставляет исследователей упрощать мир до такой степени, что модель перестает учитывать сложность реальности .
- Ученые часто придумывают красивые объяснения (stories) уже после того, как увидели результат в данных . Алехандро Лопес-Лира шутит, что может за пять минут придумать рациональное обоснование для любого случайного сочетания бухгалтерских коэффициентов .
- Эндрю Чен отмечает, что в академической среде существует огромная награда за «рационализацию» аномалий — если вы докажете, что доходность обусловлена риском, а не ошибкой рынка, у вас гораздо больше шансов опубликоваться в топ-журнале .
🚀 Будущее исследований и ИИ 49:10
Несмотря на скепсис в отношении «рецензируемой теории», авторы не считают свою работу негативной. Напротив, Эндрю Чен полагает, что это «зеленый свет» для использования методов машинного обучения в финансах .
В планах исследователей:
- Разработка методов, позволяющих проводить дата-майнинг «безопасно», корректируя результаты на предвзятость множественного тестирования .
- Использование больших языковых моделей (LLM) для анализа того, как инвестиционные идеи распространяются в академической и популярной литературе .
- Изучение эволюции стратегий: как они переходят из категории «неизвестных аномалий» в категорию «общепризнанных факторов риска» .
В завершение Алехандро Лопес-Лира вспомнил цитату Джима Саймонса (Renaissance Technologies): некоторые из их самых прибыльных факторов имеют меньше всего логического смысла . Похоже, что этот принцип, долгое время работавший для краткосрочного трейдинга, начинает захватывать и область долгосрочного инвестирования.