Маттео Маджори: «Публичные данные N-PORT — спасение для молодых ученых»

Stanford Graduate School of Business 1 тыс. 40 мин 4 мин 28.08.2025
Главное

На лекции в Стенфордской высшей школе бизнеса (Stanford GSB) профессор Маттео Маджори представил обзор революционных изменений в доступности финансовых данных. Основной акцент был сделан на наборе данных N-PORT — публичных микроданных США, которые позволяют исследователям детально анализировать инвестиционные портфели без необходимости покупки дорогостоящих коммерческих лицензий.

🔓 Преимущества публичных данных для молодых ученых 0:22

Для аспирантов и PhD-студентов публичные данные являются критически важным ресурсом из-за ограниченности их бюджетов и необходимости быстрого старта проектов. По мнению Маджори, использование открытых источников позволяет избежать многомесячных переговоров по контрактам и ожидания финансирования от университетов.

Ключевые преимущества работы с публичными микроданными:

📊 Регуляция N-PORT: Новая эра прозрачности 3:36

Главным сдвигом в информационной среде США стало введение отчетности по форме N-PORT. Согласно этому регламенту, компании по управлению инвестициями обязаны ежеквартально раскрывать свои активы правительству США. Эти данные публикуются на портале data.gov и доступны через API.

Характеристики данных N-PORT:

По мнению профессора, десять лет назад сбор такой информации требовал колоссальных усилий, в то время как сейчас она предоставляется «в чистом и упакованном виде».

⚖️ Верификация: Сравнение с макроданными и коммерческим сектором 9:40

Любые микроданные требуют проверки на репрезентативность. Маджори и его команда (включая Бруно Канавани из Колумбийского университета и Джесси Шрегера) провели бенчмаркинг N-PORT против агрегированных показателей системы национальных счетов США — Flow of Funds.

Результаты сопоставления:

Для сравнения, в Евросоюзе после долгового кризиса была создана гораздо более точная система административного учета каждой ценной бумаги, находящейся в собственности резидентов ЕС. США в этом плане пока отстают, не имея единого реестра внутренних владений.

🧩 Технические сложности и идентификаторы 18:06

При переходе от агрегированных показателей к более детальным срезам возникают две основные проблемы: определения и шум. Например, классификация корпоративных облигаций и ценных бумаг, обеспеченных активами (ABS), может различаться в разных базах данных.

Спикер выделил специфику идентификации эмитентов через CUSIP:

Агрегация данных требует тщательной работы по связыванию этих кодов, чтобы понимать, что разные бумаги принадлежат одному и тому же юридическому лицу.

📉 «Терра инкогнита» производных финансовых инструментов 28:24

Ситуация с деривативами в публичных данных остается сложной. По словам Маджори, адекватная оценка экспозиции (exposure) через производные инструменты практически невозможна на основе текущих отчетов.

Проблема заключается в способе отчетности:

В данных N-PORT информация о страйках, сроках и объемах для сложных деривативов часто отсутствует или представлена противоречиво. Однако для валютных свопов и форвардов ситуация обстоит лучше, и на их основе уже пишутся качественные работы.

🏠 Практическое применение: Домашнее смещение и валютный эффект 32:34

Для демонстрации возможностей N-PORT команда проекта воспроизвела классические экономические исследования на новых данных. Были проверены гипотезы о home bias (предпочтение инвесторами бумаг своей страны) и валютном влиянии.

Основные выводы репликации:

  1. Home Bias: Даже спустя 20 лет после классических работ Френча и Потербы, эффект «домашнего смещения» остается мощнейшим фактором в данных.
  2. Валютный фактор: Инвесторы склонны держать бумаги, номинированные в их национальной валюте. При совместном анализе коэффициент «домашнего смещения» снижается, а валютный коэффициент остается стабильно высоким.

🛠 Открытый код как общественное благо 7:16

Stanford GCAP Lab позиционирует свою работу как создание «общественного блага». В рамках летней школы они подготовили GitHub-репозиторий, который содержит не только ссылки на данные, но и код для их очистки (cleaning codes).

Цель проекта — создать готовую базу данных, которую можно загрузить напрямую в Stata или другие статистические пакеты. Маджори призвал сообщество использовать этот открытый код и сообщать об обнаруженных ошибках или «двойном счете» (double counting), превращая проект в коллективную разработку.

💬 Цитаты

«Публичные данные — ваш друг, особенно когда у вас мало денег, но много времени.»

Маттео Маджори 0:35

«Деривативы — это «терра инкогнита» для тех, кто хочет написать следующую великую статью.»

Маттео Маджори 31:15
👥 Спикер
🔗 Упомянутые сайты и проекты
📖 Термины
N-PORT
Регуляторная форма отчетности в США, требующая от фондов раскрытия структуры их портфелей.
CUSIP
Девятизначный буквенно-цифровой код, идентифицирующий ценные бумаги в Северной Америке.
ISIN
Международный идентификационный код ценной бумаги.
LEI
Международный код идентификации юридических лиц.
Дельта (Δ)
Показатель изменения цены производного инструмента при изменении цены базового актива на единицу.
📊 Цифры
🗓 Хронология
  1. 2019 Начало действия регуляции N-PORT и накопления данных.
  2. 2023 Текущая сессия Stanford GSB, презентующая инструменты обработки этих данных.
  3. 2025 Q2 Пример квартала данных, доступного для загрузки в демонстрации.
⚖️ Другая сторона
Экономика и финансы Маттео Маджори SEC N-PORT Stanford GSB CUSIP ISIN