Дипти Шарма: «Кто отвечает на вопросы — сам человек или его дед — меняет данные на 40%»

Conversations with Tyler 465 36 мин 5 мин 21.11.2024
Главное

Экономические данные — это фундамент, на котором строится государственная политика, однако этот фундамент может оказаться крайне нестабильным, если методы сбора информации содержат скрытые дефекты. В новом выпуске подкаста Conversations with Tyler (серия «Ideas of India») экономист Дипти Шарма обсуждает результаты своего исследования о систематических искажениях в опросах об использовании времени. Основной вывод её работы звучит как предупреждение для всех специалистов по данным: выбор между личным опросом и опросом через посредника (прокси-респондента) может радикально изменить картину занятости и домашнего труда в развивающихся странах.

🧐 Проблема «прокси-респондентов» в экономических исследованиях 2:39

В эмпирической социологии и экономике часто используется метод «прокси-ответов», когда один член домохозяйства (обычно глава семьи) предоставляет информацию за всех остальных . Этот метод экономит время и ресурсы исследователей, но, как утверждает Дипти Шарма, он вносит огромные искажения в данные об использовании времени .

Ключевые выводы исследования Дипти Шармы:

Дипти Шарма отмечает, что до 2019 года в Индии практически не было репрезентативных данных такого рода — предыдущий пилотный проект 1999 года охватывал лишь несколько штатов . В новом наборе данных 2019 года она обнаружила переменную, указывающую, кто именно давал ответ — сам человек или другой член семьи. Это позволило ей впервые в наблюдательном (не экспериментальном) исследовании оценить масштаб искажений .

📊 Почему ошибки не «взаимоуничтожаются» 7:22

В статистике существует предположение, что случайные ошибки при большом объёме выборки должны компенсировать друг друга. Однако Дипти Шарма обнаружила, что в случае с опросами времени это не так: ошибка носит систематический характер и всегда направлена в одну сторону .

Факторы, коррелирующие с величиной смещения:

  1. Пол и возраст: Статус и гендерные роли респондента и того, за кого он отвечает, определяют точность данных .
  2. Тип отношений: В парах (муж/жена) точность выше, так как информации внутри пары передаётся больше, чем в «непарных» выборках (например, внук и дед) .
  3. Общность занятий: Если члены семьи работают в одной сфере, их оценки времени гораздо ближе к истине .

По мнению исследовательницы, если данные предоставляет глава домохозяйства (часто мужчина старше 60 лет), он может «скрывать» определённую информацию стратегически или просто не замечать неявные виды деятельности других членов семьи .

👩‍🌾 Гендерное восприятие: когда работа становится «досугом» 10:30

Одной из самых ярких находок Дипти Шармы стала разница в восприятии одних и тех же действий мужчинами и женщинами. Это не просто вопрос памяти, а вопрос культурных определений того, что считается «работой».

Примеры асимметричного восприятия из исследования:

Дипти Шарма подчеркивает, что время — это «нотальное» (умозрительное) понятие . То, как мы его оцениваем, напрямую зависит от наших убеждений, религии и кастовых норм . Даже если внутри семьи существует эгалитарное разделение труда, при опросе посторонним человеком (интервьюером) респонденты часто возвращаются к традиционным гендерным сценариям .

🛠 Методы «лечения» данных: от статистики к практике 19:31

Поскольку исследователи часто получают данные уже в готовом виде и не могут переделать опрос, Дипти Шарма предлагает использовать продвинутые статистические методы для дебайзинга (устранения искажений).

Рекомендованные техники сопоставления (matching techniques):

Эти методы позволяют сравнивать «яблоки с яблоками», виртуально сопоставляя людей с одинаковыми характеристиками (возраст, образование, профессия), но с разными типами отчётности (личная против прокси) .

📋 Как изменить сбор данных в будущем 24:45

Исследовательница и ведущая обсудили, как государственные агентства могут улучшить качество национальных опросов без катастрофического роста расходов.

Предложенные решения:

  1. Комбинированный метод: Сочетание «дневников времени» (которые трудно вести при низкой грамотности) и интервью с помощью ассистентов .
  2. Триангуляция: Опрос нескольких членов домохозяйства об одном и том же событии для получения более точной картины .
  3. Корректирующие веса: Агентства должны предоставлять веса для прокси-ответов, чтобы аналитики могли автоматически корректировать смещение .
  4. Смешанный формат связи: Первый раунд опроса — личный (face-to-face), последующие — по телефону или онлайн, что дешевле и позволяет достучаться до конкретного человека, избегая прокси-ответов .

Шрути Раджагопалан привела в пример работу Ашвини Дешпанде и Найлы Кабир, которые обнаружили, что низкий уровень участия женщин в рабочей силе в Индии может быть частично связан именно с дизайном опросов. В некоторых округах Западной Бенгалии реальное участие женщин в труде составляло около 50%, хотя официальные данные NSS (National Sample Survey) показывали цифры ниже 20% .

🌡 Новые горизонты: климат и женское здоровье 31:14

В завершение беседы Дипти Шарма рассказала о своих текущих проектах, которые расширяют применение её методов анализа данных.

Влияние изменения климата на труд

Совместно с профессором Видьей Вемиредди из IIM Ahmedabad Дипти изучает, как экстремальная жара меняет распределение времени в аграрном секторе .

Кризис гистерэктомии в Андхра-Прадеш

Другое исследование касается резкого роста числа операций по удалению матки (гистерэктомии) в штатах Андхра-Прадеш, Телангана и Бихар, на которые приходится 70% таких операций в Индии .

По мнению Дипти Шармы, политическое решение исключить частные больницы из схем государственного медицинского страхования привело к трагическим последствиям :

💬 Цитаты

«Мы полагаемся на данные, не задумываясь об их источнике. Обычно это «знающий» человек в семье — мужчина старше 60 лет, чей ответ может в корне отличаться от моего собственного.»

Дипти Шарма 05:11

«Время — это очень умозрительная концепция. То, что я считаю заботой о дедушке, он может воспринимать как мой досуг, проведенный с ним.»

Дипти Шарма 12:03
👥 Спикеры
🎬 Упомянутые фильмы и сериалы
🔗 Упомянутые сайты и проекты
📖 Термины
Прокси-респондент
Лицо, которое отвечает на вопросы анкеты от имени другого члена семьи или группы.
Систематическое смещение (Systematic Bias)
Постоянная ошибка в данных, которая отклоняет результаты в определенную сторону, а не распределяется случайно.
Propensity Score Matching
Статистический метод, позволяющий сравнивать группы, уравнивая их по вероятности получения определенного признака.
Гистерэктомия
Хирургическая операция по удалению матки.
📊 Цифры
🗓 Хронология
  1. 1999 Запуск пилотного опроса об использовании времени в Индии.
  2. 2011 Введение новой политики здравоохранения в Андхра-Прадеш, затронувшей доступ к операциям.
  3. 2019 Выпуск новых репрезентативных данных об использовании времени, на которых основано исследование Дипти Шармы.
⚖️ Другая сторона
Экономика и финансы Дипти Шарма Тайлер Коуэн прокси-респондент использование времени Propensity Score Matching