# Дипти Шарма: «Кто отвечает на вопросы — сам человек или его дед — меняет данные на 40%»

Источник: https://www.youtube.com/watch?v=KTJMUcCbbNw
Канал: Conversations with Tyler
Опубликовано: 21.11.2024

---

Экономические данные — это фундамент, на котором строится государственная политика, однако этот фундамент может оказаться крайне нестабильным, если методы сбора информации содержат скрытые дефекты. В новом выпуске подкаста **Conversations with Tyler** (серия «Ideas of India») экономист Дипти Шарма обсуждает результаты своего исследования о систематических искажениях в опросах об использовании времени. Основной вывод её работы звучит как предупреждение для всех специалистов по данным: выбор между личным опросом и опросом через посредника (прокси-респондента) может радикально изменить картину занятости и домашнего труда в развивающихся странах.

## 🧐 Проблема «прокси-респондентов» в экономических исследованиях
[[JUMP:02:39]]

В эмпирической социологии и экономике часто используется метод «прокси-ответов», когда один член домохозяйства (обычно глава семьи) предоставляет информацию за всех остальных [02:54]. Этот метод экономит время и ресурсы исследователей, но, как утверждает Дипти Шарма, он вносит огромные искажения в данные об использовании времени [04:00].

Ключевые выводы исследования Дипти Шармы:

*   **Систематическое завышение занятости:** Прокси-респонденты склонны преувеличивать время, которое другие члены семьи тратят на оплачиваемую работу.
*   **Занижение домашнего труда:** Время, затраченное на уход за детьми, пожилыми и ведение хозяйства, систематически недооценивается прокси-респондентами [03:19].
*   **Масштаб ошибки:** В выборке трудоспособного населения (15–64 года) разрыв между самоотчётом и данными от посредника достигает **40%** [08:39].

Дипти Шарма отмечает, что до 2019 года в Индии практически не было репрезентативных данных такого рода — предыдущий пилотный проект 1999 года охватывал лишь несколько штатов [04:14]. В новом наборе данных 2019 года она обнаружила переменную, указывающую, кто именно давал ответ — сам человек или другой член семьи. Это позволило ей впервые в наблюдательном (не экспериментальном) исследовании оценить масштаб искажений [06:13].

## 📊 Почему ошибки не «взаимоуничтожаются»
[[JUMP:07:22]]

В статистике существует предположение, что случайные ошибки при большом объёме выборки должны компенсировать друг друга. Однако Дипти Шарма обнаружила, что в случае с опросами времени это не так: ошибка носит систематический характер и всегда направлена в одну сторону [07:34].

Факторы, коррелирующие с величиной смещения:

1.  **Пол и возраст:** Статус и гендерные роли респондента и того, за кого он отвечает, определяют точность данных [08:55].
2.  **Тип отношений:** В парах (муж/жена) точность выше, так как информации внутри пары передаётся больше, чем в «непарных» выборках (например, внук и дед) [09:09].
3.  **Общность занятий:** Если члены семьи работают в одной сфере, их оценки времени гораздо ближе к истине [09:47].

По мнению исследовательницы, если данные предоставляет глава домохозяйства (часто мужчина старше 60 лет), он может «скрывать» определённую информацию стратегически или просто не замечать неявные виды деятельности других членов семьи [05:23].

## 👩‍🌾 Гендерное восприятие: когда работа становится «досугом»
[[JUMP:10:30]]

Одной из самых ярких находок Дипти Шармы стала разница в восприятии одних и тех же действий мужчинами и женщинами. Это не просто вопрос памяти, а вопрос культурных определений того, что считается «работой».

Примеры асимметричного восприятия из исследования:

*   **Уход за скотом:** Женщины часто классифицируют это как трудовую деятельность. Мужчины же могут воспринимать это как часть домашнего хозяйства из-за близости животных к жилым постройкам [10:43].
*   **Совмещение дел:** Если женщина одновременно смотрит телевизор и присматривает за детьми, сама она назовёт это «уходом за ребёнком», в то время как мужчина-наблюдатель классифицирует это как «досуг» [10:55].
*   **Социальная желательность:** В консервативных сообществах мужчины-респонденты могут намеренно занижать вклад в домашние дела и завышать свою занятость, чтобы соответствовать общественным ожиданиям «кормильца» [15:09].

Дипти Шарма подчеркивает, что время — это «нотальное» (умозрительное) понятие [11:49]. То, как мы его оцениваем, напрямую зависит от наших убеждений, религии и кастовых норм [12:15]. Даже если внутри семьи существует эгалитарное разделение труда, при опросе посторонним человеком (интервьюером) респонденты часто возвращаются к традиционным гендерным сценариям [15:22].

## 🛠 Методы «лечения» данных: от статистики к практике
[[JUMP:19:31]]

Поскольку исследователи часто получают данные уже в готовом виде и не могут переделать опрос, Дипти Шарма предлагает использовать продвинутые статистические методы для дебайзинга (устранения искажений).

Рекомендованные техники сопоставления (matching techniques):

*   **Propensity Score Matching (PSM):** Старый, но всё ещё эффективный метод [23:38].
*   **Inverse Propensity Score Weighting (IPW):** Весовые коэффициенты на основе вероятности ответа [23:13].
*   **Coarsened Exact Matching (CEM):** Более современный и робастный (устойчивый) метод, который Дипти считает наиболее предпочтительным для устранения эндогенности [24:06].

Эти методы позволяют сравнивать «яблоки с яблоками», виртуально сопоставляя людей с одинаковыми характеристиками (возраст, образование, профессия), но с разными типами отчётности (личная против прокси) [21:38].

## 📋 Как изменить сбор данных в будущем
[[JUMP:24:45]]

Исследовательница и ведущая обсудили, как государственные агентства могут улучшить качество национальных опросов без катастрофического роста расходов.

Предложенные решения:

1.  **Комбинированный метод:** Сочетание «дневников времени» (которые трудно вести при низкой грамотности) и интервью с помощью ассистентов [25:52].
2.  **Триангуляция:** Опрос нескольких членов домохозяйства об одном и том же событии для получения более точной картины [25:12].
3.  **Корректирующие веса:** Агентства должны предоставлять веса для прокси-ответов, чтобы аналитики могли автоматически корректировать смещение [27:12].
4.  **Смешанный формат связи:** Первый раунд опроса — личный (face-to-face), последующие — по телефону или онлайн, что дешевле и позволяет достучаться до конкретного человека, избегая прокси-ответов [27:40].

Шрути Раджагопалан привела в пример работу Ашвини Дешпанде и Найлы Кабир, которые обнаружили, что низкий уровень участия женщин в рабочей силе в Индии может быть частично связан именно с дизайном опросов. В некоторых округах Западной Бенгалии реальное участие женщин в труде составляло около **50%**, хотя официальные данные NSS (National Sample Survey) показывали цифры ниже 20% [28:59].

## 🌡 Новые горизонты: климат и женское здоровье
[[JUMP:31:14]]

В завершение беседы Дипти Шарма рассказала о своих текущих проектах, которые расширяют применение её методов анализа данных.

### Влияние изменения климата на труд
Совместно с профессором Видьей Вемиредди из IIM Ahmedabad Дипти изучает, как экстремальная жара меняет распределение времени в аграрном секторе [31:28].

*   **Адаптация женщин:** В условиях аномальной жары женщины в сельской местности часто вынуждены тратить *больше* времени на полях, сокращая время на отдых и домашние дела [32:33].
*   **Поведение мужчин:** Мужчины, напротив, чаще прекращают работу в полях при экстремальных температурах и переключаются на неоплачиваемый уход за домом [32:47].
*   **Уязвимые группы:** Этот эффект наиболее выражен среди замужних женщин и представительниц племен (tribal women), у которых нет финансовой возможности переждать жару [32:59].

### Кризис гистерэктомии в Андхра-Прадеш
Другое исследование касается резкого роста числа операций по удалению матки (гистерэктомии) в штатах Андхра-Прадеш, Телангана и Бихар, на которые приходится **70%** таких операций в Индии [33:41].

По мнению Дипти Шармы, политическое решение исключить частные больницы из схем государственного медицинского страхования привело к трагическим последствиям [34:23]:

*   Женщины вынуждены идти в частные клиники, где они не застрахованы.
*   Частные больницы, стремясь к прибыли, убеждают пациенток, что матка — «бесполезный орган» после завершения детородного периода, и навязывают ненужные операции [34:50].
*   В результате женщины становятся физически слабее и финансово уязвимее из-за долгов за лечение [35:02].