Панельный анализ

Панельный анализ ( анализ данных ) — статистический метод, широко используемый в социальных науках , эпидемиологии и эконометрике для анализа двумерных (обычно поперечных и продольных) панельных данных . ^[1] Данные обычно собираются с течением времени и по одним и тем же людям, а затем проводится регрессия по этим двум измерениям. Многомерный анализ — это эконометрический метод, при котором данные собираются по более чем двум измерениям (обычно по времени, отдельным лицам и некоторому третьему измерению). ^[2]

Обычная модель регрессии панельных данных выглядит так : где – зависимая переменная , – независимая переменная , – коэффициенты, а – индексы для отдельных лиц и времени. Ошибка очень важна в этом анализе. Предположения относительно ошибки определяют, говорим ли мы о фиксированных эффектах или о случайных эффектах. В модели с фиксированными эффектами предполагается, что она изменяется нестохастически или делает модель с фиксированными эффектами аналогичной модели с фиктивной переменной в одном измерении. В модели случайных эффектов предполагается, что матрица дисперсии ошибок изменяется стохастически или требует специальной обработки. ^[3] $y_{it}=a+bx_{it}+\varepsilon _{it}$ $y$ $х$ $а$ $б$ $я$ $т$ $\varepsilon _{it}$ $\varepsilon _{it}$ $я$ $т$ $\varepsilon _{it}$ $я$ $т$

Анализ панельных данных имеет три более или менее независимых подхода:

независимо объединенные панели;
модели случайных эффектов ;
модели с фиксированными эффектами или первые разностные модели.

Выбор между этими методами зависит от цели анализа и проблем, связанных с экзогенностью объясняющих переменных.

Независимые объединенные панели

Ключевое допущение:
в наборе измерений нет уникальных свойств отдельных лиц, а также нет универсальных эффектов во времени.

Модели с фиксированным эффектом

Ключевое предположение:
существуют уникальные характеристики людей, которые не меняются со временем. То есть уникальные атрибуты данного человека не зависят от времени . Эти атрибуты могут коррелировать или не коррелировать с отдельными зависимыми переменными y _i . Чтобы проверить, необходимы ли фиксированные эффекты, а не случайные эффекты, можно использовать тест Дурбина-Ву-Хаусмана . $я$ $т$

Модели случайных эффектов

Ключевое предположение:
существуют уникальные, постоянные во времени характеристики индивидуумов, которые не коррелируют с отдельными регрессорами. Объединенное МНК ^{[ необходимы пояснения ]} можно использовать для получения объективных и непротиворечивых оценок параметров, даже если присутствуют атрибуты постоянной времени, но случайные эффекты будут более эффективными .

Модель случайных эффектов - это возможный обобщенный метод наименьших квадратов, который асимптотически более эффективен, чем объединенный OLS, когда присутствуют атрибуты постоянной времени. Случайные эффекты корректируются с учетом серийной корреляции, вызванной ненаблюдаемыми атрибутами постоянной времени.

Модели с инструментальными переменными

В стандартных моделях случайных эффектов (RE) и фиксированных эффектов (FE) предполагается, что независимые переменные не коррелируют с погрешностями. При наличии действенных инструментов методы RE и FE распространяются на случай, когда некоторые объясняющие переменные могут быть эндогенными. Как и в экзогенных условиях, модель RE с инструментальными переменными (REIV) требует более строгих допущений, чем модель FE с инструментальными переменными (FEIV), но она имеет тенденцию быть более эффективной при соответствующих условиях. ^[4]

Для закрепления идей рассмотрим следующую модель:

y_{it}=x_{it}\beta +c_{i}+u_{it}

где - ненаблюдаемый, не зависящий от времени эффект для конкретной единицы (назовем его ненаблюдаемым эффектом), который может быть коррелирован с для s , возможно, отличного от t . Предположим, существует набор действующих инструментов . $c_{i}$ $x_{it}$ $u_{is}$ $z_{i}=(z_{i1},\ldots,z_{it})$

В рамках REIV ключевые предположения включают в себя то, что не коррелирует с . Фактически, чтобы оценщик REIV был эффективным, необходимы более сильные условия, чем некоррелированность между инструментами и ненаблюдаемый эффект. $z_{i}$ $c_{i}$ $u_{it}$ ${\ displaystyle t = 1, \ ldots, T}$

С другой стороны, оценщик FEIV требует только, чтобы инструменты были экзогенными с погрешностями после обусловления ненаблюдаемым эффектом , т.е. ^[4] Условие FEIV допускает произвольную корреляцию между инструментами и ненаблюдаемым эффектом. Однако эта общность не дается бесплатно: не допускаются независимые от времени объясняющие и инструментальные переменные. Как и в обычном методе FE, оценщик использует временные переменные для устранения ненаблюдаемого эффекта. Следовательно, оценщик FEIV будет иметь ограниченное применение, если интересующие переменные включают в себя не зависящие от времени переменные. $E[u_{it}\mid z_{i},c_{i}]=0[1]$

Вышеприведенное обсуждение имеет параллель с экзогенным случаем моделей RE и FE. В экзогенном случае RE предполагает некоррелированность между объясняющими переменными и ненаблюдаемым эффектом, а FE допускает произвольную корреляцию между ними. Как и в стандартном случае, REIV имеет тенденцию быть более эффективным, чем FEIV, при условии, что выполняются соответствующие предположения. ^[4]

Динамические панельные модели

В отличие от стандартной панельной модели данных, динамическая панельная модель также включает в себя лагированные значения зависимой переменной в качестве регрессоров. Например, включение одного лага зависимой переменной приводит к:

y_{it}=a+bx_{it}+\rho y_{it-1}+\varepsilon _{it}

В этом случае нарушаются предположения моделей с фиксированным эффектом и случайным эффектом. Вместо этого практики используют такой метод, как оценщик Арельяно-Бонда .