Панельный анализ ( анализ данных ) — статистический метод, широко используемый в социальных науках , эпидемиологии и эконометрике для анализа двумерных (обычно поперечных и продольных) панельных данных . [1] Данные обычно собираются с течением времени и по одним и тем же людям, а затем проводится регрессия по этим двум измерениям. Многомерный анализ — это эконометрический метод, при котором данные собираются по более чем двум измерениям (обычно по времени, отдельным лицам и некоторому третьему измерению). [2]
Обычная модель регрессии панельных данных выглядит так : где – зависимая переменная , – независимая переменная , – коэффициенты, а – индексы для отдельных лиц и времени. Ошибка очень важна в этом анализе. Предположения относительно ошибки определяют, говорим ли мы о фиксированных эффектах или о случайных эффектах. В модели с фиксированными эффектами предполагается, что она изменяется нестохастически или делает модель с фиксированными эффектами аналогичной модели с фиктивной переменной в одном измерении. В модели случайных эффектов предполагается, что матрица дисперсии ошибок изменяется стохастически или требует специальной обработки. [3]
Анализ панельных данных имеет три более или менее независимых подхода:
Выбор между этими методами зависит от цели анализа и проблем, связанных с экзогенностью объясняющих переменных.
Ключевое допущение:
в наборе измерений нет уникальных свойств отдельных лиц, а также нет универсальных эффектов во времени.
Ключевое предположение:
существуют уникальные характеристики людей, которые не меняются со временем. То есть уникальные атрибуты данного человека не зависят от времени . Эти атрибуты могут коррелировать или не коррелировать с отдельными зависимыми переменными y i . Чтобы проверить, необходимы ли фиксированные эффекты, а не случайные эффекты, можно использовать тест Дурбина-Ву-Хаусмана .
Ключевое предположение:
существуют уникальные, постоянные во времени характеристики индивидуумов, которые не коррелируют с отдельными регрессорами. Объединенное МНК [ необходимы пояснения ] можно использовать для получения объективных и непротиворечивых оценок параметров, даже если присутствуют атрибуты постоянной времени, но случайные эффекты будут более эффективными .
Модель случайных эффектов - это возможный обобщенный метод наименьших квадратов, который асимптотически более эффективен, чем объединенный OLS, когда присутствуют атрибуты постоянной времени. Случайные эффекты корректируются с учетом серийной корреляции, вызванной ненаблюдаемыми атрибутами постоянной времени.
В стандартных моделях случайных эффектов (RE) и фиксированных эффектов (FE) предполагается, что независимые переменные не коррелируют с погрешностями. При наличии действенных инструментов методы RE и FE распространяются на случай, когда некоторые объясняющие переменные могут быть эндогенными. Как и в экзогенных условиях, модель RE с инструментальными переменными (REIV) требует более строгих допущений, чем модель FE с инструментальными переменными (FEIV), но она имеет тенденцию быть более эффективной при соответствующих условиях. [4]
Для закрепления идей рассмотрим следующую модель:
где - ненаблюдаемый, не зависящий от времени эффект для конкретной единицы (назовем его ненаблюдаемым эффектом), который может быть коррелирован с для s , возможно, отличного от t . Предположим, существует набор действующих инструментов .
В рамках REIV ключевые предположения включают в себя то, что не коррелирует с . Фактически, чтобы оценщик REIV был эффективным, необходимы более сильные условия, чем некоррелированность между инструментами и ненаблюдаемый эффект.
С другой стороны, оценщик FEIV требует только, чтобы инструменты были экзогенными с погрешностями после обусловления ненаблюдаемым эффектом , т.е. [4] Условие FEIV допускает произвольную корреляцию между инструментами и ненаблюдаемым эффектом. Однако эта общность не дается бесплатно: не допускаются независимые от времени объясняющие и инструментальные переменные. Как и в обычном методе FE, оценщик использует временные переменные для устранения ненаблюдаемого эффекта. Следовательно, оценщик FEIV будет иметь ограниченное применение, если интересующие переменные включают в себя не зависящие от времени переменные.
Вышеприведенное обсуждение имеет параллель с экзогенным случаем моделей RE и FE. В экзогенном случае RE предполагает некоррелированность между объясняющими переменными и ненаблюдаемым эффектом, а FE допускает произвольную корреляцию между ними. Как и в стандартном случае, REIV имеет тенденцию быть более эффективным, чем FEIV, при условии, что выполняются соответствующие предположения. [4]
В отличие от стандартной панельной модели данных, динамическая панельная модель также включает в себя лагированные значения зависимой переменной в качестве регрессоров. Например, включение одного лага зависимой переменной приводит к:
В этом случае нарушаются предположения моделей с фиксированным эффектом и случайным эффектом. Вместо этого практики используют такой метод, как оценщик Арельяно-Бонда .