stringtranslate.com

Поправка Хекмана

Поправка Хекмана — это статистический метод, позволяющий исправить погрешность неслучайно выбранных выборок или иным образом случайно усеченных зависимых переменных , что является широко распространенной проблемой в количественных социальных науках при использовании данных наблюдений . [1] Концептуально это достигается путем явного моделирования индивидуальной вероятности выборки каждого наблюдения (так называемое уравнение отбора) вместе с условным ожиданием зависимой переменной (так называемое уравнение результата). Полученная функция правдоподобия математически похожа на тобит-модель для цензурированных зависимых переменных , связь, впервые установленную Джеймсом Хекманом в 1974 году. [2] Хекман также разработал подход с двухэтапной функцией управления для оценки этой модели, [3] который позволяет избежать вычислительное бремя необходимости оценивать оба уравнения совместно , хотя и ценой неэффективности . [4] Хекман получил Нобелевскую премию по экономике в 2000 году за свою работу в этой области. [5]

Метод

Статистический анализ, основанный на неслучайно отобранных выборках, может привести к ошибочным выводам. Коррекция Хекмана, двухэтапный статистический подход, предлагает средства коррекции неслучайно выбранных выборок.

Хекман рассматривал смещение от использования неслучайно выбранных выборок для оценки поведенческих взаимосвязей как ошибку спецификации. Он предлагает двухэтапный метод оценки для исправления систематической ошибки. Коррекция использует идею функции управления и ее легко реализовать. Коррекция Хекмана включает в себя предположение о нормальности , обеспечивает тест на предвзятость выборки и формулу для модели с поправкой на предвзятость.

Предположим, что исследователь хочет оценить факторы, определяющие предложения заработной платы, но имеет доступ к наблюдениям о заработной плате только тех, кто работает. Поскольку работающие люди выбираются из населения не случайным образом, оценка факторов, определяющих заработную плату, по работающей подгруппе населения может привести к смещению. Коррекция Хекмана происходит в два этапа.

На первом этапе исследователь формулирует модель вероятности работы, основанную на экономической теории . Канонической спецификацией этого отношения является пробит- регрессия вида

где D указывает на занятость ( D  = 1, если респондент трудоустроен, и D  = 0 в противном случае), Z — вектор объясняющих переменных, — вектор неизвестных параметров, а Φ — кумулятивная функция распределения стандартного нормального распределения . Оценка модели дает результаты, которые можно использовать для прогнозирования вероятности трудоустройства для каждого человека.

На втором этапе исследователь корректирует самоотбор, включая преобразование этих предсказанных индивидуальных вероятностей в качестве дополнительной объясняющей переменной. Уравнение заработной платы может быть указано:

где обозначает базовое предложение заработной платы, которое не соблюдается, если респондент не работает. Тогда условное ожидание заработной платы при условии, что человек работает, составит

В предположении, что члены ошибок в совокупности нормальны , мы имеем

где ρ — корреляция между ненаблюдаемыми детерминантами склонности к труду и ненаблюдаемыми детерминантами предложения заработной платы u , σ u — стандартное отклонение , а — обратный коэффициент Миллса, оцениваемый в . Это уравнение демонстрирует понимание Хекмана о том, что выборку выборки можно рассматривать как форму систематической ошибки по пропущенным переменным , поскольку она обусловлена ​​как X , так и выборкой, как если бы выборка была выбрана случайным образом. Уравнение заработной платы можно оценить, заменив оценками Пробита из первого этапа, построив член и включив его в качестве дополнительной объясняющей переменной в оценку линейной регрессии уравнения заработной платы. Поскольку , коэффициент on может быть нулевым только в том случае, если , поэтому проверка нуля, при которой коэффициент on равен нулю, эквивалентна проверке селективности выборки. 

Достижения Хекмана породили большое количество эмпирических приложений в экономике, а также в других социальных науках. Исходный метод впоследствии был обобщен Хекманом и другими. [6]

Статистические выводы

Поправка Хекмана представляет собой двухэтапную M-оценку , в которой ковариационная матрица, сгенерированная оценкой OLS на втором этапе, противоречива. [7] Корректные стандартные ошибки и другие статистические данные могут быть сгенерированы на основе асимптотического приближения или путем повторной выборки, например, с помощью начальной загрузки . [8]

Недостатки

Реализации в пакетах статистики

Смотрите также

Рекомендации

  1. ^ Уиншип, Кристофер; Маре, Роберт Д. (1992). «Модели систематической ошибки отбора выборки». Ежегодный обзор социологии . 18 : 327–350. doi : 10.1146/annurev.so.18.080192.001551.
  2. ^ Хекман, Джеймс (1974). «Теневые цены, рыночная заработная плата и предложение рабочей силы». Эконометрика . 42 (4): 679–694. дои : 10.2307/1913937. JSTOR  1913937.
  3. ^ Хекман, Джеймс (1976). «Общая структура статистических моделей усечения, выборки выборки и ограниченных зависимых переменных, а также простая система оценки для таких моделей». Анналы экономических и социальных измерений . 5 (4): 475–492.
  4. ^ Навата, Кадзумицу (1994). «Оценка моделей смещения выборки с помощью оценщика максимального правдоподобия и двухэтапного оценщика Хекмана». Письма по экономике . 45 (1): 33–40. дои : 10.1016/0165-1765(94)90053-1.
  5. Учитель, Луи (12 октября 2000 г.). «Два американца получили Нобелевскую премию по экономике». Газета "Нью-Йорк Таймс .
  6. ^ Ли, Лунг-Фей (2001). «Самоотбор». В Балтаги Б. (ред.). Компаньон теоретической эконометрики . Оксфорд: Блэквелл. стр. 383–409. дои : 10.1002/9780470996249.ch19. ISBN 9780470996249.
  7. ^ Амемия, Такеши (1985). Продвинутая эконометрика . Кембридж: Издательство Гарвардского университета. стр. 368–372. ISBN 0-674-00560-0.
  8. ^ Кэмерон, А. Колин ; Триведи, Правин К. (2005). «Последовательная двухэтапная m-оценка». Микроэконометрика: методы и приложения . Нью-Йорк: Издательство Кембриджского университета. стр. 200–202. ISBN 0-521-84805-9.
  9. ^ Аб Пухани, П. (2000). «Поправка Хекмана для отбора выборки и ее критика». Журнал экономических обзоров . 14 (1): 53–68. дои : 10.1111/1467-6419.00104.
  10. ^ Голдбергер, А. (1983). «Аномальная ошибка выбора». В Карлине, Сэмюэл ; Амемия, Такеши ; Гудман, Лео (ред.). Исследования в области эконометрики, временных рядов и многомерной статистики . Нью-Йорк: Академическая пресса. стр. 67–84. ISBN 0-12-398750-4.
  11. ^ Ньюи, Уитни; Пауэлл, Дж.; Уокер, Джеймс Р. (1990). «Полупараметрическая оценка моделей выбора: некоторые эмпирические результаты». Американский экономический обзор . 80 (2): 324–28. JSTOR  2006593.
  12. ^ Льюбель, Артур (01 декабря 2019 г.). «Зоопарк идентификации: значения идентификации в эконометрике». Журнал экономической литературы . 57 (4): 835–903. дои : 10.1257/jel.20181361. ISSN  0022-0515.
  13. ^ Тумет, О.; Хеннингсен, А. (2008). «Примеры моделей выбора в R: пакет sampleSelection». Журнал статистического программного обеспечения . 27 (7): 1–23. дои : 10.18637/jss.v027.i07 .
  14. ^ «sampleSelection: Модели выбора образца» . Р-проект . 3 мая 2019 г.
  15. ^ «Хекман — Модель выбора Хекмана» (PDF) . Руководство по Стате .
  16. ^ Кэмерон, А. Колин; Триведи, Правин К. (2010). Микроэконометрика с использованием Stata (пересмотренная ред.). Колледж-Стейшн: Stata Press. стр. 556–562. ISBN 978-1-59718-073-3.

дальнейшее чтение

Внешние ссылки