Статистическая модель для цензурированных регрессантов
В статистике тобит-модель — это любой из классов регрессионных моделей , в которых наблюдаемый диапазон зависимой переменной цензурируется каким-либо образом. [ 1] Термин был придуман Артуром Голдбергером в отношении Джеймса Тобина , [2] [a] который разработал модель в 1958 году для смягчения проблемы нулевых завышенных данных для наблюдений за расходами домохозяйств на товары длительного пользования . [3] [b] Поскольку метод Тобина можно легко расширить для обработки усеченных и других неслучайно выбранных выборок, [c] некоторые авторы принимают более широкое определение тобит-модели, которое включает эти случаи. [4]
Идея Тобина состояла в том, чтобы изменить функцию правдоподобия так, чтобы она отражала неравную вероятность выборки для каждого наблюдения в зависимости от того, оказалась ли скрытая зависимая переменная выше или ниже определенного порога. [5] Для выборки, которая, как в исходном случае Тобина, была цензурирована снизу на нуле, вероятность выборки для каждого непредельного наблюдения — это просто высота соответствующей функции плотности . Для любого предельного наблюдения это кумулятивное распределение, т. е. интеграл ниже нуля соответствующей функции плотности. Таким образом, функция правдоподобия Тобита представляет собой смесь плотностей и кумулятивных функций распределения. [6]
Функция правдоподобия
Ниже приведены функции правдоподобия и логарифмического правдоподобия для тобита типа I. Это тобит, который цензурируется снизу, когда скрытая переменная . При записи функции правдоподобия мы сначала определяем индикаторную функцию :
Далее, пусть будет стандартной нормальной кумулятивной функцией распределения и будет стандартной нормальной функцией плотности вероятности . Для набора данных с N наблюдениями функция правдоподобия для тобита типа I равна
и логарифм правдоподобия определяется как
Репараметризация
Логарифмическое правдоподобие, как указано выше, не является глобально вогнутым , что усложняет оценку максимального правдоподобия . Олсен предложил простую перепараметризацию и , что приводит к преобразованному логарифмическому правдоподобию,
которая является глобально вогнутой в терминах преобразованных параметров. [7]
Для усеченной модели (Тобит II) Орм показал, что хотя логарифм правдоподобия не является глобально вогнутым, он вогнут в любой стационарной точке при указанном выше преобразовании. [8] [9]
Последовательность
Если параметр отношения оценивается путем регрессии наблюдаемого на , то полученная оценка регрессии по методу наименьших квадратов является несостоятельной . Она даст смещенную вниз оценку коэффициента наклона и смещенную вверх оценку отсекаемого отрезка. Такеши Амемия (1973) доказал, что оценка максимального правдоподобия, предложенная Тобином для этой модели, является последовательной. [10]
Интерпретация
Коэффициент не следует интерпретировать как эффект на , как это было бы с линейной регрессионной моделью ; это распространенная ошибка. Вместо этого его следует интерпретировать как комбинацию (1) изменения тех, кто выше предела, взвешенного по вероятности быть выше предела; и (2) изменения вероятности быть выше предела, взвешенного по ожидаемому значению, если выше. [11]
Вариации модели Тобита
Вариации модели tobit могут быть получены путем изменения того, где и когда происходит цензурирование . Амемия (1985, стр. 384) классифицирует эти вариации на пять категорий (тип tobit I – тип tobit V), где тип tobit I обозначает первую модель, описанную выше. Шнедлер (2005) предлагает общую формулу для получения согласованных оценок правдоподобия для этих и других вариаций модели tobit. [12]
Тип I
Модель тобита является частным случаем модели цензурированной регрессии , поскольку скрытая переменная не всегда может наблюдаться, в то время как независимая переменная наблюдаема. Распространенной вариацией модели тобита является цензурирование при значении, отличном от нуля:
Другим примером является цензурирование значений, указанных выше .
Еще одна модель возникает, когда цензура осуществляется одновременно сверху и снизу.
Остальные модели будут представлены как ограниченные снизу значением 0, хотя это можно обобщить, как это сделано для типа I.
Тип II
Модели Тобит II типа вводят вторую скрытую переменную. [13]
В тобите типа I скрытая переменная поглощает как процесс участия, так и интересующий результат. Тобит типа II позволяет процессу участия (выбору) и интересующему результату быть независимыми, обусловленными наблюдаемыми данными.
Модель отбора Хекмана относится к тобиту типа II, [14] который иногда называют Хеккитом в честь Джеймса Хекмана . [15]
Тип 3
Тип III вводит вторую наблюдаемую зависимую переменную.
Модель Хекмана относится к этому типу.
Тип IV
Тип IV вводит третью наблюдаемую зависимую переменную и третью скрытую переменную.
Тип V
Подобно типу II, в типе V наблюдается только знак .
Непараметрическая версия
Если базовая скрытая переменная не распределена нормально, необходимо использовать квантили вместо моментов для анализа наблюдаемой переменной . Оценка Пауэлла CLAD предлагает возможный способ достижения этого. [16]
Приложения
Например, модели Tobit применялись для оценки факторов, влияющих на получение грантов, включая финансовые переводы, распределяемые субнациональным правительствам, которые могут подавать заявки на эти гранты. В этих случаях получатели грантов не могут получать отрицательные суммы, и данные, таким образом, подвергаются левой цензуре. Например, Дальберг и Йоханссон (2002) анализируют выборку из 115 муниципалитетов (42 из которых получили грант). [17] Дюбуа и Фатторе (2011) используют модель Tobit для исследования роли различных факторов в получении средств Европейского Союза, применяя польские субнациональные правительства. [18] Однако данные могут подвергаться левой цензуре в точке выше нуля, с риском неправильной спецификации. Оба исследования применяют Probit и другие модели для проверки надежности. Модели Tobit также применялись в анализе спроса для учета наблюдений с нулевыми расходами на некоторые товары. В смежном применении моделей Тобит система нелинейных моделей регрессий Тобит использовалась для совместной оценки системы спроса на бренд с гомоскедастическими, гетероскедастическими и обобщенными гетероскедастическими вариантами. [19]
Смотрите также
Примечания
- ^ На вопрос, почему это называется моделью «tobit», а не моделью Тобина, Джеймс Тобин объяснил, что этот термин был введен Артуром Голдбергером , либо как портманто от «Tobin's probit », либо как ссылка на роман «The Caine Mutiny » , роман друга Тобина Германа Воука , в котором Тобин появляется в эпизодической роли «мистера Тобита». Тобин сообщает, что на самом деле спросил Голдбергера, что это было, и тот отказался сказать. См. Shiller, Robert J. (1999). «The ET Interview: Professor James Tobin». Econometric Theory . 15 (6): 867–900. doi :10.1017/S0266466699156056. S2CID 122574727.
- ^ Почти идентичная модель была независимо предложена Андерсом Хальдом в 1949 году, см. Хальд, А. (1949). «Оценка максимального правдоподобия параметров нормального распределения, усеченного в известной точке». Scandinavian Actuarial Journal . 49 (4): 119–134. doi :10.1080/03461238.1949.10419767.
- ^ Выборка цензурируется в , когда наблюдается для всех наблюдений , но истинное значение известно только для ограниченного диапазона наблюдений. Если выборка усечена , то и и наблюдаются только в том случае, если попадают в ограниченный диапазон. См. Breen, Richard (1996). Regression Models : Censored, Samples Selected или Truncated Data. Thousand Oaks: Sage. стр. 2–4. ISBN 0-8039-5710-6.
Ссылки
- ^ Хаяси, Фумио (2000). Эконометрика . Принстон: Princeton University Press. С. 518–521. ISBN 0-691-01018-8.
- ^ Голдбергер, Артур С. (1964). Эконометрическая теория . Нью-Йорк: J. Wiley. С. 253–55. ISBN 9780471311010.
- ^ Тобин, Джеймс (1958). «Оценка связей для ограниченных зависимых переменных» (PDF) . Econometrica . 26 (1): 24–36. doi :10.2307/1907382. JSTOR 1907382.
- ^ Амемия, Такеши (1984). «Модели Тобита: Обзор». Журнал эконометрики . 24 (1–2): 3–61. doi :10.1016/0304-4076(84)90074-5.
- ^ Кеннеди, Питер (2003). Руководство по эконометрике (Пятое изд.). Кембридж: MIT Press. С. 283–284. ISBN 0-262-61183-X.
- ^ Биренс, Герман Дж. (2004). Введение в математические и статистические основы эконометрики . Cambridge University Press. стр. 207.
- ^ Олсен, Рэндалл Дж. (1978). «Заметка об уникальности оценки максимального правдоподобия для модели Тобита». Econometrica . 46 (5): 1211–1215. doi :10.2307/1911445. JSTOR 1911445.
- ^ Орм, Крис (1989). «Об уникальности оценки максимального правдоподобия в усеченных регрессионных моделях». Econometric Reviews . 8 (2): 217–222. doi :10.1080/07474938908800171.
- ^ Ивата, Сигеру (1993). «Заметка о множественных корнях логарифма правдоподобия Тобита». Журнал эконометрики . 56 (3): 441–445. doi :10.1016/0304-4076(93)90129-S.
- ^ Амемия, Такеши (1973). «Регрессионный анализ, когда зависимая переменная усечена нормально». Econometrica . 41 (6): 997–1016. doi :10.2307/1914031. JSTOR 1914031.
- ^ Макдональд, Джон Ф.; Моффит, Роберт А. (1980). «Использование анализа Товита». Обзор экономики и статистики . 62 (2): 318–321. doi :10.2307/1924766. JSTOR 1924766.
- ^ Шнедлер, Венделин (2005). «Оценка правдоподобия для цензурированных случайных векторов» (PDF) . Econometric Reviews . 24 (2): 195–217. doi :10.1081/ETC-200067925. hdl :10419/127228. S2CID 55747319.
- ^ Амемия, Такеши (1985). "Модели Тобита". Продвинутая эконометрика . Кембридж, Массачусетс: Издательство Гарвардского университета. стр. 384. ISBN 0-674-00560-0. OCLC 11728277.
- ^ Хекман, Джеймс Дж. (1979). «Смещение выборки как ошибка спецификации». Econometrica . 47 (1): 153–161. doi :10.2307/1912352. ISSN 0012-9682. JSTOR 1912352.
- ^ Сигельман, Ли; Цзэн, Лангче (1999). «Анализ цензурированных и выборочно-отобранных данных с помощью моделей Тобита и Хеккита». Политический анализ . 8 (2): 167–182. doi :10.1093/oxfordjournals.pan.a029811. ISSN 1047-1987. JSTOR 25791605.
- ^ Powell, James L (1 июля 1984 г.). «Оценка наименьших абсолютных отклонений для цензурированной регрессионной модели». Journal of Econometrics . 25 (3): 303–325. CiteSeerX 10.1.1.461.4302 . doi :10.1016/0304-4076(84)90004-6.
- ^ Дальберг, Мац; Йоханссон, Ева (2002-03-01). «О поведении действующих правительств в плане покупки голосов». American Political Science Review . 96 (1): 27–40. CiteSeerX 10.1.1.198.4112 . doi :10.1017/S0003055402004215. ISSN 1537-5943. S2CID 12718473.
- ^ Дюбуа, Ханс Ф. В.; Фатторе, Джованни (01.07.2011). «Распределение государственного финансирования через оценку проекта». Региональные и федеральные исследования . 21 (3): 355–374. doi :10.1080/13597566.2011.578827. ISSN 1359-7566. S2CID 154659642.
- ^ Балтас, Джордж (2001). «Системы спроса на бренды, соответствующие полезности, с эндогенным потреблением категории: принципы и маркетинговые приложения». Decision Sciences . 32 (3): 399–422. doi :10.1111/j.1540-5915.2001.tb00965.x. ISSN 0011-7315.
Дальнейшее чтение
- Амемия, Такеши (1985). «Модели Тобита». Advanced Econometrics . Oxford: Basil Blackwell. стр. 360–411. ISBN 0-631-13345-3.
- Брин, Ричард (1996). «Модель Тобита для цензурированных данных». Регрессионные модели: цензурированные, выборочно выбранные или усеченные данные . Thousand Oaks: Sage. стр. 12–33. ISBN 0-8039-5710-6.
- Гурьеру, Кристиан (2000). «Модель Товита». Эконометрика качественных зависимых переменных . Нью-Йорк: Cambridge University Press. С. 170–207. ISBN 0-521-58985-1.
- Кинг, Гэри (1989). «Модели с неслучайным выбором». Унификация политической методологии: теория сходства статистического вывода . Cambridge University Press. стр. 208–230. ISBN 0-521-36697-6.
- Маддала, Г.С. (1983). «Цензурированные и усеченные регрессионные модели». Ограниченно-зависимые и качественные переменные в эконометрике . Нью-Йорк: Cambridge University Press. С. 149–196. ISBN 0-521-24143-X.