Модель случайных эффектов

В статистике модель случайных эффектов , также называемая моделью компонентов дисперсии , представляет собой статистическую модель , где параметры модели являются случайными величинами . Это разновидность иерархической линейной модели , которая предполагает, что анализируемые данные берутся из иерархии различных популяций, различия которых связаны с этой иерархией. Модель случайных эффектов является частным случаем смешанной модели .

Сравните это с определениями биостатистики , ^[1]^[2]^[3]^[4]^[5], поскольку биостатистики используют «фиксированные» и «случайные» эффекты для обозначения соответственно средних по популяции и специфических для субъекта эффектов (и где последние, как правило, предполагаются неизвестными, скрытыми переменными ).

Качественное описание

Модели случайных эффектов помогают контролировать ненаблюдаемую гетерогенность , когда гетерогенность постоянна во времени и не коррелирует с независимыми переменными. Эта константа может быть удалена из продольных данных посредством дифференциации, поскольку взятие первой разности удалит любые инвариантные во времени компоненты модели. ^[6]

Можно сделать два общих предположения относительно индивидуального специфического эффекта: предположение о случайных эффектах и предположение о фиксированных эффектах. Предположение о случайных эффектах заключается в том, что индивидуальная ненаблюдаемая гетерогенность не коррелирует с независимыми переменными. Предположение о фиксированных эффектах заключается в том, что индивидуальный специфический эффект коррелирует с независимыми переменными. ^[6]

Если предположение о случайных эффектах верно, то оценка случайных эффектов более эффективна, чем модель с фиксированными эффектами.

Простой пример

Предположим, что крупные начальные школы выбираются случайным образом из тысяч в большой стране. Предположим также, что ученики одного возраста выбираются случайным образом в каждой выбранной школе. Их баллы по стандартному тесту на способности устанавливаются. Пусть будет баллом -го ученика в -й школе. $м$ $n$ $Y_{ij}$ $j$ $я$

Простой способ моделирования этой переменной:

Y_{ij}=\mu +U_{i}+W_{ij},\,

где - средний балл теста для всего населения. $\мю$

В этой модели есть школьно-специфический случайный эффект : он измеряет разницу между средним баллом в школе и средним баллом по всей стране. Термином является индивидуально-специфический случайный эффект, т. е. это отклонение балла -го ученика от среднего балла для -й школы. $U_{i}$ $я$ $W_{ij}$ $j$ $я$

Модель может быть расширена путем включения дополнительных объясняющих переменных, которые будут фиксировать различия в результатах среди разных групп. Например:

Y_{ij}=\mu +\beta _{1}\mathrm {Sex} _{ij}+\beta _{2}\mathrm {ParentsEduc} _{ij}+U_{i}+W_{ ij},\,

где — это бинарная фиктивная переменная , которая записывает, скажем, средний уровень образования родителей ребенка. Это смешанная модель , а не модель чисто случайных эффектов, поскольку она вводит члены с фиксированными эффектами для пола и образования родителей. $\mathrm {Секс} _{ij}$ $\mathrm {ParentsEduc} _{ij}$

Компоненты дисперсии

Дисперсия равна сумме дисперсий и и соответственно . $Y_{ij}$ $\тау ^{2}$ $\сигма ^{2}$ $U_{i}$ $W_{ij}$

Позволять

{\overline {Y}}_{i\bullet }={\frac {1}{n}}\sum _{j=1}^{n}Y_{ij}

будет средним значением не всех оценок в -й школе, а тех оценок в -й школе, которые включены в случайную выборку . Пусть $я$ $я$

{\overline {Y}}_{\bullet \bullet }={\frac {1}{mn}}\sum _{i=1}^{m}\sum _{j=1}^{n}Y_{ij}

быть средним показателем .

Позволять

SSW=\sum _{i=1}^{m}\sum _{j=1}^{n}(Y_{ij}-{\overline {Y}}_{i\bullet })^{2}\,

SSB=n\sum _{i=1}^{m}({\overline {Y}}_{i\bullet }-{\overline {Y}}_{\bullet \bullet })^{2}\,

быть соответственно суммой квадратов из-за различий внутри групп и суммой квадратов из-за различий между группами. Тогда можно показать ^{[ нужна цитата ],} что

{\frac {1}{m(n-1)}}E(SSW)=\sigma ^{2}

{\frac {1}{(m-1)n}}E(SSB)={\frac {\sigma ^{2}}{n}}+\tau ^{2}.

Эти « ожидаемые средние квадраты » можно использовать в качестве основы для оценки «компонентов дисперсии» и . $\sigma ^{2}$ $\tau ^{2}$

Параметр также называется коэффициентом внутриклассовой корреляции . $\sigma ^{2}$

Предельная вероятность

Для моделей случайных эффектов важны предельные вероятности . ^[7]

Приложения

Модели случайных эффектов, используемые на практике, включают модель Бюльмана для страховых контрактов и модель Фэя-Херриота, используемую для оценки малых территорий .

Смотрите также

Дальнейшее чтение

Балтаги, Бади Х. (2008). Эконометрический анализ панельных данных (4-е изд.). Нью-Йорк, Нью-Йорк: Wiley. С. 17–22. ISBN 978-0-470-51886-1.
Сяо, Ченг (2003). Анализ панельных данных (2-е изд.). Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. стр. 73–92. ISBN 0-521-52271-4.
Вулдридж, Джеффри М. (2002). Эконометрический анализ данных поперечного сечения и панельных данных . Кембридж, Массачусетс: MIT Press. стр. 257–265. ISBN 0-262-23219-7.
Гомес, Дилан GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID 35116198.

Ссылки

^ Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр. 169–171. ISBN 0-19-852484-6.
^ Фицморис, Гарретт М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной лонгитюдный анализ . Хобокен: John Wiley & Sons. стр. 326–328. ISBN 0-471-21487-6.
^ Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. doi :10.2307/2529876. JSTOR 2529876. PMID 7168798.
^ Гардинер, Джозеф К.; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221–239. doi :10.1002/sim.3478. PMID 19012297.
^ Гомес, Дилан GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID 35116198.
^ ab Wooldridge, Jeffrey (2010). Эконометрический анализ данных поперечного сечения и панельных данных (2-е изд.). Кембридж, Массачусетс: MIT Press. стр. 252. ISBN 9780262232586. OCLC 627701062.
^ Хедекер, Д., Гиббонс, Р. Д. (2006). Анализ продольных данных. Германия: Wiley. Страница 163 https://books.google.com/books?id=f9p9iIgzQSQC&pg=PA163

Внешние ссылки

Модели с фиксированными и случайными эффектами
Как провести метаанализ: модели с фиксированным и случайным эффектом