Статистическая модель
В статистике модель случайных эффектов , также называемая моделью компонентов дисперсии , представляет собой статистическую модель , где параметры модели являются случайными величинами . Это разновидность иерархической линейной модели , которая предполагает, что анализируемые данные берутся из иерархии различных популяций, различия которых связаны с этой иерархией. Модель случайных эффектов является частным случаем смешанной модели .
Сравните это с определениями биостатистики , [1] [2] [3] [4] [5], поскольку биостатистики используют «фиксированные» и «случайные» эффекты для обозначения соответственно средних по популяции и специфических для субъекта эффектов (и где последние, как правило, предполагаются неизвестными, скрытыми переменными ).
Качественное описание
Модели случайных эффектов помогают контролировать ненаблюдаемую гетерогенность , когда гетерогенность постоянна во времени и не коррелирует с независимыми переменными. Эта константа может быть удалена из продольных данных посредством дифференциации, поскольку взятие первой разности удалит любые инвариантные во времени компоненты модели. [6]
Можно сделать два общих предположения относительно индивидуального специфического эффекта: предположение о случайных эффектах и предположение о фиксированных эффектах. Предположение о случайных эффектах заключается в том, что индивидуальная ненаблюдаемая гетерогенность не коррелирует с независимыми переменными. Предположение о фиксированных эффектах заключается в том, что индивидуальный специфический эффект коррелирует с независимыми переменными. [6]
Если предположение о случайных эффектах верно, то оценка случайных эффектов более эффективна, чем модель с фиксированными эффектами.
Простой пример
Предположим, что крупные начальные школы выбираются случайным образом из тысяч в большой стране. Предположим также, что ученики одного возраста выбираются случайным образом в каждой выбранной школе. Их баллы по стандартному тесту на способности устанавливаются. Пусть будет баллом -го ученика в -й школе.
Простой способ моделирования этой переменной:
где - средний балл теста для всего населения.
В этой модели есть школьно-специфический случайный эффект : он измеряет разницу между средним баллом в школе и средним баллом по всей стране. Термином является индивидуально-специфический случайный эффект, т. е. это отклонение балла -го ученика от среднего балла для -й школы.
Модель может быть расширена путем включения дополнительных объясняющих переменных, которые будут фиксировать различия в результатах среди разных групп. Например:
где — это бинарная фиктивная переменная , которая записывает, скажем, средний уровень образования родителей ребенка. Это смешанная модель , а не модель чисто случайных эффектов, поскольку она вводит члены с фиксированными эффектами для пола и образования родителей.
Компоненты дисперсии
Дисперсия равна сумме дисперсий и и соответственно .
Позволять
будет средним значением не всех оценок в -й школе, а тех оценок в -й школе, которые включены в случайную выборку . Пусть
быть средним показателем .
Позволять
быть соответственно суммой квадратов из-за различий внутри групп и суммой квадратов из-за различий между группами. Тогда можно показать [ нужна цитата ], что
и
Эти « ожидаемые средние квадраты » можно использовать в качестве основы для оценки «компонентов дисперсии» и .
Параметр также называется коэффициентом внутриклассовой корреляции .
Предельная вероятность
Для моделей случайных эффектов важны предельные вероятности . [7]
Приложения
Модели случайных эффектов, используемые на практике, включают модель Бюльмана для страховых контрактов и модель Фэя-Херриота, используемую для оценки малых территорий .
Смотрите также
Дальнейшее чтение
- Балтаги, Бади Х. (2008). Эконометрический анализ панельных данных (4-е изд.). Нью-Йорк, Нью-Йорк: Wiley. С. 17–22. ISBN 978-0-470-51886-1.
- Сяо, Ченг (2003). Анализ панельных данных (2-е изд.). Нью-Йорк, штат Нью-Йорк: Издательство Кембриджского университета. стр. 73–92. ISBN 0-521-52271-4.
- Вулдридж, Джеффри М. (2002). Эконометрический анализ данных поперечного сечения и панельных данных . Кембридж, Массачусетс: MIT Press. стр. 257–265. ISBN 0-262-23219-7.
- Гомес, Дилан GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID 35116198.
Ссылки
- ^ Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр. 169–171. ISBN 0-19-852484-6.
- ^ Фицморис, Гарретт М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной лонгитюдный анализ . Хобокен: John Wiley & Sons. стр. 326–328. ISBN 0-471-21487-6.
- ^ Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. doi :10.2307/2529876. JSTOR 2529876. PMID 7168798.
- ^ Гардинер, Джозеф К.; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221–239. doi :10.1002/sim.3478. PMID 19012297.
- ^ Гомес, Дилан GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID 35116198.
- ^ ab Wooldridge, Jeffrey (2010). Эконометрический анализ данных поперечного сечения и панельных данных (2-е изд.). Кембридж, Массачусетс: MIT Press. стр. 252. ISBN 9780262232586. OCLC 627701062.
- ^ Хедекер, Д., Гиббонс, Р. Д. (2006). Анализ продольных данных. Германия: Wiley. Страница 163 https://books.google.com/books?id=f9p9iIgzQSQC&pg=PA163
Внешние ссылки
- Модели с фиксированными и случайными эффектами
- Как провести метаанализ: модели с фиксированным и случайным эффектом