stringtranslate.com

Модель случайных эффектов

В статистике модель случайных эффектов , также называемая моделью компонентов дисперсии , представляет собой статистическую модель , где параметры модели являются случайными величинами . Это разновидность иерархической линейной модели , которая предполагает, что анализируемые данные берутся из иерархии различных популяций, различия которых связаны с этой иерархией. Модель случайных эффектов является частным случаем смешанной модели .

Сравните это с определениями биостатистики , [1] [2] [3] [4] [5], поскольку биостатистики используют «фиксированные» и «случайные» эффекты для обозначения соответственно средних по популяции и специфических для субъекта эффектов (и где последние, как правило, предполагаются неизвестными, скрытыми переменными ).

Качественное описание

Модели случайных эффектов помогают контролировать ненаблюдаемую гетерогенность , когда гетерогенность постоянна во времени и не коррелирует с независимыми переменными. Эта константа может быть удалена из продольных данных посредством дифференциации, поскольку взятие первой разности удалит любые инвариантные во времени компоненты модели. [6]

Можно сделать два общих предположения относительно индивидуального специфического эффекта: предположение о случайных эффектах и ​​предположение о фиксированных эффектах. Предположение о случайных эффектах заключается в том, что индивидуальная ненаблюдаемая гетерогенность не коррелирует с независимыми переменными. Предположение о фиксированных эффектах заключается в том, что индивидуальный специфический эффект коррелирует с независимыми переменными. [6]

Если предположение о случайных эффектах верно, то оценка случайных эффектов более эффективна, чем модель с фиксированными эффектами.

Простой пример

Предположим, что крупные начальные школы выбираются случайным образом из тысяч в большой стране. Предположим также, что ученики одного возраста выбираются случайным образом в каждой выбранной школе. Их баллы по стандартному тесту на способности устанавливаются. Пусть будет баллом -го ученика в -й школе.

Простой способ моделирования этой переменной:

где - средний балл теста для всего населения.

В этой модели есть школьно-специфический случайный эффект : он измеряет разницу между средним баллом в школе и средним баллом по всей стране. Термином является индивидуально-специфический случайный эффект, т. е. это отклонение балла -го ученика от среднего балла для -й школы.

Модель может быть расширена путем включения дополнительных объясняющих переменных, которые будут фиксировать различия в результатах среди разных групп. Например:

где — это бинарная фиктивная переменная , которая записывает, скажем, средний уровень образования родителей ребенка. Это смешанная модель , а не модель чисто случайных эффектов, поскольку она вводит члены с фиксированными эффектами для пола и образования родителей.

Компоненты дисперсии

Дисперсия равна сумме дисперсий и и соответственно .

Позволять

будет средним значением не всех оценок в -й школе, а тех оценок в -й школе, которые включены в случайную выборку . Пусть

быть средним показателем .

Позволять

быть соответственно суммой квадратов из-за различий внутри групп и суммой квадратов из-за различий между группами. Тогда можно показать [ нужна цитата ], что

и

Эти « ожидаемые средние квадраты » можно использовать в качестве основы для оценки «компонентов дисперсии» и .

Параметр также называется коэффициентом внутриклассовой корреляции .

Предельная вероятность

Для моделей случайных эффектов важны предельные вероятности . [7]

Приложения

Модели случайных эффектов, используемые на практике, включают модель Бюльмана для страховых контрактов и модель Фэя-Херриота, используемую для оценки малых территорий .

Смотрите также

Дальнейшее чтение

Ссылки

  1. ^ Диггл, Питер Дж.; Хигерти, Патрик; Лян, Кунг-Йи; Зегер, Скотт Л. (2002). Анализ продольных данных (2-е изд.). Издательство Оксфордского университета. стр. 169–171. ISBN 0-19-852484-6.
  2. ^ Фицморис, Гарретт М.; Лэрд, Нэн М.; Уэр, Джеймс Х. (2004). Прикладной лонгитюдный анализ . Хобокен: John Wiley & Sons. стр. 326–328. ISBN 0-471-21487-6.
  3. ^ Лэрд, Нэн М.; Уэр, Джеймс Х. (1982). «Модели случайных эффектов для продольных данных». Биометрия . 38 (4): 963–974. doi :10.2307/2529876. JSTOR  2529876. PMID  7168798.
  4. ^ Гардинер, Джозеф К.; Ло, Чжэхуэй; Роман, Ли Энн (2009). «Фиксированные эффекты, случайные эффекты и GEE: в чем различия?». Статистика в медицине . 28 (2): 221–239. doi :10.1002/sim.3478. PMID  19012297.
  5. ^ Гомес, Дилан GE (20 января 2022 г.). «Следует ли использовать фиксированные или случайные эффекты, если у меня меньше пяти уровней фактора группировки в модели со смешанными эффектами?». PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID  35116198. 
  6. ^ ab Wooldridge, Jeffrey (2010). Эконометрический анализ данных поперечного сечения и панельных данных (2-е изд.). Кембридж, Массачусетс: MIT Press. стр. 252. ISBN 9780262232586. OCLC  627701062.
  7. ^ Хедекер, Д., Гиббонс, Р. Д. (2006). Анализ продольных данных. Германия: Wiley. Страница 163 https://books.google.com/books?id=f9p9iIgzQSQC&pg=PA163

Внешние ссылки