В статистике модель случайных эффектов , также называемая моделью компонентов дисперсии , представляет собой статистическую модель , в которой параметры модели являются случайными величинами . Это своего рода иерархическая линейная модель , которая предполагает, что анализируемые данные взяты из иерархии различных популяций, различия которых связаны с этой иерархией. Модель случайных эффектов является частным случаем смешанной модели .
Сравните это с определениями биостатистики , [1] [2] [3] [4] [5], поскольку специалисты по биостатистике используют «фиксированные» и «случайные» эффекты, соответственно, для обозначения среднепопуляционных и специфичных для субъекта эффектов (и где последние обычно считаются неизвестными, скрытыми переменными ).
Модели случайных эффектов помогают контролировать ненаблюдаемую неоднородность, когда неоднородность постоянна во времени и не коррелирует с независимыми переменными. Эту константу можно удалить из продольных данных путем дифференцирования, поскольку получение первой разницы приведет к удалению любых инвариантных во времени компонентов модели. [6]
В отношении индивидуального специфического эффекта можно сделать два общих предположения: предположение о случайных эффектах и предположение о фиксированных эффектах. Допущение о случайных эффектах заключается в том, что индивидуальная ненаблюдаемая неоднородность не коррелирует с независимыми переменными. Допущение о фиксированном эффекте заключается в том, что индивидуальный специфический эффект коррелирует с независимыми переменными. [6]
Если предположение о случайных эффектах справедливо, оценщик случайных эффектов более эффективен , чем модель с фиксированными эффектами.
Предположим, что m больших начальных школ выбираются случайным образом из тысяч в большой стране. Предположим также, что в каждой выбранной школе случайно выбираются n учеников одного возраста. Подсчитываются их баллы по стандартному тесту на профпригодность. Пусть Y ij — балл j- го ученика i- й школы. Простой способ смоделировать эту переменную:
где μ — средний балл теста для всей популяции. В этой модели U i — это случайный эффект, специфичный для школы : он измеряет разницу между средним баллом в школе i и средним баллом по всей стране. Член W ij представляет собой индивидуально-специфический случайный эффект, т. е. отклонение балла j -го ученика от среднего по i -й школе.
Модель может быть дополнена путем включения дополнительных объясняющих переменных, которые будут отражать различия в баллах между различными группами. Например:
где Sex ij — двоичная фиктивная переменная , а ParentsEduc ij записывает, скажем, средний уровень образования родителей ребенка. Это смешанная модель , а не модель чисто случайных эффектов, поскольку она вводит условия с фиксированными эффектами для полового образования и образования родителей.
Дисперсия Y ij представляет собой сумму дисперсий τ 2 и σ 2 U i и W ij соответственно.
Позволять
быть средним не всех баллов i- й школы, а тех баллов i- й школы, которые включены в случайную выборку . Позволять
быть большим средним .
Позволять
быть соответственно суммой квадратов, обусловленной различиями внутри групп, и суммой квадратов, обусловленной различиями между группами. Тогда можно показать [ нужна цитация ], что
и
Эти « ожидаемые средние квадраты » можно использовать в качестве основы для оценки «компонентов дисперсии» σ 2 и τ 2 .
Параметр σ2 еще называют коэффициентом внутриклассовой корреляции .
Для моделей случайных эффектов важны предельные вероятности . [7]
Модели случайных эффектов, используемые на практике, включают модель договоров страхования Бюльмана и модель Фэя-Эрриота, используемую для оценки малых территорий .