Многоуровневая модель

Многоуровневые модели (также известные как иерархические линейные модели , линейные модели со смешанными эффектами , смешанные модели , модели вложенных данных , модели со случайными коэффициентами , модели со случайными эффектами , модели со случайными параметрами или схемы с разделенными графиками ) представляют собой статистические модели параметров , которые изменяются в большей степени. чем один уровень. ^[1] Примером может быть модель успеваемости учащихся, которая содержит показатели для отдельных учащихся, а также показатели для классов, в которых учащиеся сгруппированы. Эти модели можно рассматривать как обобщения линейных моделей (в частности, линейной регрессии ), хотя они также могут распространяться и на нелинейные модели. Эти модели стали гораздо более популярными после того, как стала доступна достаточная вычислительная мощность и программное обеспечение. ^[1]

Многоуровневые модели особенно подходят для исследований, в которых данные участников организованы на более чем одном уровне (т. е. вложенные данные ). ^[2] Единицами анализа обычно являются отдельные лица (на более низком уровне), которые вложены в контекстуальные/агрегированные единицы (на более высоком уровне). ^[3] Хотя самым низким уровнем данных в многоуровневых моделях обычно являются отдельные индивидуумы, можно также изучить повторные измерения отдельных лиц. ^[2]^[4] Таким образом, многоуровневые модели представляют собой альтернативный тип анализа для одномерного или многомерного анализа повторяющихся измерений . Можно изучить индивидуальные различия в кривых роста . ^[2] Кроме того, в качестве альтернативы ANCOVA можно использовать многоуровневые модели , в которых оценки зависимой переменной корректируются с учетом ковариат (например, индивидуальных различий) перед проверкой различий в лечении. ^[5] Многоуровневые модели способны анализировать эти эксперименты без предположений об однородности наклонов регрессии, которые требуются для ANCOVA. ^[2]

Многоуровневые модели можно использовать для данных многих уровней, хотя наиболее распространены двухуровневые модели, и оставшаяся часть этой статьи посвящена только им. Зависимая переменная должна быть исследована на самом низком уровне анализа. ^[1]

Уравнение регрессии уровня 1

Если имеется одна независимая переменная уровня 1, модель уровня 1 имеет вид

$Y_{ij}=\beta _{0j}+\beta _{1j}X_{ij}+e_{ij}$ .

$Y_{ij}$ относится к баллу зависимой переменной для отдельного наблюдения на уровне 1 (индекс i относится к отдельному случаю, индекс j относится к группе).
$X_{ij}$ относится к предиктору уровня 1.
$\beta _{0j}$ относится к пересечению зависимой переменной для отдельного случая i.
$\beta _{1j}$ относится к наклону связи в группе j (уровень 2) между предиктором уровня 1 и зависимой переменной.
$e_{ij}$ относится к случайным ошибкам прогнозирования для уравнения уровня 1 (его также иногда называют ). $r_{ij}$

$e_{ij}\sim {\mathcal {N}}(0,\sigma _{1}^{2})$

На уровне 1 точки пересечения и наклоны в группах могут быть либо фиксированными (это означает, что все группы имеют одинаковые значения, хотя в реальном мире это будет редким явлением), либо неслучайно меняться (это означает, что точки пересечения и/или или наклоны предсказуемы по независимой переменной на уровне 2) или изменяются случайным образом (это означает, что точки пересечения и/или наклоны различны в разных группах и что каждая из них имеет свое общее среднее значение и дисперсию). ^[2]^[4]

При наличии нескольких независимых переменных уровня 1 модель можно расширить, подставив в уравнение векторы и матрицы.

Когда связь между ответом и предиктором не может быть описана линейной зависимостью, можно найти некоторую нелинейную функциональную связь между ответом и предиктором и расширить модель до нелинейной модели смешанных эффектов . Например, когда ответом является совокупная траектория заражения -й страны и представляет -ый момент времени, то упорядоченная пара для каждой страны может иметь форму, аналогичную логистической функции . ^[6]^[7] $Y_{ij}$ $X_{ij}$ $Y_{ij}$ $i$ $X_{ij}$ $j$ $(X_{ij},Y_{ij})$

Уравнение регрессии уровня 2

Зависимые переменные представляют собой точки пересечения и наклоны независимых переменных на уровне 1 в группах уровня 2.

$u_{0j}\sim {\mathcal {N}}(0,\sigma _{2}^{2})$

$u_{1j}\sim {\mathcal {N}}(0,\sigma _{3}^{2})$

$\beta _{0j}=\gamma _{00}+\gamma _{01}w_{j}+u_{0j}$

$\beta _{1j}=\gamma _{10}+\gamma _{11}w_{j}+u_{1j}$

$\gamma _{00}$ относится к общему перехвату. Это среднее значение оценок зависимой переменной во всех группах, когда все предикторы равны 0.
$\gamma _{10}$ относится к среднему наклону между зависимой переменной и предиктором уровня 1.
$w_{j}$ относится к предиктору уровня 2.
$\gamma _{01}$ и обратитесь к влиянию предиктора уровня 2 на точку пересечения и наклон уровня 1 соответственно. $\gamma _{11}$
$u_{0j}$ относится к отклонению в группе j от общего пересечения.
$u_{1j}$ относится к отклонению в группе j от среднего наклона между зависимой переменной и предиктором уровня 1.

Типы моделей

Прежде чем проводить многоуровневый анализ модели, исследователь должен решить несколько аспектов, в том числе какие предикторы следует включить в анализ, если таковые имеются. Во-вторых, исследователь должен решить, будут ли значения параметров (т. е. элементов, которые будут оцениваться) фиксированными или случайными. ^[2]^[5]^[4] Фиксированные параметры состоят из констант во всех группах, тогда как случайный параметр имеет разное значение для каждой из групп. ^[4] Кроме того, исследователь должен решить, использовать ли оценку максимального правдоподобия или ограниченный тип оценки максимального правдоподобия. ^[2]

Модель случайных перехватов

Модель случайных пересечений — это модель, в которой пересечениям разрешено варьироваться, и, следовательно, оценки зависимой переменной для каждого отдельного наблюдения прогнозируются с помощью пересечения, которое варьируется в зависимости от группы. ^[5]^[8]^[4] Эта модель предполагает, что наклоны фиксированы (одинаковы в разных контекстах). Кроме того, эта модель предоставляет информацию о внутриклассовых корреляциях , которая помогает определить, нужны ли многоуровневые модели в первую очередь. ^[2]

Модель случайных уклонов

Модель случайных наклонов — это модель, в которой наклоны могут изменяться в соответствии с матрицей корреляции, и, следовательно, наклоны различаются в зависимости от группирующей переменной, такой как время или отдельные лица. Эта модель предполагает, что перехваты фиксированы (одинаковы в разных контекстах). ^[5]

Модель случайных пересечений и наклонов

Модель, включающая как случайные точки пересечения, так и случайные наклоны, вероятно, является наиболее реалистичным типом модели, хотя она также и самая сложная. В этой модели как точки пересечения, так и наклоны могут различаться в разных группах, а это означает, что они различны в разных контекстах. ^[5]

Разработка многоуровневой модели

Чтобы провести многоуровневый анализ модели, следует начать с фиксированных коэффициентов (наклонов и точек пересечения). Одному аспекту будет разрешено изменяться одновременно (то есть будет меняться) и сравниваться с предыдущей моделью, чтобы оценить лучшее соответствие модели. ^[1] При оценке модели исследователь может задать три разных вопроса. Во-первых, хорошая ли это модель? Во-вторых, является ли более сложная модель лучше? В-третьих, какой вклад в модель вносят отдельные предикторы?

Для оценки моделей будут рассмотрены различные статистические данные о соответствии моделей. ^{[2] Одной из таких статистических данных является}тест отношения правдоподобия хи-квадрат , который оценивает разницу между моделями. Тест отношения правдоподобия можно использовать для построения модели в целом, для изучения того, что происходит, когда эффектам в модели разрешено изменяться, а также при тестировании категориальной переменной с фиктивным кодом как отдельного эффекта. ^[2] Однако тест можно использовать только в том случае, если модели являются вложенными (это означает, что более сложная модель включает в себя все эффекты более простой модели). При тестировании невложенных моделей сравнение между моделями можно проводить, используя , среди прочего, информационный критерий Акаике (AIC) или байесовский информационный критерий (BIC). ^[1]^[2]^[5] См. далее Выбор модели .

Предположения

Многоуровневые модели имеют те же допущения, что и другие основные общие линейные модели (например, ANOVA , регрессия ), но некоторые из допущений модифицированы с учетом иерархической природы плана (т. е. вложенных данных).

Линейность

Допущение линейности утверждает, что между переменными существует прямолинейная (прямолинейная, в отличие от нелинейной или U-образной) связь. ^[9] Однако модель можно распространить на нелинейные отношения. ^[10] В частности, когда средняя часть уравнения регрессии уровня 1 заменяется нелинейной параметрической функцией, такая модель широко называется нелинейной моделью смешанных эффектов . ^[7]

Нормальность

Допущение нормальности утверждает, что члены ошибок на каждом уровне модели распределены нормально. ^[9]^{[ оспаривается – обсуждается ]} Однако большинство статистических программ позволяют указывать различные распределения для условий дисперсии, такие как пуассоновское, биномиальное, логистическое. Подход многоуровневого моделирования можно использовать для всех форм обобщенных линейных моделей.

гомоскедастичность

Предположение гомоскедастичности , также известное как однородность дисперсии, предполагает равенство дисперсий генеральной совокупности. ^[9] Однако для учета этого можно указать другую дисперсионно-корреляционную матрицу, а также можно смоделировать неоднородность дисперсии.

Независимость наблюдений (отсутствие автокорреляции остатков модели)

Независимость — это допущение общих линейных моделей, которое утверждает, что случаи представляют собой случайные выборки из совокупности и что оценки зависимой переменной не зависят друг от друга. ^[9] Одной из основных целей многоуровневых моделей является рассмотрение случаев, когда нарушается предположение о независимости; Однако многоуровневые модели предполагают, что 1) остатки уровня 1 и уровня 2 некоррелированы и 2) ошибки (измеряемые остатками) на самом высоком уровне некоррелированы. ^[11]

Ортогональность регрессоров случайным эффектам

Регрессоры не должны коррелировать со случайными эффектами . Это предположение поддается проверке, но часто игнорируется, что делает оценщик несогласованным. ^[12] Если это предположение нарушается, случайный эффект должен быть смоделирован явно в фиксированной части модели, либо с использованием фиктивных переменных, либо путем включения кластерных средних всех регрессоров. ^[12]^[13]^[14]^[15] Это предположение, вероятно, является самым важным предположением, которое делает оценщик, но оно неправильно понимается большинством исследователей-прикладников, использующих эти типы моделей. ^[12] $u_{0j}$ $X_{ij}$

Статистические тесты

Тип статистических тестов, используемых в многоуровневых моделях, зависит от того, исследуются ли фиксированные эффекты или компоненты дисперсии. При исследовании фиксированных эффектов тесты сравниваются со стандартной ошибкой фиксированного эффекта, в результате чего получается Z-тест . ^[5] Также можно вычислить t-критерий . При вычислении t-теста важно помнить о степенях свободы, которые будут зависеть от уровня предиктора (например, предиктора уровня 1 или предиктора уровня 2). ^[5] Для предиктора уровня 1 степени свободы основаны на количестве предикторов уровня 1, количестве групп и количестве отдельных наблюдений. Для предиктора уровня 2 степени свободы основаны на количестве предикторов уровня 2 и количестве групп. ^[5]

Статистическая мощность

Статистическая мощность многоуровневых моделей различается в зависимости от того, исследуются ли эффекты уровня 1 или уровня 2. Мощность эффектов уровня 1 зависит от количества отдельных наблюдений, тогда как мощность эффектов уровня 2 зависит от количества групп. ^[16] Для проведения исследований с достаточной мощностью в многоуровневых моделях необходимы большие размеры выборки. Однако количество отдельных наблюдений в группах не так важно, как количество групп в исследовании. Чтобы обнаружить межуровневые взаимодействия, учитывая, что размеры групп не слишком малы, были даны рекомендации о том, что необходимо как минимум 20 групп, ^[16] хотя можно использовать гораздо меньше групп, если вас интересуют только выводы по фиксированным эффекты и случайные эффекты являются контрольными или «неприятными» переменными. ^[4] Вопрос о статистической мощности в многоуровневых моделях осложняется тем, что мощность варьируется в зависимости от величины эффекта и внутриклассовых корреляций, она различна для фиксированных эффектов и случайных эффектов, а также меняется в зависимости от количества групп и количества индивидуальных наблюдений на группу. ^[16]

Приложения

Уровень

Концепция уровня является краеугольным камнем этого подхода. В примере образовательного исследования уровни двухуровневой модели могут быть такими:

ученик
сорт

Однако если кто-то изучает несколько школ и несколько школьных округов, четырехуровневая модель может включать

ученик
сорт
школа
округ

Исследователь должен установить для каждой переменной уровень, на котором она была измерена. В этом примере «балл по тесту» может измеряться на уровне ученика, «опыт учителя» на уровне класса, «финансирование школы» на уровне школы и «город» на уровне округа.

Пример

В качестве простого примера рассмотрим базовую модель линейной регрессии, которая прогнозирует доход в зависимости от возраста, класса, пола и расы. Тогда можно заметить, что уровни доходов также различаются в зависимости от города и штата проживания. Простой способ включить это в регрессионную модель — добавить дополнительную независимую категориальную переменную для учета местоположения (т. е. набора дополнительных бинарных предикторов и связанных с ними коэффициентов регрессии, по одному на каждое местоположение). Это привело бы к сдвигу среднего дохода вверх или вниз, но при этом все равно предполагалось бы, например, что влияние расы и пола на доход везде одинаково. В действительности это вряд ли так: разные местные законы, разная пенсионная политика, различия в уровне расовых предрассудков и т. д., скорее всего, приведут к тому, что все предикторы будут иметь разные виды эффектов в разных регионах.

Другими словами, простая модель линейной регрессии может, например, предсказать, что у данного случайно выбранного человека в Сиэтле средний годовой доход на 10 000 долларов выше, чем у аналогичного человека в Мобиле, штат Алабама . Однако это также предсказывает, например, что белый человек может иметь средний доход на 7000 долларов выше, чем у чернокожего, а 65-летний человек может иметь доход на 3000 долларов ниже, чем 45-летний, в обоих случаях, независимо от расположение. Однако многоуровневая модель позволит использовать разные коэффициенты регрессии для каждого предиктора в каждом месте. По сути, это предполагает, что люди в данном месте имеют коррелированные доходы, генерируемые одним набором коэффициентов регрессии, тогда как люди в другом месте имеют доходы, генерируемые другим набором коэффициентов. При этом предполагается, что сами коэффициенты коррелированы и генерируются из одного набора гиперпараметров . Возможны дополнительные уровни: например, люди могут быть сгруппированы по городам, коэффициенты регрессии на уровне города сгруппированы по штатам, а коэффициенты уровня штата сгенерированы на основе одного гипергиперпараметра.

Многоуровневые модели — это подкласс иерархических байесовских моделей , которые представляют собой общие модели с несколькими уровнями случайных величин и произвольными отношениями между различными переменными. Многоуровневый анализ был расширен и теперь включает в себя многоуровневое моделирование структурными уравнениями , многоуровневое моделирование скрытых классов и другие более общие модели.

Использование

Многоуровневые модели использовались в исследованиях в области образования или географических исследованиях, чтобы отдельно оценить разницу между учениками в одной школе и разницу между школами. В психологических приложениях множественными уровнями являются элементы инструмента, отдельные лица и семьи. В социологических приложениях многоуровневые модели используются для изучения людей, принадлежащих к регионам или странам. В исследованиях в области организационной психологии данные отдельных лиц часто должны быть вложены в команды или другие функциональные подразделения. Они часто используются в экологических исследованиях, а также под более общим термином « смешанные модели» . ^[4]

Различные копеременные могут иметь значение на разных уровнях. Их можно использовать для продольных исследований, как и в исследованиях роста, для разделения изменений внутри одного человека и различий между людьми.

Межуровневое взаимодействие также может представлять существенный интерес; например, когда наклон может изменяться случайным образом, предиктор уровня 2 может быть включен в формулу наклона для ковариаты уровня 1. Например, можно оценить взаимодействие расы и соседства, чтобы получить оценку взаимодействия между характеристиками человека и социальным контекстом.

Приложения к продольным (повторным измерениям) данным

Альтернативные способы анализа иерархических данных

Существует несколько альтернативных способов анализа иерархических данных, хотя у большинства из них есть некоторые проблемы. Во-первых, можно использовать традиционные статистические методы. Можно дезагрегировать переменные более высокого порядка на индивидуальный уровень и, таким образом, провести анализ на этом индивидуальном уровне (например, присвоить переменные класса индивидуальному уровню). Проблема с этим подходом заключается в том, что он нарушает предположение о независимости и, таким образом, может исказить наши результаты. Это известно как атомистическая ошибка. ^[17] Другой способ анализа данных с использованием традиционных статистических подходов — агрегировать переменные индивидуального уровня в переменные более высокого порядка, а затем проводить анализ на этом более высоком уровне. Проблема этого подхода заключается в том, что он отбрасывает всю внутригрупповую информацию (поскольку он берет среднее значение переменных индивидуального уровня). До 80–90% дисперсии может быть потрачено впустую, а взаимосвязь между агрегированными переменными будет завышена и, таким образом, искажена. ^[18] Это известно как экологическая ошибка , и статистически такой тип анализа приводит не только к потере информации, но и к снижению мощности. ^[2]

Другой способ анализа иерархических данных — использование модели случайных коэффициентов. Эта модель предполагает, что каждая группа имеет свою модель регрессии — со своей точкой пересечения и наклоном. ^[5] Поскольку выборка осуществляется по группам, модель предполагает, что точки пересечения и наклоны также выбираются случайным образом из совокупности групповых точек пересечения и наклонов. Это позволяет провести анализ, в котором можно предположить, что наклоны фиксированы, но точки пересечения могут изменяться. ^[5] Однако это представляет собой проблему, поскольку отдельные компоненты независимы, а групповые компоненты независимы между группами, но зависимы внутри групп. Это также позволяет провести анализ, в котором наклоны являются случайными; однако корреляции ошибок (возмущений) зависят от значений переменных индивидуального уровня. ^[5] Таким образом, проблема с использованием модели случайных коэффициентов для анализа иерархических данных заключается в том, что по-прежнему невозможно включить переменные более высокого порядка.

Условия ошибки

Многоуровневые модели имеют два члена ошибки, которые также известны как возмущения. Все отдельные компоненты независимы, но существуют также групповые компоненты, которые независимы между группами, но коррелируют внутри групп. Однако компоненты дисперсии могут различаться, поскольку некоторые группы более однородны, чем другие. ^[18]

Байесовская нелинейная модель смешанных эффектов

Многоуровневое моделирование часто используется в различных приложениях и может быть сформулировано с помощью байесовской модели. В частности, в последнее время значительное внимание получили байесовские нелинейные модели смешанных эффектов. Базовая версия байесовской нелинейной модели смешанных эффектов представлена в виде следующей трехэтапной схемы:

Этап 1: Модель индивидуального уровня

${\begin{aligned}&{y}_{ij}=f(t_{ij};\theta _{1i},\theta _{2i},\ldots ,\theta _{li},\ldots ,\theta _{Ki})+\epsilon _{ij},\\{\phantom {spacer}}\\&\epsilon _{ij}\sim N(0,\sigma ^{2}),\\{\phantom {spacer}}\\&i=1,\ldots ,N,\,j=1,\ldots ,M_{i}.\end{aligned}}$

Этап 2: Модель населения

${\begin{aligned}&\theta _{li}=\alpha _{l}+\sum _{b=1}^{P}\beta _{lb}x_{ib}+\eta _{li},\\{\phantom {spacer}}\\&\eta _{li}\sim N(0,\omega _{l}^{2}),\\{\phantom {spacer}}\\&i=1,\ldots ,N,\,l=1,\ldots ,K.\end{aligned}}$

Этап 3: Приор

${\begin{aligned}&\sigma ^{2}\sim \pi (\sigma ^{2}),\\{\phantom {spacer}}\\&\alpha _{l}\sim \pi (\alpha _{l}),\\{\phantom {spacer}}\\&(\beta _{l1},\ldots ,\beta _{lb},\ldots ,\beta _{lP})\sim \pi (\beta _{l1},\ldots ,\beta _{lb},\ldots ,\beta _{lP}),\\{\phantom {spacer}}\\&\omega _{l}^{2}\sim \pi (\omega _{l}^{2}),\\{\phantom {spacer}}\\&l=1,\ldots ,K.\end{aligned}}$

Здесь обозначает непрерывную реакцию -го субъекта в момент времени и является -й ковариатой -го субъекта. Параметры, участвующие в модели, написаны греческими буквами. — известная функция, параметризованная -мерным вектором . Обычно это «нелинейная» функция, описывающая временную траекторию движения индивидуумов. В модели и описывают внутрииндивидуальную изменчивость и межиндивидуальную изменчивость соответственно. Если этап 3: Приоритет не рассматривается, то модель сводится к частотной нелинейной модели со смешанным эффектом. $y_{ij}$ $i$ $t_{ij}$ $x_{ib}$ $b$ $i$ $f(t;\theta _{1},\ldots ,\theta _{K})$ $K$ $(\theta _{1},\ldots ,\theta _{K})$ $f$ $\epsilon _{ij}$ $\eta _{li}$

Центральной задачей при применении байесовских нелинейных моделей смешанного эффекта является оценка апостериорной плотности:

$\pi (\{\theta _{li}\}_{i=1,l=1}^{N,K},\sigma ^{2},\{\alpha _{l}\}_{l=1}^{K},\{\beta _{lb}\}_{l=1,b=1}^{K,P},\{\omega _{l}\}_{l=1}^{K}|\{y_{ij}\}_{i=1,j=1}^{N,M_{i}})$

$\propto \pi (\{y_{ij}\}_{i=1,j=1}^{N,M_{i}},\{\theta _{li}\}_{i=1,l=1}^{N,K},\sigma ^{2},\{\alpha _{l}\}_{l=1}^{K},\{\beta _{lb}\}_{l=1,b=1}^{K,P},\{\omega _{l}\}_{l=1}^{K})$

${\begin{aligned}=&~\left.{\pi (\{y_{ij}\}_{i=1,j=1}^{N,M_{i}}|\{\theta _{li}\}_{i=1,l=1}^{N,K},\sigma ^{2})}\right\}{\text{Stage 1: Individual-Level Model}}\\{\phantom {spacer}}\\\times &~\left.{\pi (\{\theta _{li}\}_{i=1,l=1}^{N,K}|\{\alpha _{l}\}_{l=1}^{K},\{\beta _{lb}\}_{l=1,b=1}^{K,P},\{\omega _{l}\}_{l=1}^{K})}\right\}{\text{Stage 2: Population Model}}\\{\phantom {spacer}}\\\times &~\left.{p(\sigma ^{2},\{\alpha _{l}\}_{l=1}^{K},\{\beta _{lb}\}_{l=1,b=1}^{K,P},\{\omega _{l}\}_{l=1}^{K})}\right\}{\text{Stage 3: Prior}}\end{aligned}}$

На панели справа показан байесовский исследовательский цикл с использованием байесовской нелинейной модели смешанных эффектов. ^[19] Цикл исследования с использованием байесовской нелинейной модели смешанных эффектов состоит из двух этапов: (а) стандартный исследовательский цикл и (б) рабочий процесс, специфичный для Байеса. Стандартный цикл исследования включает обзор литературы, определение проблемы, определение вопроса и гипотезы исследования. Рабочий процесс, специфичный для Байеса, состоит из трех подэтапов: (b)–(i) формализация предшествующих распределений на основе базовых знаний и предварительного выявления; (b)–(ii) определение функции правдоподобия на основе нелинейной функции ; и (b)–(iii) сделать апостериорный вывод. Полученный апостериорный вывод можно использовать для начала нового исследовательского цикла. $f$

Смотрите также

External links

Centre for Multilevel Modelling