stringtranslate.com

Анализ подтверждающего фактора

В статистике конфирматорный факторный анализ ( CFA ) — это особая форма факторного анализа , наиболее часто используемая в исследованиях в области социальных наук. [1] Он используется для проверки того , соответствуют ли измерения конструкции пониманию исследователем природы этой конструкции (или фактора). Таким образом, цель конфирматорного факторного анализа — проверить, соответствуют ли данные предполагаемой модели измерения. Эта предполагаемая модель основана на теории и/или предыдущих аналитических исследованиях. [2] CFA был впервые разработан Йорескугом (1969) [3] и был построен на старых методах анализа валидности конструкции и заменил их, таких как матрица MTMM , описанная Кэмпбеллом и Фиске (1959). [4]

В конфирмативном факторном анализе исследователь сначала разрабатывает гипотезу о том, какие факторы, по его мнению, лежат в основе используемых мер (например, « Депрессия » является фактором, лежащим в основе опросника депрессии Бека и шкалы оценки депрессии Гамильтона ), и может наложить ограничения на модель на основе этих априорных гипотез. Налагая эти ограничения, исследователь заставляет модель соответствовать своей теории. Например, если предполагается, что есть два фактора, учитывающих ковариацию в мерах, и что эти факторы не связаны друг с другом, исследователь может создать модель, в которой корреляция между фактором A и фактором B ограничена нулем. Затем можно получить меры соответствия модели, чтобы оценить, насколько хорошо предлагаемая модель отражает ковариацию между всеми элементами или мерами в модели. Если ограничения, наложенные исследователем на модель, не соответствуют данным выборки, то результаты статистических тестов соответствия модели укажут на плохое соответствие, и модель будет отклонена. Если соответствие плохое, это может быть связано с тем, что некоторые элементы измеряют несколько факторов. Также может оказаться, что некоторые элементы внутри фактора связаны друг с другом сильнее, чем другие.

Для некоторых приложений требование «нулевых нагрузок» (для индикаторов, не предположительно нагружаемых определенным фактором) было расценено как слишком строгое. Недавно разработанный метод анализа, «исследовательское структурное моделирование уравнений», определяет гипотезы о связи между наблюдаемыми индикаторами и их предполагаемыми первичными скрытыми факторами , позволяя также оценивать нагрузки с другими скрытыми факторами. [5]

Статистическая модель

В конфирматорном факторном анализе исследователи обычно интересуются изучением степени, в которой ответы на вектор p x 1 наблюдаемых случайных величин могут быть использованы для присвоения значения одной или нескольким ненаблюдаемым переменным . Исследование в значительной степени выполняется путем оценки и оценивания нагрузки каждого элемента, используемого для выявления аспектов ненаблюдаемой скрытой переменной. То есть, y[i] — это вектор наблюдаемых ответов, предсказанных ненаблюдаемой скрытой переменной , который определяется как:

,

где — вектор p x 1 наблюдаемых случайных величин, — ненаблюдаемые скрытые переменные, — матрица p x k , где k равно числу скрытых переменных. [6] Поскольку — несовершенные меры , модель также состоит из ошибки, . Оценки в случае максимального правдоподобия (ML), полученные путем итеративной минимизации функции соответствия,

где — матрица дисперсии-ковариации, подразумеваемая предлагаемой моделью факторного анализа, а — наблюдаемая матрица дисперсии-ковариации. [6] То есть, находятся значения для свободных параметров модели, которые минимизируют разницу между матрицей дисперсии-ковариации, подразумеваемой моделью, и наблюдаемой матрицей дисперсии-ковариации.

Альтернативные стратегии оценки

Хотя для оценки моделей CFA использовались многочисленные алгоритмы, метод максимального правдоподобия (ML) остается основной процедурой оценки. [7] При этом модели CFA часто применяются к условиям данных, которые отклоняются от обычных требований теории для допустимой оценки ML. Например, социологи часто оценивают модели CFA с ненормальными данными и индикаторами, масштабированными с использованием дискретных упорядоченных категорий. [8] Соответственно, были разработаны альтернативные алгоритмы, которые учитывают разнообразные условия данных, с которыми сталкиваются прикладные исследователи. Альтернативные оценщики были охарактеризованы в два общих типа: (1) надежный и (2) оценщик с ограниченной информацией. [9]

Когда МО реализуется с данными, которые отклоняются от предположений нормальной теории, модели CFA могут давать смещенные оценки параметров и вводящие в заблуждение выводы. [10] Надежная оценка обычно пытается исправить проблему путем корректировки модели нормальной теории χ 2 и стандартных ошибок. [9] Например, Саторра и Бентлер (1994) рекомендовали использовать оценку МО обычным способом и затем делить модель χ 2 на меру степени многомерного эксцесса. [11] Дополнительным преимуществом надежных оценок МО является их доступность в общем программном обеспечении SEM (например, LAVAAN). [12]

К сожалению, надежные оценщики ML могут стать несостоятельными в условиях обычных данных. В частности, когда индикаторы масштабируются с использованием нескольких категорий ответов (например, не согласен , нейтрален , согласен ), надежные оценщики ML, как правило, работают плохо. [10] Оценщики с ограниченной информацией, такие как взвешенные наименьшие квадраты (WLS), вероятно, являются лучшим выбором, когда явные индикаторы принимают порядковую форму. [13] В целом, оценщики с ограниченной информацией обращаются к порядковым индикаторам, используя полихорические корреляции для подгонки моделей CFA. [14] Полихорические корреляции фиксируют ковариацию между двумя скрытыми переменными, когда наблюдается только их категоризированная форма, что достигается в основном за счет оценки пороговых параметров. [15]

Исследовательский факторный анализ

Оба анализа: разведывательный факторный анализ (EFA) и подтверждающий факторный анализ (CFA) используются для понимания общей дисперсии измеряемых переменных, которая, как полагают, может быть отнесена к фактору или латентной конструкции. Однако, несмотря на это сходство, EFA и CFA являются концептуально и статистически различными анализами.

Целью EFA является выявление факторов на основе данных и максимизация количества объясняемой дисперсии. [16] Исследователю не требуется иметь какие-либо конкретные гипотезы о том, сколько факторов возникнет, и какие элементы или переменные будут включать эти факторы. Если эти гипотезы существуют, они не включаются в статистический анализ и не влияют на его результаты. Напротив, CFA оценивает априорные гипотезы и в значительной степени руководствуется теорией. Анализ CFA требует от исследователя заранее выдвинуть гипотезу о количестве факторов, о том, коррелируют ли эти факторы, и о том, какие элементы/меры нагружают и отражают какие факторы. [17] Таким образом, в отличие от исследовательского факторного анализа , где все нагрузки могут свободно изменяться, CFA допускает явное ограничение определенных нагрузок, равное нулю.

EFA часто считается более подходящим, чем CFA, на ранних стадиях разработки шкалы, поскольку CFA не показывает, насколько хорошо ваши пункты загружаются на негипотетические факторы. [18] Другим сильным аргументом в пользу первоначального использования EFA является то, что неправильная спецификация числа факторов на ранней стадии разработки шкалы, как правило, не будет обнаружена подтверждающим факторным анализом. На более поздних стадиях разработки шкалы подтверждающие методы могут предоставить больше информации за счет явного контраста конкурирующих факторных структур. [18]

EFA иногда сообщается в исследованиях, когда CFA был бы лучшим статистическим подходом. [19] Утверждалось, что CFA может быть ограничительным и неподходящим при использовании в исследовательском режиме. [20] Однако идея о том, что CFA является исключительно «подтверждающим» анализом, иногда может вводить в заблуждение, поскольку индексы модификации, используемые в CFA, носят в некоторой степени исследовательский характер. Индексы модификации показывают улучшение соответствия модели, если конкретный коэффициент становится неограниченным. [21] Аналогично, EFA и CFA не должны быть взаимоисключающими анализами; EFA, как утверждается, является разумным продолжением плохо подходящей модели CFA. [22]

Моделирование структурных уравнений

Программное обеспечение для моделирования структурных уравнений обычно используется для выполнения конфирматорного факторного анализа. LISREL , [23] EQS, [24] AMOS, [25] Mplus [26] и пакет LAVAAN в R [27] являются популярными программами. Существует также пакет Python semopy 2. [28] CFA также часто используется в качестве первого шага для оценки предлагаемой модели измерения в модели структурного уравнения. Многие правила интерпретации, касающиеся оценки соответствия модели и модификации модели в моделировании структурных уравнений, в равной степени применимы к CFA. CFA отличается от моделирования структурных уравнений тем, что в CFA нет направленных стрелок между скрытыми факторами . Другими словами, в то время как в CFA факторы не предполагаются напрямую вызывающими друг друга, SEM часто указывает конкретные факторы и переменные, которые имеют причинную природу. В контексте SEM CFA часто называют «моделью измерения», в то время как отношения между скрытыми переменными (с направленными стрелками) называют «структурной моделью».

Оценка соответствия модели

В CFA используется несколько статистических тестов для определения того, насколько хорошо модель соответствует данным. [16] Обратите внимание, что хорошее соответствие между моделью и данными не означает, что модель «верна» или даже что она объясняет большую часть ковариации. «Хорошее соответствие модели» указывает только на то, что модель правдоподобна. [29] При сообщении результатов подтверждающего факторного анализа настоятельно рекомендуется сообщать: a) предлагаемые модели, b) любые внесенные изменения, c) какие меры идентифицируют каждую скрытую переменную, d) корреляции между скрытыми переменными, e) любую другую соответствующую информацию, например, используются ли ограничения. [30] Что касается выбора статистики соответствия модели для отчета, не следует просто сообщать статистику, которая оценивает наилучшее соответствие, хотя это может быть заманчиво. Хотя существует несколько различных мнений, Клайн (2010) рекомендует сообщать результаты теста хи-квадрат, среднеквадратической ошибки аппроксимации (RMSEA), сравнительного индекса соответствия (CFI) и стандартизированного среднеквадратического остатка (SRMR). [1]

Абсолютные индексы соответствия

Абсолютные индексы соответствия определяют, насколько хорошо априорная модель соответствует или воспроизводит данные. [31] Абсолютные индексы соответствия включают, помимо прочего, тест Хи-квадрат, RMSEA, GFI, AGFI, RMR и SRMR. [32]

Тест хи-квадрат

Тест хи-квадрат показывает разницу между наблюдаемыми и ожидаемыми ковариационными матрицами . Значения, близкие к нулю, указывают на лучшее соответствие; меньшая разница между ожидаемыми и наблюдаемыми ковариационными матрицами. [21] Статистика хи-квадрат также может использоваться для прямого сравнения соответствия вложенных моделей данным. Однако одна из трудностей с тестом хи-квадрат соответствия модели заключается в том, что исследователи могут не отклонить неподходящую модель в выборках малого размера и отклонить подходящую модель в выборках большого размера. [21] В результате были разработаны другие меры соответствия.

Среднеквадратическая ошибка аппроксимации

Среднеквадратическая ошибка аппроксимации (RMSEA) позволяет избежать проблем с размером выборки, анализируя расхождение между предполагаемой моделью с оптимально выбранными оценками параметров и матрицей ковариации популяции. [32] RMSEA варьируется от 0 до 1, причем меньшие значения указывают на лучшее соответствие модели. Значение 0,06 или меньше указывает на приемлемое соответствие модели. [33] [34]

Среднеквадратический остаток и стандартизированный среднеквадратический остаток

Среднеквадратический остаток (RMR) и стандартизированный среднеквадратический остаток (SRMR) представляют собой квадратный корень из расхождения между выборочной ковариационной матрицей и ковариационной матрицей модели. [32] Однако RMR может быть несколько сложным для интерпретации, поскольку его диапазон основан на шкалах индикаторов в модели (это становится сложным, когда у вас есть несколько индикаторов с различными шкалами; например, два вопросника, один по шкале от 0 до 10, другой по шкале от 1 до 3). [1] Стандартизированный среднеквадратический остаток устраняет эту трудность в интерпретации и варьируется от 0 до 1, при этом значение 0,08 или меньше указывает на приемлемую модель. [33]

Индекс согласия и скорректированный индекс согласия

Индекс соответствия (GFI) является мерой соответствия между предполагаемой моделью и наблюдаемой ковариационной матрицей. Скорректированный индекс соответствия (AGFI) корректирует GFI, на который влияет количество индикаторов каждой скрытой переменной. GFI и AGFI находятся в диапазоне от 0 до 1, при этом значение более 0,9 обычно указывает на приемлемое соответствие модели. [35]

Относительные индексы соответствия

Относительные индексы соответствия (также называемые «инкрементными индексами соответствия» [36] и «сравнительными индексами соответствия» [37] ) сравнивают хи-квадрат для предполагаемой модели с хи-квадрат из «нулевой» или «базовой» модели. [31] Эта нулевая модель почти всегда содержит модель, в которой все переменные некоррелированы, и, как следствие, имеет очень большой хи-квадрат (указывающий на плохое соответствие). [32] Относительные индексы соответствия включают нормированный индекс соответствия и сравнительный индекс соответствия.

Нормированный индекс соответствия и ненормированный индекс соответствия

Нормированный индекс соответствия (NFI) анализирует расхождение между значением хи-квадрат гипотетической модели и значением хи-квадрат нулевой модели. [38] Однако NFI имеет тенденцию быть отрицательно смещенным. [37] Ненормированный индекс соответствия (NNFI; также известный как индекс Такера-Льюиса, поскольку он был построен на индексе, сформированном Такером и Льюисом в 1973 году [39] ) решает некоторые проблемы отрицательного смещения, хотя значения NNFI иногда могут выходить за пределы диапазона от 0 до 1. [37] Значения как для NFI, так и для NNFI должны находиться в диапазоне от 0 до 1, с пороговым значением 0,95 или выше, указывающим на хорошее соответствие модели. [40]

Сравнительный индекс соответствия

Сравнительный индекс соответствия (CFI) анализирует соответствие модели, изучая несоответствие между данными и предполагаемой моделью, при этом корректируя проблемы размера выборки, присущие критерию хи-квадрат соответствия модели [21] и нормированному индексу соответствия. [37] Значения CFI находятся в диапазоне от 0 до 1, причем большие значения указывают на лучшее соответствие. Ранее значение CFI 0,90 или больше считалось показателем приемлемого соответствия модели. [40] Однако недавние исследования [ когда? ] показали, что необходимо значение больше 0,90, чтобы гарантировать, что неправильно указанные модели не считаются приемлемыми. [40] Таким образом, значение CFI 0,95 или выше в настоящее время принимается как показатель хорошего соответствия.

Идентификация и недоидентификация

Чтобы оценить параметры модели, модель должна быть правильно идентифицирована. То есть, количество оцененных (неизвестных) параметров ( q ) должно быть меньше или равно количеству уникальных дисперсий и ковариаций среди измеренных переменных; p ( p + 1)/2. Это уравнение известно как «правило t». Если имеется слишком мало информации, на которой можно основывать оценки параметров, то говорят, что модель недоопределена, и параметры модели не могут быть оценены надлежащим образом. [41]

Смотрите также

Ссылки

  1. ^ abc Kline, RB (2010). Принципы и практика моделирования структурных уравнений (3-е изд.). Нью-Йорк, Нью-Йорк: Guilford Press.
  2. ^ Preedy, VR, & Watson, RR (2009) Справочник по бремени болезней и показателям качества жизни . Нью-Йорк: Springer.
  3. ^ Jöreskog, KG (1969). Общий подход к конфирмативному анализу максимального правдоподобия. Psychometrika, 34(2), 183-202.
  4. ^ Кэмпбелл, Д.Т. и Фиск, Д.У. (1959). Конвергентная и дискриминантная валидация с помощью матрицы многочерт-многометодов. Психологический вестник , 56 , 81-105.
  5. ^ Аспарухов, Т. и Мутен, Б. (2009). Исследовательское структурное моделирование уравнений. Structural Equation Modeling , 16, 397-438
  6. ^ ab Yang-Wallentin, Fan; Jöreskog, Karl G.; Luo, Hao (2010-07-13). "Подтверждающий факторный анализ порядковых переменных с неправильно указанными моделями". Structural Equation Modeling . 17 (3): 392–423. doi :10.1080/10705511.2010.489003. ISSN  1070-5511. S2CID  122941470.
  7. ^ Флора, Дэвид Б.; Карран, Патрик Дж. (2004). «Эмпирическая оценка альтернативных методов оценки для конфирматорного факторного анализа с порядковыми данными». Психологические методы . 9 (4): 466–491. doi :10.1037/1082-989x.9.4.466. PMC 3153362. PMID  15598100 . 
  8. ^ Миллсэп, Роджер Э.; Юнь-Тейн, Дженн (2004-07-01). «Оценка факторной инвариантности в упорядоченно-категориальных мерах». Многомерные поведенческие исследования . 39 (3): 479–515. doi : 10.1207/S15327906MBR3903_4 . ISSN  0027-3171.
  9. ^ ab Bandalos, Deborah L. (2014-01-02). "Относительная эффективность категориальных диагонально взвешенных наименьших квадратов и надежная оценка максимального правдоподобия". Structural Equation Modeling . 21 (1): 102–116. doi :10.1080/10705511.2014.859510. ISSN  1070-5511. S2CID  123259681.
  10. ^ ab Li, Cheng-Hsien (2015-07-15). «Конфирматорный факторный анализ с порядковыми данными: сравнение надежного максимального правдоподобия и диагонально взвешенных наименьших квадратов». Методы исследования поведения . 48 (3): 936–949. doi : 10.3758/s13428-015-0619-7 . ISSN  1554-3528. PMID  26174714.
  11. ^ Брайант, Фред Б.; Саторра, Альберт (2012-07-20). «Принципы и практика масштабированного разностного критерия хи-квадрат». Моделирование структурных уравнений . 19 (3): 372–398. doi : 10.1080/10705511.2012.687671. hdl : 10230/46110 . ISSN  1070-5511. S2CID  53601390.
  12. ^ Россель, Ив (2012). "lavaan: Пакет R для моделирования структурных уравнений | Россель | Журнал статистического программного обеспечения". Журнал статистического программного обеспечения . 48 (2). doi : 10.18637/jss.v048.i02 .
  13. ^ Rhemtulla, Mijke; Brosseau-Liard, Patricia É.; Savalei, Victoria (2012). «Когда категориальные переменные можно рассматривать как непрерывные? Сравнение надежных непрерывных и категориальных методов оценки SEM в неоптимальных условиях». Psychological Methods . 17 (3): 354–373. doi :10.1037/a0029315. PMID  22799625.
  14. ^ Ян-Валлентин, Фань; Йорескуг, Карл Г.; Луо, Хао (2010-07-13). «Подтверждающий факторный анализ порядковых переменных с неправильно указанными моделями». Моделирование структурных уравнений . 17 (3): 392–423. doi :10.1080/10705511.2010.489003. ISSN  1070-5511. S2CID  122941470.
  15. ^ Олссон, Ульф (1979). «Оценка максимального правдоподобия коэффициента полихорической корреляции». Психометрика . 44 (4): 443–460. doi :10.1007/BF02296207. ISSN  0033-3123. S2CID  119716465.
  16. ^ ab Suhr, DD (2006). "Исследовательский или подтверждающий факторный анализ?" (PDF) . Статистика и анализ данных . 31 . Получено 20 апреля 2012 г. .
  17. ^ Томпсон, Б. (2004). Исследовательский и подтверждающий факторный анализ: понимание концепций и приложений. Вашингтон, округ Колумбия, США: Американская психологическая ассоциация.
  18. ^ ab Kelloway, EK (1995). «Моделирование структурных уравнений в перспективе». Журнал организационного поведения . 16 (3): 215–224. doi :10.1002/job.4030160304.
  19. ^ Левин, ТР (2005). «Конфирматорный факторный анализ и валидация шкалы в коммуникационных исследованиях». Communication Research Reports . 22 (4): 335–338. doi :10.1080/00036810500317730. S2CID  145125871.
  20. ^ Браун, М. В. (2001). «Обзор аналитического вращения в исследовательском факторном анализе». Многомерные поведенческие исследования . 36 (1): 111–150. doi :10.1207/S15327906MBR3601_05. S2CID  9598774.
  21. ^ abcd Gatignon, H. (2010). «Конфирматорный факторный анализ». Статистический анализ управленческих данных . Springer. стр. 59–122. doi :10.1007/978-1-4419-1270-1_4. ISBN 978-1-4419-1269-5.
  22. ^ Шмитт, ТА (2011). «Текущие методологические соображения в исследовательском и подтверждающем факторном анализе». Журнал психообразовательной оценки . 29 (4): 304–321. doi :10.1177/0734282911406653. S2CID  4490758.
  23. ^ CFA с LISREL Архивировано 28.05.2009 на Wayback Machine
  24. ^ Бирн, Б. М. (2006). Моделирование структурных уравнений с помощью EQS: основные концепции, применение и программирование. Нью-Джерси: Lawrence Elbaum Associates.
  25. ^ CFA с использованием AMOS
  26. ^ Домашняя страница Mplus
  27. ^ «Проект Лаваан».
  28. ^ Мещеряков, Георгий; Иголкина Анна Александровна; Самсонова, Мария Георгиевна (09.06.2021). «semopy 2: пакет моделирования структурными уравнениями со случайными эффектами в Python». arXiv : 2106.01140 [stat.AP].
  29. ^ Шермелле-Энгель, К., Моосбруггер, Х. и Мюллер, Х. (2003). Оценка соответствия моделей структурных уравнений: тесты значимости и описательные меры соответствия, Методы психологических исследований онлайн , 8 (2), 23-74
  30. ^ Джексон, Д. Л., Гилласпи, Дж. А. и Перк-Стефенсон, Р. (2009). Практики отчетности в конфирматорном факторном анализе: обзор и некоторые рекомендации. Психологические методы , 14 (1), 6-23.
  31. ^ ab McDonald, RP, & Ho, MHR (2002). Принципы и практика представления статистических анализов уравнений. Психологические методы , 7 (1), 64-82
  32. ^ abcd Хупер, Д., Кофлан, Дж. и Маллен, М. Р. (2008). Моделирование структурных уравнений: Руководство по определению соответствия модели. Журнал методов бизнес-исследований , 6 , 53–60
  33. ^ ab Ху, Ли-цзе; Бентлер, Питер М. (1999). «Критерии отсечения для индексов соответствия в анализе ковариационной структуры: обычные критерии против новых альтернатив». Моделирование структурных уравнений . 6 (1): 1–55. doi : 10.1080/10705519909540118. hdl : 2027.42/139911 . ISSN  1070-5511.
  34. ^ Браун, Тимоти (2015). Подтверждающий факторный анализ для прикладных исследований . Нью-Йорк Лондон: The Guilford Press. стр. 72. ISBN 978-1-4625-1779-4.
  35. ^ Баумгартнер, Х. и Хомбур, К. (1996). Применение моделирования структурных уравнений в маркетинге и исследовании потребителей: обзор. Международный журнал исследований в области маркетинга , 13 , 139-161.
  36. ^ Танака, Дж. С. (1993). «Многогранные концепции соответствия в моделях структурных уравнений». В Боллен, КА; Лонг, Дж. С. (ред.). Тестирование моделей структурных уравнений . Ньюбери Парк, Калифорния: Sage. стр. 136–162. ISBN 0-8039-4506-X.
  37. ^ abcd Бентлер, П. М. (1990). «Сравнительные индексы соответствия в структурных моделях». Психологический вестник . 107 (2): 238–46. doi :10.1037/0033-2909.107.2.238. PMID  2320703.
  38. ^ Бентлер, П. М.; Бонетт, Д. Г. (1980). «Тесты значимости и качество соответствия в анализе ковариационных структур». Психологический вестник . 88 (3): 588–606. doi :10.1037/0033-2909.88.3.588.
  39. ^ Такер, Л. Р.; Льюис, К. (1973). «Коэффициент надежности для анализа максимального правдоподобия». Психометрика . 38 : 1–10. doi :10.1007/BF02291170. S2CID  50680436.
  40. ^ abc Ху, Л.; Бентлер, П. М. (1999). «Критерии отсечения для индексов соответствия в анализе ковариационной структуры: традиционные критерии против новых альтернатив». Моделирование структурных уравнений . 6 (1): 1–55. doi :10.1080/10705519909540118.
  41. ^ Бабяк, MA; Грин, SB (2010). «Конфирматорный факторный анализ: введение для исследователей психосоматической медицины». Психосоматическая медицина . 72 (6): 587–597. doi : 10.1097/PSY.0b013e3181de3f8a . PMID  20467001. S2CID  23528566.

Дальнейшее чтение

Внешние ссылки