В статистике подтверждающий факторный анализ ( CFA ) представляет собой особую форму факторного анализа , наиболее часто используемую в исследованиях в области социальных наук. [1] Он используется для проверки того, соответствуют ли показатели конструкции пониманию исследователем природы этой конструкции (или фактора). Таким образом, цель подтверждающего факторного анализа состоит в том, чтобы проверить, соответствуют ли данные гипотетической модели измерения. Эта гипотетическая модель основана на теории и/или предыдущих аналитических исследованиях. [2] CFA был впервые разработан Йорескогом (1969) [3] и заменил старые методы анализа валидности конструкции , такие как матрица MTMM , описанную в Campbell & Fiske (1959). [4]
При подтверждающем факторном анализе исследователь сначала разрабатывает гипотезу о том, какие факторы, по его мнению, лежат в основе используемых показателей (например, « депрессия » является фактором, лежащим в основе опросника депрессии Бека и шкалы оценки депрессии Гамильтона ) и может налагать ограничения на модель. на основе этих априорных гипотез. Налагая эти ограничения, исследователь заставляет модель соответствовать своей теории. Например, если предполагается, что существуют два фактора, отвечающие за ковариацию показателей, и что эти факторы не связаны друг с другом, исследователь может создать модель, в которой корреляция между фактором A и фактором B ограничена нулем. Затем можно было бы получить показатели соответствия модели, чтобы оценить, насколько хорошо предложенная модель отражает ковариацию между всеми элементами или показателями в модели. Если ограничения, наложенные исследователем на модель, несовместимы с выборочными данными, то результаты статистических тестов на соответствие модели покажут плохое соответствие, и модель будет отклонена. Если соответствие плохое, это может быть связано с тем, что некоторые элементы измеряют несколько факторов. Также может случиться так, что некоторые элементы внутри фактора более связаны друг с другом, чем другие.
Для некоторых приложений требование «нулевых нагрузок» (для индикаторов, которые не должны нагружаться определенным фактором) считается слишком строгим. Недавно разработанный метод анализа, «исследовательское моделирование структурными уравнениями», уточняет гипотезы о взаимосвязи между наблюдаемыми показателями и их предполагаемыми первичными скрытыми факторами , а также позволяет оценить нагрузки с другими скрытыми факторами. [5]
В подтверждающем факторном анализе исследователи обычно заинтересованы в изучении степени, в которой ответы вектора наблюдаемых случайных величин p x 1 могут быть использованы для присвоения значения одной или нескольким ненаблюдаемым переменным (переменным) η . Исследование в основном осуществляется путем оценки и оценки нагрузки каждого элемента, используемого для выявления аспектов ненаблюдаемой скрытой переменной. То есть y[i] — это вектор наблюдаемых ответов, предсказанных ненаблюдаемой скрытой переменной , которая определяется как:
,
где – вектор p x 1 наблюдаемых случайных величин, – ненаблюдаемые скрытые переменные и – матрица p x k , где k равно числу скрытых переменных. [6] Поскольку , являются несовершенными мерами , модель также состоит из ошибок . Оценки в случае максимального правдоподобия (ML), полученные путем итеративной минимизации функции подгонки,
где – дисперсионно-ковариационная матрица, подразумеваемая предлагаемой моделью факторного анализа, и – наблюдаемая дисперсионно-ковариационная матрица. [6] То есть значения находятся для свободных параметров модели, которые минимизируют разницу между подразумеваемой моделью дисперсионно-ковариационной матрицей и наблюдаемой дисперсионно-ковариационной матрицей.
Хотя для оценки моделей CFA использовались многочисленные алгоритмы, основной процедурой оценки остается метод максимального правдоподобия (ML). [7] При этом модели CFA часто применяются к условиям данных, которые отклоняются от обычных требований теории для достоверной оценки ML. Например, социологи часто оценивают модели CFA с помощью ненормальных данных и показателей, масштабированных с использованием дискретных упорядоченных категорий. [8] Соответственно, были разработаны альтернативные алгоритмы, учитывающие различные условия данных, с которыми сталкиваются прикладные исследователи. Альтернативные оценки подразделяются на два основных типа: (1) робастные и (2) оценки с ограниченной информацией. [9]
Когда МО реализуется с данными, которые отклоняются от предположений нормальной теории, модели CFA могут давать смещенные оценки параметров и вводящие в заблуждение выводы. [10] Робастная оценка обычно пытается исправить проблему путем корректировки модели нормальной теории χ 2 и стандартных ошибок. [9] Например, Саторра и Бентлер (1994) рекомендовали использовать оценку ML обычным способом и впоследствии разделить модель χ 2 на меру степени многомерного эксцесса. [11] Дополнительным преимуществом надежных оценщиков ML является их доступность в обычном программном обеспечении SEM (например, LAVAAN). [12]
К сожалению, надежные средства оценки машинного обучения могут оказаться несостоятельными в условиях обычных данных. В частности, когда индикаторы масштабируются с использованием нескольких категорий ответов (например, «не согласен », «нейтрально », « согласен »), надежные средства оценки ML имеют тенденцию работать плохо. [10] Оценщики с ограниченной информацией, такие как взвешенные наименьшие квадраты (WLS), вероятно, являются лучшим выбором, когда манифестные индикаторы принимают порядковую форму. [13] В целом, специалисты по оценке ограниченной информации обращают внимание на порядковые показатели, используя полихорические корреляции для соответствия моделям CFA. [14] Полихорические корреляции фиксируют ковариацию между двумя скрытыми переменными, когда наблюдается только их категоризированная форма, что достигается в основном за счет оценки пороговых параметров. [15]
И исследовательский факторный анализ (EFA), и подтверждающий факторный анализ (CFA) используются для понимания общей дисперсии измеряемых переменных, которая, как полагают, связана с фактором или скрытой конструкцией. Однако, несмотря на это сходство, EFA и CFA представляют собой концептуально и статистически разные анализы.
Целью EFA является выявление факторов на основе данных и максимизация объясняемой дисперсии. [16] От исследователя не требуется каких-либо конкретных гипотез о том, сколько факторов возникнет и какие элементы или переменные будут включать в себя эти факторы. Если эти гипотезы существуют, они не учитываются и не влияют на результаты статистического анализа. Напротив, CFA оценивает априорные гипотезы и в значительной степени руководствуется теорией. Анализ CFA требует от исследователя заранее выдвинуть гипотезу о количестве факторов, коррелируют ли эти факторы или нет, а также о том, какие элементы/меры нагружают и отражают какие факторы. [17] Таким образом, в отличие от исследовательского факторного анализа , где все нагрузки могут изменяться свободно, CFA допускает явное ограничение определенных нагрузок равным нулю.
EFA часто считается более подходящим, чем CFA, на ранних стадиях разработки шкалы, поскольку CFA не показывает, насколько хорошо ваши элементы влияют на непредполагаемые факторы. [18] Еще одним веским аргументом в пользу первоначального использования EFA является то, что неверная спецификация количества факторов на ранней стадии разработки шкалы обычно не обнаруживается подтверждающим факторным анализом. На более поздних стадиях развития шкалы подтверждающие методы могут предоставить больше информации за счет явного контраста конкурирующих факторных структур. [18]
ОДВ иногда упоминается в исследованиях, хотя CFA был бы лучшим статистическим подходом. [19] Утверждалось, что CFA может носить ограничительный и неуместный характер, если используется в исследовательских целях. [20] Однако идея о том, что CFA является исключительно «подтверждающим» анализом, иногда может вводить в заблуждение, поскольку индексы модификации, используемые в CFA, носят в некоторой степени исследовательский характер. Индексы модификации показывают улучшение соответствия модели, если конкретный коэффициент станет неограниченным. [21] Аналогично, EFA и CFA не обязательно должны быть взаимоисключающими анализами; Утверждается, что ОДВ является разумным продолжением плохо подходящей модели CFA. [22]
Программное обеспечение для моделирования структурными уравнениями обычно используется для проведения подтверждающего факторного анализа. LISREL , [23] EQS, [24] AMOS, [25] Mplus [26] и пакет LAVAAN на языке R [27] являются популярными программами. Существует также пакет Python semopy 2. [28] CFA также часто используется в качестве первого шага для оценки предлагаемой модели измерения в модели структурного уравнения. Многие правила интерпретации, касающиеся оценки соответствия модели и модификации модели при моделировании структурными уравнениями, в равной степени применимы и к CFA. CFA отличается от моделирования структурными уравнениями тем, что в CFA нет направленных стрелок между скрытыми факторами . Другими словами, хотя в CFA не предполагается, что факторы напрямую вызывают друг друга, SEM часто определяет конкретные факторы и переменные как причинные по своей природе. В контексте SEM CFA часто называют «моделью измерения», а отношения между скрытыми переменными (с направленными стрелками) называются «структурной моделью».
В CFA используется несколько статистических тестов, чтобы определить, насколько хорошо модель соответствует данным. [16] Обратите внимание, что хорошее соответствие модели данным не означает, что модель «правильная» или даже то, что она объясняет большую часть ковариации. «Хорошее соответствие модели» означает лишь то, что модель правдоподобна. [29] При сообщении о результатах подтверждающего факторного анализа необходимо сообщать: а) предлагаемые модели, б) любые внесенные изменения, в) какие меры идентифицируют каждую скрытую переменную, г) корреляции между скрытыми переменными, д) любые другая соответствующая информация, например, используются ли ограничения. [30] Что касается выбора статистики соответствия модели для отчета, не следует просто сообщать статистику, которая оценивает наилучшее соответствие, хотя это может быть заманчиво. Хотя существует несколько различных мнений, Клайн (2010) рекомендует сообщать о критерии хи-квадрат, среднеквадратической ошибке аппроксимации (RMSEA), сравнительном индексе соответствия (CFI) и стандартизированном среднеквадратическом остатке (SRMR). [1]
Индексы абсолютного соответствия определяют, насколько хорошо априорная модель подходит или воспроизводит данные. [31] Индексы абсолютного соответствия включают, помимо прочего, критерий хи-квадрат, RMSEA, GFI, AGFI, RMR и SRMR. [32]
Критерий хи-квадрат показывает разницу между наблюдаемыми и ожидаемыми ковариационными матрицами . Значения ближе к нулю указывают на лучшее соответствие; меньшая разница между ожидаемыми и наблюдаемыми ковариационными матрицами. [21] Статистику хи-квадрат также можно использовать для прямого сравнения соответствия вложенных моделей данным. Однако одна из трудностей с тестом соответствия модели по хи-квадрату заключается в том, что исследователи могут не отклонить неподходящую модель при небольших размерах выборки и отклонить подходящую модель при больших размерах выборки. [21] В результате были разработаны другие меры соответствия.
Среднеквадратическая ошибка аппроксимации (RMSEA) позволяет избежать проблем с размером выборки за счет анализа несоответствия между гипотетической моделью с оптимально выбранными оценками параметров и ковариационной матрицей генеральной совокупности. [32] RMSEA находится в диапазоне от 0 до 1, меньшие значения указывают на лучшее соответствие модели. Значение 0,06 или меньше указывает на приемлемое соответствие модели. [33] [34]
Среднеквадратичный остаток (RMR) и стандартизированный среднеквадратический остаток (SRMR) представляют собой квадратный корень из несоответствия между выборочной ковариационной матрицей и ковариационной матрицей модели. [32] Однако RMR может быть несколько сложно интерпретировать, поскольку его диапазон основан на шкалах индикаторов в модели (это становится сложно, когда у вас есть несколько индикаторов с разными шкалами; например, два вопросника, один с 0 –10, другой – по шкале 1–3). [1] Стандартизированный среднеквадратический остаток устраняет эту трудность в интерпретации и находится в диапазоне от 0 до 1, при этом значение 0,08 или меньше указывает на приемлемую модель. [33]
Индекс согласия (GFI) — это мера соответствия между предполагаемой моделью и наблюдаемой ковариационной матрицей. Скорректированный индекс согласия (AGFI) корректирует GFI, на который влияет количество показателей каждой скрытой переменной. Диапазон значений GFI и AGFI составляет от 0 до 1, причем значение более 0,9 обычно указывает на приемлемое соответствие модели. [35]
Индексы относительного соответствия (также называемые «индексами дополнительного соответствия» [36] и «индексами сравнительного соответствия» [37] ) сравнивают хи-квадрат гипотетической модели с хи-квадратом «нулевой» или «базовой» модели. [31] Эта нулевая модель почти всегда содержит модель, в которой все переменные некоррелированы и, как следствие, имеют очень большой хи-квадрат (что указывает на плохое соответствие). [32] Относительные индексы соответствия включают нормированный индекс соответствия и сравнительный индекс соответствия.
Нормированный индекс соответствия (NFI) анализирует несоответствие между значением хи-квадрат гипотетической модели и значением хи-квадрат нулевой модели. [38] Однако NFI имеет тенденцию быть негативно предвзятым. [37] Ненормированный индекс соответствия (NNFI; также известный как индекс Такера-Льюиса, поскольку он был построен на основе индекса, созданного Такером и Льюисом в 1973 году [39] ), тем не менее, решает некоторые проблемы отрицательного смещения. Значения NNFI иногда могут выходить за пределы диапазона от 0 до 1. [37] Значения как для NFI, так и для NNFI должны находиться в диапазоне от 0 до 1, при этом пороговое значение 0,95 или выше указывает на хорошее соответствие модели. [40]
Сравнительный индекс соответствия (CFI) анализирует соответствие модели, исследуя несоответствие между данными и гипотетической моделью, одновременно корректируя проблемы размера выборки, присущие критерию хи-квадрат соответствия модели [21] и нормированному индексу соответствия. . [37] Значения CFI варьируются от 0 до 1, причем большие значения указывают на лучшее соответствие. Ранее считалось, что значение CFI 0,90 или выше указывает на приемлемое соответствие модели. [40] Однако недавние исследования [ когда? ] указали, что значение выше 0,90 необходимо, чтобы гарантировать, что неправильно указанные модели не будут считаться приемлемыми. [40] Таким образом, значение CFI 0,95 или выше в настоящее время считается показателем хорошего соответствия.
Чтобы оценить параметры модели, модель должна быть правильно идентифицирована. То есть количество оцениваемых (неизвестных) параметров ( q ) должно быть меньше или равно количеству уникальных дисперсий и ковариаций среди измеряемых переменных; р ( р + 1)/2. Это уравнение известно как «правило Т». Если имеется слишком мало информации, на которой можно основывать оценки параметров, то говорят, что модель недостаточно определена, и параметры модели не могут быть оценены должным образом. [41]