В статистике и исследованиях внутренняя согласованность обычно является мерой, основанной на корреляциях между различными элементами одного и того же теста (или одной и той же подшкалы в более крупном тесте). Она измеряет, дают ли несколько элементов, которые предлагают измерить одну и ту же общую конструкцию , схожие баллы. Например, если респондент выразил согласие с утверждениями «Мне нравится кататься на велосипеде» и «Мне нравилось кататься на велосипеде в прошлом», и несогласие с утверждением «Я ненавижу велосипеды», это будет свидетельствовать о хорошей внутренней согласованности теста.
Внутренняя согласованность обычно измеряется с помощью альфа Кронбаха, статистики, рассчитанной на основе парных корреляций между элементами. Внутренняя согласованность колеблется от отрицательной бесконечности до единицы. Коэффициент альфа будет отрицательным, если внутрисубъектная изменчивость больше, чем межсубъектная изменчивость. [1]
Общепринятое практическое правило для описания внутренней согласованности выглядит следующим образом: [2]
Очень высокая надежность (0,95 или выше) не обязательно желательна, так как это указывает на то, что элементы могут быть избыточными. [3] Цель разработки надежного инструмента состоит в том, чтобы оценки по схожим элементам были связаны (внутренне согласованы), но при этом каждый из них также вносил некоторую уникальную информацию. Обратите внимание также, что альфа Кронбаха обязательно выше для тестов, измеряющих более узкие конструкции, и ниже, когда измеряются более общие, широкие конструкции. Это явление, наряду с рядом других причин, выступает против использования объективных пороговых значений для мер внутренней согласованности. [4] Альфа также является функцией количества элементов, поэтому более короткие шкалы часто будут иметь более низкие оценки надежности, но все равно будут предпочтительными во многих ситуациях, поскольку они менее обременительны.
Альтернативный способ мышления о внутренней согласованности заключается в том, что это степень, в которой все элементы теста измеряют одну и ту же скрытую переменную . Преимущество этой точки зрения по сравнению с понятием высокой средней корреляции между элементами теста — точки зрения, лежащей в основе альфа Кронбаха — заключается в том, что средняя корреляция элементов зависит от асимметрии (в распределении корреляций элементов), как и любое другое среднее значение. Таким образом, в то время как модальная корреляция элементов равна нулю, когда элементы теста измеряют несколько несвязанных скрытых переменных, средняя корреляция элементов в таких случаях будет больше нуля. Таким образом, в то время как идеал измерения заключается в том, чтобы все элементы теста измеряли одну и ту же скрытую переменную, альфа многократно демонстрировала достижение довольно высоких значений, даже когда набор элементов измеряет несколько несвязанных скрытых переменных. [5] [6] [7] [8] [9] [10] [11] Иерархический «коэффициент омега» может быть более подходящим индексом степени, в которой все элементы теста измеряют одну и ту же скрытую переменную. [12] [13] Несколько различных мер внутренней согласованности рассмотрены Ревеллом и Зинбаргом (2009). [14] [15]