Повторяемость или надежность повторного тестирования [1] — это близость результатов последовательных измерений одной и той же меры, выполненных в одних и тех же условиях измерения. [2] Другими словами, измерения проводятся одним человеком или одним прибором на одном и том же объекте, в одних и тех же условиях и в течение короткого периода времени. Неидеальная надежность повторного тестирования приводит к изменчивости повторного тестирования . Такая изменчивость может быть вызвана, например, внутрииндивидуальной изменчивостью и изменчивостью между наблюдателями . Измерение можно назвать повторяемым, если эта изменчивость меньше заранее определенного критерия приемлемости.
Изменчивость между повторными тестами используется на практике, например, при медицинском мониторинге состояний. В этих ситуациях часто существует предопределенная «критическая разница», и для различий в контролируемых значениях, которые меньше этой критической разницы, возможность изменчивости как единственной причины разницы может рассматриваться в дополнение, например, к изменениям в заболеваниях или методах лечения. [3]
При установлении повторяемости необходимо соблюдать следующие условия: [2] [4]
Методы повторяемости были разработаны Бландом и Альтманом (1986). [5]
Если корреляция между отдельными применениями теста высокая (например, 0,7 или выше, как в этой таблице внутренней согласованности альфа Кронбаха [6] ), то он имеет хорошую надежность при повторном тестировании.
Коэффициент повторяемости — это мера точности, которая представляет собой значение, ниже которого можно ожидать, что абсолютная разница между двумя результатами повторных испытаний будет находиться с вероятностью 95%. [ необходима ссылка ]
Стандартное отклонение в условиях повторяемости является частью точности и достоверности . [ необходима ссылка ]
Анализ согласованности атрибутов предназначен для одновременной оценки влияния повторяемости и воспроизводимости на точность. Он позволяет аналитику изучать ответы нескольких рецензентов, поскольку они рассматривают несколько сценариев несколько раз. Он производит статистику, которая оценивает способность оценщиков соглашаться с собой (повторяемость), друг с другом ( воспроизводимость ) и с известным основным или правильным значением (общая точность) для каждой характеристики — снова и снова. [7]
Поскольку один и тот же тест проводится дважды, и каждый тест проводится параллельно самому себе, различия между результатами теста и результатами повторного теста должны быть обусловлены исключительно ошибкой измерения. Такого рода аргумент, скорее всего, верен для многих физических измерений. Однако этот аргумент часто не подходит для психологических измерений, поскольку часто невозможно считать второе проведение теста параллельным измерением первому. [8]
Второе применение психологического теста может давать систематически иные результаты, чем первое применение, по следующим причинам: [8]
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка )