Повторяемость

Повторяемость или надежность повторного тестирования ^[1] — это близость результатов последовательных измерений одной и той же меры, выполненных в одних и тех же условиях измерения. ^[2] Другими словами, измерения проводятся одним человеком или одним прибором на одном и том же объекте, в одних и тех же условиях и в течение короткого периода времени. Неидеальная надежность повторного тестирования приводит к изменчивости повторного тестирования . Такая изменчивость может быть вызвана, например, внутрииндивидуальной изменчивостью и изменчивостью между наблюдателями . Измерение можно назвать повторяемым, если эта изменчивость меньше заранее определенного критерия приемлемости.

Изменчивость между повторными тестами используется на практике, например, при медицинском мониторинге состояний. В этих ситуациях часто существует предопределенная «критическая разница», и для различий в контролируемых значениях, которые меньше этой критической разницы, возможность изменчивости как единственной причины разницы может рассматриваться в дополнение, например, к изменениям в заболеваниях или методах лечения. ^[3]

Условия

При установлении повторяемости необходимо соблюдать следующие условия: ^[2]^[4]

те же экспериментальные инструменты
тот же наблюдатель
тот же измерительный прибор, используемый в тех же условиях
то же самое место
повторение в течение короткого периода времени.
те же цели

Методы повторяемости были разработаны Бландом и Альтманом (1986). ^[5]

Если корреляция между отдельными применениями теста высокая (например, 0,7 или выше, как в этой таблице внутренней согласованности альфа Кронбаха ^[6] ), то он имеет хорошую надежность при повторном тестировании.

Коэффициент повторяемости — это мера точности, которая представляет собой значение, ниже которого можно ожидать, что абсолютная разница между двумя результатами повторных испытаний будет находиться с вероятностью 95%. ^{[ необходима ссылка ]}

Стандартное отклонение в условиях повторяемости является частью точности и достоверности . ^{[ необходима ссылка ]}

Анализ согласованности атрибутов для баз данных дефектов

Анализ согласованности атрибутов предназначен для одновременной оценки влияния повторяемости и воспроизводимости на точность. Он позволяет аналитику изучать ответы нескольких рецензентов, поскольку они рассматривают несколько сценариев несколько раз. Он производит статистику, которая оценивает способность оценщиков соглашаться с собой (повторяемость), друг с другом ( воспроизводимость ) и с известным основным или правильным значением (общая точность) для каждой характеристики — снова и снова. ^[7]

Психологическое тестирование

Поскольку один и тот же тест проводится дважды, и каждый тест проводится параллельно самому себе, различия между результатами теста и результатами повторного теста должны быть обусловлены исключительно ошибкой измерения. Такого рода аргумент, скорее всего, верен для многих физических измерений. Однако этот аргумент часто не подходит для психологических измерений, поскольку часто невозможно считать второе проведение теста параллельным измерением первому. ^[8]

Второе применение психологического теста может давать систематически иные результаты, чем первое применение, по следующим причинам: ^[8]

Измеряемый атрибут может измениться между первым тестом и повторным тестом. Например, тест по чтению, который проводится в сентябре для третьего класса, может дать другие результаты при повторном прохождении в июне. Можно было бы ожидать некоторого изменения в способности детей читать за этот промежуток времени, низкая корреляция между тестом и повторным тестом может отражать реальные изменения самого атрибута.
Опыт прохождения теста сам по себе может изменить истинный балл человека. Например, заполнение опросника тревожности может способствовать повышению уровня тревожности человека.
Эффект переноса , особенно если интервал между тестом и повторным тестом короткий. При повторном тестировании люди могут вспомнить свой первоначальный ответ, что может повлиять на ответы при втором приеме.

Смотрите также

Ссылки

^ Типы надежности Архивировано 2018-06-06 в Wayback Machine База знаний по методам исследования. Последняя редакция: 20 октября 2006 г.
^ ab JCGM 100:2008. Оценка данных измерений – Руководство по выражению неопределенности измерений (PDF) , Объединенный комитет по руководствам по метрологии, 2008, архивировано (PDF) из оригинала 2009-10-01 , извлечено 2018-04-11
^ Фрейзер, К. Г.; Фогарти, И. (1989). «Интерпретация результатов лабораторных исследований». BMJ (Clinical Research Ed.) . 298 (6689): 1659–1660. doi :10.1136/bmj.298.6689.1659. PMC 1836738. PMID 2503170 .
^ Тейлор, Барри Н.; Куятт, Крис Э. (1994), Руководство NIST по оценке и выражению неопределенности результатов измерений NIST, Гейтерсберг, Мэриленд, США: Национальный институт стандартов и технологий, архивировано из оригинала 2019-09-30 , извлечено 2018-04-11
^ "Статистические методы оценки согласия между двумя методами клинических измерений". Архивировано из оригинала 2018-07-06 . Получено 2010-09-30 .
^ Джордж, Д. и Маллери, П. (2003). SPSS для Windows шаг за шагом: простое руководство и справочник. Обновление 11.0 (4-е изд.). Бостон: Allyn & Bacon.
^ "Анализ согласования атрибутов для баз данных дефектов | iSixSigma". 26 февраля 2010 г. Архивировано из оригинала 22 марта 2016 г. Получено 7 февраля 2013 г.
^ ab Davidshofer, Kevin R. Murphy, Charles O. (2005). Психологическое тестирование: принципы и применение (6-е изд.). Upper Saddle River, NJ: Pearson/Prentice Hall. ISBN 978-0-13-189172-2.{{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )

Внешние ссылки

Практическое объяснение повторяемости и воспроизводимости с точки зрения того, как данные могут различаться между образцами. - пример из нефтяной промышленности. Архивировано 22.09.2017 на Wayback Machine