stringtranslate.com

Повторяемость

Повторяемость или надежность повторных испытаний [1] — это близость согласия между результатами последовательных измерений одного и того же показателя, проведенных в одних и тех же условиях измерения. [2] Другими словами, измерения проводятся одним человеком или инструментом на одном и том же объекте, в одних и тех же условиях и за короткий период времени. Неидеальная надежность тестирования и повторного тестирования приводит к изменчивости результатов повторного тестирования . Такая изменчивость может быть вызвана, например, внутрииндивидуальной изменчивостью и изменчивостью между наблюдателями . Можно сказать, что измерение повторяемо, если это отклонение меньше заранее определенного критерия приемки.

Тест-ретестовая вариабельность практически используется, например, при медицинском мониторинге состояния. В таких ситуациях часто существует заранее определенное «критическое различие», и для различий в контролируемых значениях, которые меньше этой критической разницы, возможность изменчивости как единственной причины различия может рассматриваться в дополнение, например, к изменениям. при заболеваниях или лечении. [3]

Условия

Для обеспечения повторяемости должны быть выполнены следующие условия: [2] [4]

Методы повторяемости были разработаны Бландом и Альтманом (1986). [5]

Если корреляция между отдельными проведениями теста высока (например, 0,7 или выше, как в таблице альфа-внутренней согласованности Кронбаха [6] ), то он имеет хорошую надежность при повторном тестировании.

Коэффициент повторяемости — это показатель точности, который представляет собой значение, ниже которого можно ожидать, что абсолютная разница между двумя результатами повторных испытаний будет лежать с вероятностью 95%.

Стандартное отклонение в условиях повторяемости является частью точности и аккуратности .

Анализ соглашения атрибутов для баз данных дефектов

Анализ соответствия атрибутов предназначен для одновременной оценки влияния повторяемости и воспроизводимости на точность. Это позволяет аналитику изучать ответы нескольких рецензентов, рассматривая несколько сценариев несколько раз. Он производит статистику, которая оценивает способность оценщиков согласовывать друг с другом (повторяемость), друг с другом ( воспроизводимость ), а также с известным эталоном или правильным значением (общая точность) для каждой характеристики – снова и снова. [7]

Психологическое тестирование

Поскольку один и тот же тест проводится дважды и каждый тест параллелен сам себе, различия между баллами за тест и баллами за повторный тест должны быть обусловлены исключительно ошибкой измерения. Подобные аргументы, вполне вероятно, верны для многих физических измерений. Однако этот аргумент часто неприемлем для психологических измерений, поскольку часто невозможно рассматривать второе проведение теста как меру, параллельную первому. [8]

Второе проведение психологического теста может дать систематически другие результаты, чем первое, по следующим причинам: [8]

  1. Измеряемый атрибут может измениться между первым и повторным тестированием. Например, тест по чтению, который проводится в сентябре для третьего класса, может дать другие результаты при повторной сдаче в июне. Можно было бы ожидать некоторых изменений в способности детей к чтению за этот промежуток времени; низкая корреляция между тестами и повторными тестами может отражать реальные изменения в самом признаке.
  2. Сам опыт прохождения теста может изменить истинный результат человека. Например, составление перечня тревожности может повысить уровень тревожности человека.
  3. Эффект переноса , особенно если интервал между тестом и повторным тестом короткий. При повторном тестировании люди могут вспомнить свой первоначальный ответ, что может повлиять на ответы при втором приеме.

Смотрите также

Рекомендации

  1. ^ Типы надежности База знаний методов исследования. Последняя редакция: 20 октября 2006 г.
  2. ^ ab JCGM 100:2008. Оценка данных измерений – Руководство по выражению неопределенности измерений (PDF) , Объединенный комитет по руководствам по метрологии, 2008 г.
  3. ^ Фрейзер, КГ; Фогарти, Ю. (1989). «Интерпретация результатов лабораторных исследований». BMJ (Клинические исследования под ред.) . 298 (6689): 1659–1660. дои : 10.1136/bmj.298.6689.1659. ПМЦ 1836738 . ПМИД  2503170. 
  4. ^ Тейлор, Барри Н.; Куятт, Крис Э. (1994), Рекомендации NIST по оценке и выражению неопределенности результатов измерений NIST, Гейтерсбург, Мэриленд, США: Национальный институт стандартов и технологий.
  5. ^ «Статистические методы оценки согласия между двумя методами клинических измерений».
  6. ^ Джордж Д. и Мэллери П. (2003). SPSS для Windows шаг за шагом: простое руководство и справочник. Обновление 11.0 (4-е изд.). Бостон: Аллин и Бэкон.
  7. ^ «Анализ соглашения об атрибутах для баз данных дефектов | iSixSigma» . 26 февраля 2010 г.
  8. ^ аб Дэвидшофер, Кевин Р. Мерфи, Чарльз О. (2005). Психологическое тестирование: принципы и применение (6-е изд.). Река Аппер-Сэддл, Нью-Джерси: Пирсон/Прентис-Холл. ISBN 978-0-13-189172-2.{{cite book}}: CS1 maint: несколько имен: список авторов ( ссылка )

Внешние ссылки