stringtranslate.com

Формула прогнозирования Спирмена–Брауна

Формула прогнозирования Спирмена –Брауна , также известная как формула пророчества Спирмена–Брауна , представляет собой формулу, связывающую психометрическую надежность с длиной теста и используемую психометристами для прогнозирования надежности теста после изменения его длины. [1] Метод был опубликован независимо Спирменом (1910) и Брауном (1910). [2] [3]

Расчет

Прогнозируемая надежность оценивается как:

где n — количество объединенных «тестов» (см. ниже), а — надежность текущего «теста». Формула предсказывает надежность нового теста, составленного путем повторения текущего теста n раз (или, что эквивалентно, создания теста с n параллельными формами текущего экзамена). Таким образом, n  = 2 подразумевает удвоение длины экзамена путем добавления элементов с теми же свойствами, что и в текущем экзамене. Значения n меньше единицы могут использоваться для прогнозирования эффекта сокращения теста.

Прогнозирование длительности теста

Формулу также можно преобразовать, чтобы предсказать количество повторений, необходимое для достижения определенной степени надежности:

Надежность половинного разделения

До разработки тау-эквивалентной надежности , надежность с разделением пополам с использованием формулы Спирмена-Брауна была единственным способом получения межэлементной надежности. [4] [5] После разделения целого элемента на произвольные половины корреляция между разделенными половинами может быть преобразована в надежность с помощью формулы Спирмена-Брауна. То есть,

,где - корреляция Пирсона между разделенными половинками. Хотя формула Спирмена-Брауна редко используется в качестве коэффициента надежности разделенных половин после разработки тау-эквивалентной надежности , этот метод по-прежнему полезен для двухэлементных шкал. [6]

Его связь с другими коэффициентами надежности разделения пополам

Разделенная пополам параллельная надежность

Cho (2016) [7] предлагает использовать систематическую номенклатуру и формульные выражения, критикуя, что коэффициенты надежности были представлены неорганизованным и непоследовательным образом с исторически неточными и неинформативными названиями. Предположение формулы Спирмена-Брауна заключается в том, что разделенные половины параллельны, что означает, что дисперсии разделенных половин равны. Систематическое название, предложенное для формулы Спирмена-Брауна, — разделенная пополам параллельная надежность. Кроме того, была предложена следующая эквивалентная систематическая формула.

Разделенная пополам тау-эквивалентная надежность

Надежность, эквивалентная тау -разделению пополам , — это коэффициент надежности, который можно использовать, когда дисперсии разделенных пополам не равны. Фланаган-Рулон [8] ( , ), Гуттман [9] ( ) предложили следующие формульные выражения: , , и .

Где , , , и — дисперсия первой разделенной половины, второй половины, сумма двух разделенных половин и разность двух разделенных половин соответственно.

Все эти формулы алгебраически эквивалентны. Систематическая формула [7] выглядит следующим образом.

.

Разделенная пополам однородная надежность

Параллельная надежность с разделением пополам и эквивалентная надежность с разделением пополам тау предполагают, что длины разделенных пополам одинаковы. Конгенерическая надежность с разделением пополам смягчает это предположение. Однако, поскольку необходимо оценить больше параметров , чем предоставленных фрагментов информации, необходимо другое предположение. Раджу (1970) [10] исследовал коэффициент конгенерической надежности с разделением пополам, когда относительная длина каждой разделенной половины была известна. Ангофф (1953) [11] и Фельдт (1975) [12] опубликовали коэффициент конгенерической надежности с разделением пополам, предполагая, что длина каждой разделенной половины пропорциональна сумме дисперсий и ковариаций. [7]

История

Название Спирмен-Браун, кажется, подразумевает партнерство, но два автора конкурировали. Эта формула берет свое начало из двух статей, опубликованных одновременно Брауном (1910) и Спирменом (1910) в British Journal of Psychology . У Чарльза Спирмена были враждебные отношения с Карлом Пирсоном , который работал вместе в Королевском колледже Лондона , и они обменивались статьями, в которых критиковали и высмеивали друг друга. [13] Уильям Браун получил докторскую степень под руководством Пирсона. Важная часть докторской диссертации Брауна [14] была посвящена критике работы Спирмена. [15] Спирмен появляется в этой формуле первым до Брауна, потому что он более престижный ученый, чем Браун. [16] Например, Спирмен создал первую теорию надежности [15] и называется «отцом классической теории надежности». [17] Это пример эффекта Матфея или закона эпонимии Стиглера .

Эту формулу следует называть формулой Брауна-Спирмена по следующим причинам: [16] Во-первых, формула, которую мы используем сегодня, не является версией Спирмена (1910), а формулой Брауна (1910). Браун (1910) явно представил эту формулу как коэффициент надежности, разделенный пополам, но Спирмен (1910) этого не сделал. Во-вторых, формальный вывод Брауна (1910) более лаконичен и элегантен, чем у Спирмена (1910). [18] В-третьих, вполне вероятно, что Браун (1910) был написан до Спирмена (1910). Браун (1910) основан на его докторской диссертации , которая уже была доступна на момент публикации. Спирмен (1910) критиковал Брауна (1910), но Браун (1910) критиковал только Спирмена (1904). В-четвертых, в стиле АПА авторы перечисляются в алфавитном порядке.

Использование и связанные темы

Эта формула обычно используется психометристами для прогнозирования надежности теста после изменения его длины. Это соотношение особенно важно для метода разделения пополам и связанных с ним методов оценки надежности (где этот метод иногда называют формулой «Step Up»). [2]

Формула также полезна для понимания нелинейной связи между надежностью теста и длиной теста. Длина теста должна увеличиваться на все большие значения по мере того, как желаемая надежность приближается к 1,0.

Если более длинный/короткий тест не параллелен текущему тесту, то прогноз не будет строго точным. Например, если высоконадежный тест был удлинен путем добавления множества плохих элементов, то достигнутая надежность, вероятно, будет намного ниже, чем предсказанная этой формулой.

Для надежности теста из двух пунктов эта формула более подходит, чем альфа Кронбаха (при использовании в этом качестве формула Спирмена-Брауна также называется «стандартизированной альфой Кронбаха», поскольку она совпадает с альфой Кронбаха, вычисленной с использованием средней интеркорреляции пунктов и дисперсии единиц-пунктов, а не средней ковариации пунктов и средней дисперсии пунктов). [6]

Цитаты

  1. ^ Аллен, М.; Йен В. (1979). Введение в теорию измерений . Монтерей, Калифорния: Brooks/Cole. ISBN 0-8185-0283-5.
  2. ^ ab Stanley, J. (1971). Надежность. В RL Thorndike (ред.), Educational Measurement . Второе издание. Вашингтон, округ Колумбия: Американский совет по образованию
  3. ^ Wainer, H. , & Thissen, D. (2001). True score theory: The traditional method. В H. Wainer and D. Thissen, (Eds.), Test Scoring . Mahwah, NJ:Lawrence Erlbaum
  4. ^ Келли, TL (1924). Заметка о надежности теста: ответ на критику доктора Крама. Журнал педагогической психологии, 15, 193–204. doi: 10.1037 / h0072471.
  5. ^ Кудер, ГФ и Ричардсон, МВ (1937). Теория оценки надежности тестов. Психометрика, 2, 151-160. doi: 10.1007 / BF02288391.
  6. ^ ab Eisinga, R.; Te Grotenhuis, M.; Pelzer, B. (2013). «Надежность двухпунктовой шкалы: Пирсон, Кронбах или Спирмен-Браун?». Международный журнал общественного здравоохранения. 58 (4): 637-642. doi: 10.1007 / s00038-012-0416-3
  7. ^ abc Cho, E. (2016). Делаем надежность надежной: систематический подход к коэффициентам надежности. Организационные методы исследования, 19, 651-682. doi:10.1177/1094428116656239.
  8. ^ Фланаган, Дж. К. (1937). Предлагаемая процедура повышения эффективности объективных тестов. Журнал педагогической психологии, 28, 17–21. doi: 10.1037 / h0057430. Рулон, П. Дж. (1939). Упрощенная процедура определения надежности теста путем его разделения на части. Harvard Educational Review, 9, 99–103.
  9. ^ Гуттман, Л. (1945). Основа для анализа надежности повторных тестов. Психометрика, 10, 255-282. doi: 10.1007 / BF02288892.
  10. ^ Раджу, Н. С. (1970). Новая формула для оценки общей надежности теста по частям неравной длины. Труды 78-го ежегодного съезда АПА, 5, 143-144.
  11. ^ Angoff, WH (1953). Надежность теста и эффективная длина теста. Psychometrika, 18(1), 1-14.
  12. ^ Фельдт, Л. С. (1975). Оценка надежности теста, разделенного на две части неравной длины. Психометрика, 40(4), 557-561.
  13. ^ Коулз, М. (2005) Статистика в психологии: историческая перспектива. Нью-Йорк: Psychology Press.
  14. Позднее опубликовано в виде книги Браун, У. (1911). Основы ментального измерения. Лондон: Cambridge University Press.
  15. ^ ab Spearman, C. (1904). Доказательство и измерение связи между двумя вещами. American Journal of Psychology, 15, 72-101.
  16. ^ ab Cho, E. & Chun, S. (2018). Ремонт сломанных часов: исторический обзор коэффициентов надежности создателей, включая альфу Кронбаха. Survey Research, 19 (2), 23-54.
  17. ^ Cronbach, LJ, Rajaratnam, N., & Gleser, GC (1963). Теория генерализуемости: либерализация теории надежности. British Journal of Statistical Psychology, 16, 137-163. doi: 10.1111 / j.2044-8317.1963.tb00206.x.
  18. ^ Трауб, Р. Э. (1997). Классическая теория тестов в исторической перспективе. Образовательные измерения: проблемы и практика, 16, 8-14. doi: 10.1111 / j.1745-3992.1997.tb00603.x.

Ссылки