stringtranslate.com

U-тест Манна-Уитни

Тест Манна–Уитни (также называемый тестом Манна–Уитни–Уилкоксона ( MWW/MWU ), критерием суммы рангов Уилкоксона или тестом Уилкоксона–Манна–Уитни ) — это непараметрический статистический тест нулевой гипотезы о том, что для случайно выбранных значений X и Y из двух совокупностей вероятность того, что X больше Y, равна вероятности того, что Y больше X.

Непараметрические тесты, используемые на двух зависимых выборках, — это тест знаков и критерий знаковых рангов Вилкоксона .

Предположения и формальная формулировка гипотез

Хотя Генри Манн и Дональд Рэнсом Уитни [1] разработали U- тест Манна-Уитни, исходя из предположения о непрерывных ответах с альтернативной гипотезой о том, что одно распределение стохастически больше другого, существует много других способов сформулировать нулевую и альтернативную гипотезы таким образом, что U -тест Манна-Уитни даст действительный тест. [2]

Очень общая формулировка предполагает, что:

  1. Все наблюдения обеих групп независимы друг от друга,
  2. Ответы являются по крайней мере порядковыми (т.е. можно по крайней мере сказать, какое из двух наблюдений больше),
  3. При нулевой гипотезе H 0 распределения обеих популяций идентичны. [3]
  4. Альтернативная гипотеза H 1 заключается в том, что распределения не идентичны.

Согласно общей формулировке, тест является последовательным только тогда, когда в рамках H 1 происходит следующее :

  1. Вероятность того, что наблюдение из популяции X превысит наблюдение из популяции Y , отличается (больше или меньше), чем вероятность того, что наблюдение из Y превысит наблюдение из X ; то есть, P( X > Y ) ≠ P( Y > X ) или P( X > Y ) + 0,5 · P( X = Y ) ≠ 0,5 .

При более строгих предположениях, чем общая формулировка выше, например, если предполагается, что ответы непрерывны, а альтернатива ограничена сдвигом местоположения, т. е. F 1 ( x ) = F 2 ( x + δ ) , мы можем интерпретировать значимый U -тест Манна–Уитни как показывающий разницу в медианах. При этом предположении о сдвиге местоположения мы также можем интерпретировать U- тест Манна–Уитни как оценку того, отличается ли оценка Ходжеса–Лемана разницы в центральной тенденции между двумя популяциями от нуля. Оценка Ходжеса–Лемана для этой двухвыборочной задачи является медианой всех возможных различий между наблюдением в первой выборке и наблюдением во второй выборке.

В противном случае, если дисперсии и формы распределения обеих выборок различаются, тест Манна–Уитни U не проходит тест медиан. Можно привести примеры, где медианы численно равны, в то время как тест отвергает нулевую гипотезу с малым p-значением. [4] [5] [6]

U -тест Манна–Уитни /ранговый критерий Вилкоксона не то же самое, что и знаковый -ранговый критерий Вилкоксона , хотя оба являются непараметрическими и включают суммирование рангов . U- тест Манна–Уитни применяется к независимым выборкам. Знаковый ранговый критерий Вилкоксона применяется к согласованным или зависимым выборкам.

U-статистика

Пусть будет группа 1, выборка iid из , и будет группа 2, выборка iid из , и пусть обе выборки независимы друг от друга. Соответствующая статистика Манна-Уитни U определяется как меньшее из:

с

являющиеся суммами рангов в группах 1 и 2 после ранжирования всех образцов из обеих групп таким образом, что наименьшее значение получает ранг 1, а наибольшее ранг . [7]

Статистика площади под кривой (AUC) для кривых ROC

Статистика U связана с площадью под кривой рабочей характеристики приемника ( AUC ): [8]

Обратите внимание, что это то же самое определение, что и размер эффекта общего языка , то есть вероятность того, что классификатор оценит случайно выбранный экземпляр из первой группы выше, чем случайно выбранный экземпляр из второй группы. [9]

Благодаря своей вероятностной форме, статистика U может быть обобщена до меры разделительной способности классификатора для более чем двух классов: [10]

Где c — число классов, а член R k , из AUC k , учитывает только ранжирование элементов, принадлежащих классам k и (т. е. элементы, принадлежащие всем остальным классам, игнорируются) в соответствии с оценками классификатора вероятности принадлежности этих элементов классу k . AUC k , k всегда будет равен нулю, но, в отличие от случая с двумя классами, обычно AUC k , ≠ AUC , k , поэтому мера M суммирует все пары ( k , ), фактически используя среднее значение AUC k , и AUC , k .

Расчеты

Тест включает в себя расчет статистики , обычно называемой U , распределение которой при нулевой гипотезе известно:

В качестве альтернативы нулевое распределение можно аппроксимировать с помощью тестов перестановки и моделирования Монте-Карло.

В некоторых книгах приводятся таблицы статистических данных, эквивалентных U , например, сумма рангов в одной из выборок, а не само U.

U- критерий Манна-Уитни включен в большинство статистических пакетов .

Его также легко рассчитать вручную, особенно для небольших выборок. Есть два способа сделать это.

Метод первый:

Для сравнения двух небольших наборов наблюдений прямой метод является быстрым и дает представление о значении статистики U , которая соответствует количеству побед во всех парных состязаниях (см. пример с черепахой и зайцем в разделе «Примеры» ниже). Для каждого наблюдения в одном наборе подсчитайте, сколько раз это первое значение выигрывает у любых наблюдений в другом наборе (другое значение проигрывает, если это первое значение больше). Подсчитайте 0,5 для любых ничьих. Сумма побед и ничьих равна U (т. е.: ) для первого набора. U для другого набора — это обратное (т. е.: ).

Способ второй:

Для более крупных образцов:

  1. Присвойте числовые ранги всем наблюдениям (поместите наблюдения из обеих групп в один набор), начиная с 1 для наименьшего значения. Там, где есть группы связанных значений, присвойте ранг, равный средней точке нескорректированных рангов (например, ранги (3, 5, 5, 5, 5, 8) равны (1, 3.5, 3.5, 3.5, 3.5, 6) , где нескорректированные ранги будут равны (1, 2, 3, 4, 5, 6) ).
  2. Теперь складываем ранги для наблюдений, полученных из выборки 1. Сумма рангов в выборке 2 теперь определена, поскольку сумма всех рангов равна N ( N + 1)/2, где N — общее количество наблюдений.
  3. Тогда U определяется как: [11]
где n 1 — размер выборки для выборки 1, а R 1 — сумма рангов в выборке 1.
Обратите внимание, что не имеет значения, какой из двух образцов считается образцом 1. Столь же действительная формула для U имеет вид
Меньшее значение U 1 и U 2 используется при обращении к таблицам значимости. Сумма двух значений определяется как
Зная, что R 1 + R 2 = N ( N + 1)/2 и N = n 1 + n 2 , и выполняя некоторые алгебраические действия , мы находим, что сумма равна
U1 + U2 = n1n2 .

Характеристики

Максимальное значение U равно произведению размеров выборок для двух выборок (т.е.: ). В таком случае «другое» U будет равно 0.

Примеры

Иллюстрация методов расчета

Предположим, что Эзоп недоволен своим классическим экспериментом , в котором было обнаружено, что одна черепаха побеждает одного зайца в гонке, и решает провести тест значимости, чтобы выяснить, можно ли распространить результаты на черепах и зайцев в целом. Он собирает выборку из 6 черепах и 6 зайцев и заставляет их всех бежать гонку одновременно. Порядок, в котором они достигают финишной черты (их ранг, от первого до последнего, пересекающего финишную черту), выглядит следующим образом, записывая T для черепахи и H для зайца:

ТХХХХХТТТТ

Каково значение U ?

ранжируйте животных по времени, которое им потребовалось для прохождения дистанции, так, первому животному присвойте домашний ранг 12, второму — 11 и т. д.
сумма рангов, достигнутых черепахами, составляет 12 + 6 + 5 + 4 + 3 + 2 = 32 .
Следовательно, U T = 32 − (6×7)/2 = 32 − 21 = 11 (то же самое, что и в первом методе).
Сумма рангов, полученных зайцами, составляет 11 + 10 + 9 + 8 + 7 + 1 = 46 , что приводит к U H = 46 − 21 = 25 .

Пример отчета о результатах

При представлении результатов U- критерия Манна-Уитни важно указать: [12]

На практике часть этой информации уже могла быть предоставлена, и следует руководствоваться здравым смыслом при принятии решения о том, следует ли ее повторять. Типичный отчет может выглядеть так:

«Средние значения задержки в группах E и C составили 153 и 247 мс; распределения в двух группах значительно различались ( U Манна–Уитни = 10,5 , n 1 = n 2 = 8 , P < 0,05, двухсторонний)».

Утверждение, которое в полной мере отражает статистический статус теста, может выглядеть так:

«Результаты двух видов лечения сравнивались с использованием двухвыборочного критерия ранговых сумм Вилкоксона–Манна–Уитни. Эффект лечения (разница между видами лечения) количественно определялся с использованием оценщика Ходжеса–Лемана (HL), который согласуется с критерием Вилкоксона. [13] Этот оценщик (HLΔ) представляет собой медиану всех возможных различий в результатах между субъектом в группе B и субъектом в группе A. Непараметрический доверительный интервал 0,95 для HLΔ сопровождает эти оценки, как и ρ, оценка вероятности того, что случайно выбранный субъект из популяции B имеет больший вес, чем случайно выбранный субъект из популяции A. Медианный [квартили] вес для субъектов, получающих лечение A и B, соответственно составляет 147 [121, 177] и 151 [130, 180] кг. Лечение A снизило вес на HLΔ = 5 кг (0,95 CL [2, 9] кг, 2 P = 0,02 , ρ = 0,58 )."

Однако редко можно найти столь обширный отчет в документе, основной темой которого не является статистический вывод.

Нормальное приближение и коррекция связей

Для больших выборок U приблизительно нормально распределено . В этом случае стандартизированное значение

где m U и σ U — среднее значение и стандартное отклонение U , приблизительно стандартное нормальное отклонение, значимость которого можно проверить в таблицах нормального распределения. m U и σ U определяются как

[14] и
[14]

Формула для стандартного отклонения становится более сложной при наличии связанных рангов. Если есть связи в рангах, σ следует скорректировать следующим образом:

[15]

где левая сторона — это просто дисперсия, а правая сторона — поправка на связи, t k — количество связей для k -го ранга, а K — общее количество уникальных рангов со связями.

Более эффективная с точки зрения вычислений форма с вынесенными за скобки n 1 n 2 /12 имеет вид

где n = n 1 + n 2 .

Если число связей невелико (и особенно если нет больших полос связей), связи можно игнорировать при ручных расчетах. Компьютерные статистические пакеты будут использовать правильно скорректированную формулу в обычном режиме.

Обратите внимание, что поскольку U 1 + U 2 = n 1 n 2 , среднее значение n 1 n 2 /2 , используемое в нормальном приближении, является средним двух значений U . Следовательно, абсолютное значение вычисленной z -статистики будет одинаковым, какое бы значение U ни использовалось.

Размеры эффекта

Широко рекомендуемая практика для ученых – сообщать о размере эффекта для выводного теста. [16] [17]

Доля совпадений среди всех пар

Следующие меры эквивалентны.

Размер эффекта общего языка

Один из методов представления размера эффекта для U- теста Манна-Уитни — это f , размер эффекта общего языка. [18] [19] В качестве выборочной статистики размер эффекта общего языка вычисляется путем формирования всех возможных пар между двумя группами, а затем нахождения доли пар, которые поддерживают направление (скажем, что элементы из группы 1 больше элементов из группы 2). [19] Для иллюстрации, в исследовании с выборкой из десяти зайцев и десяти черепах общее количество упорядоченных пар составляет десять раз по десять или 100 пар зайцев и черепах. Предположим, что результаты показывают, что заяц бежал быстрее черепахи в 90 из 100 пар выборки; в этом случае размер эффекта общего языка выборки составляет 90%. [20]

Соотношение между f и U Манна-Уитни (в частности ) выглядит следующим образом:

Это то же самое, что и площадь под кривой (AUC) для ROC-кривой.

ρстатистика

Статистика, называемая ρ , которая линейно связана с U и широко используется в исследованиях категоризации ( дискриминационное обучение с использованием понятий ) и в других местах [21] , вычисляется путем деления U на его максимальное значение для заданных размеров выборки, которое просто равно n 1 × n 2 . Таким образом, ρ является непараметрической мерой перекрытия двух распределений; она может принимать значения от 0 до 1 и является оценкой P( Y > X ) + 0,5 P( Y = X ) , где X и Y — случайно выбранные наблюдения из двух распределений. Оба крайних значения представляют полное разделение распределений, в то время как ρ, равное 0,5, представляет полное перекрытие. Полезность статистики ρ можно увидеть в случае странного примера, использованного выше, где два распределения, которые значительно различались по U- тесту Манна-Уитни, тем не менее имели почти идентичные медианы: значение ρ в этом случае составляет приблизительно 0,723 в пользу зайцев, что верно отражает тот факт, что даже при том, что медианная черепаха победила медианного зайца, зайцы в совокупности показали лучшие результаты, чем черепахи в совокупности. [ необходима ссылка ]

Ранговая бисериальная корреляция

Методом сообщения о размере эффекта для U -теста Манна-Уитни является мера ранговой корреляции, известная как ранговая бисериальная корреляция. Эдвард Кьюртон представил и назвал эту меру. [22] Как и другие корреляционные меры, ранговая бисериальная корреляция может варьироваться от минус одного до плюс одного, при этом нулевое значение указывает на отсутствие связи.

Существует простая формула разности для вычисления рангово-бисериальной корреляции из размера эффекта общего языка: корреляция — это разница между долей пар, благоприятствующих гипотезе ( f ), за вычетом ее дополнения (т.е. доли, которая неблагоприятна ( u )). Эта простая формула разности — это просто разница размера эффекта общего языка каждой группы, и выглядит следующим образом: [18]

Например, рассмотрим пример, где зайцы бегают быстрее черепах в 90 из 100 пар. Размер эффекта общего языка составляет 90%, поэтому рангово-бисериальная корреляция составляет 90% минус 10%, а рангово-бисериальная  r = 0,80 .

Альтернативная формула для рангового бисериала может быть использована для его расчета из U Манна-Уитни (либо , либо ) и размеров выборки каждой группы: [23]

Эта формула полезна, когда данные недоступны, но есть опубликованный отчет, поскольку U и размеры выборки обычно сообщаются. Используя пример выше с 90 парами, которые отдают предпочтение зайцам, и 10 парами, которые отдают предпочтение черепахе, U 2 является меньшим из двух, поэтому U 2 = 10 . Эта формула затем дает r = 1 – (2×10) / (10×10) = 0,80 , что является тем же результатом, что и с простой разностной формулой выше.

Связь с другими тестами

Сравнение со студентомт-тест

U -тест Манна-Уитни проверяет нулевую гипотезу о том, что распределение вероятностей случайно выбранного наблюдения из одной группы совпадает с распределением вероятностей случайно выбранного наблюдения из другой группы, против альтернативы, что эти распределения не равны (см. U-тест Манна-Уитни#Предположения и формальная формулировка гипотез). Напротив, t-тест проверяет нулевую гипотезу о равных средних значениях в двух группах против альтернативы неравных средних значений. Следовательно, за исключением особых случаев, U - тест Манна-Уитни и t-тест не проверяют одни и те же гипотезы и должны сравниваться с учетом этого.

Порядковые данные
U- критерий Манна-Уитни предпочтительнее t -критерия, когда данные являются порядковыми , но не интервальными, и в этом случае расстояние между соседними значениями шкалы нельзя считать постоянным.
Надежность
Поскольку он сравнивает суммы рангов, [24] U- тест Манна-Уитни с меньшей вероятностью, чем t -тест, будет ложно указывать на значимость из-за наличия выбросов . Однако U- тест Манна-Уитни может иметь худший контроль ошибок типа I , когда данные являются как гетероскедастическими, так и ненормальными. [25]
Эффективность
Когда нормальность сохраняется, U- тест Манна-Уитни имеет (асимптотическую) эффективность 3/ π или около 0,95 по сравнению с t -тестом. [26] Для распределений, достаточно далеких от нормального, и для достаточно больших размеров выборки U- тест Манна-Уитни значительно эффективнее, чем t . [27] Это сравнение эффективности, однако, следует интерпретировать с осторожностью, поскольку Манн-Уитни и t-тест не проверяют одни и те же величины. Если, например, основной интерес представляет разница групповых средних, то тест Манна-Уитни не является подходящим. [28]

U- тест Манна-Уитни даст очень похожие результаты, что и выполнение обычного параметрического двухвыборочного t -теста по ранжированию данных. [29]

Различные дистрибуции

U- тест Манна-Уитни недействителен для проверки нулевой гипотезы против альтернативной гипотезы ), без предположения, что распределения одинаковы при нулевой гипотезе (т.е., предполагая ). [2] Для проверки между этими гипотезами доступны лучшие тесты. Среди них тест Бруннера-Мунцеля и тест Флигнера-Поличелло. [31] В частности, при более общей нулевой гипотезе U- тест Манна-Уитни может иметь завышенные показатели ошибок первого рода даже в больших выборках (особенно если дисперсии двух популяций неравны и размеры выборок различны), проблема, которую решают лучшие альтернативы. [32] В результате было предложено использовать одну из альтернатив (в частности, тест Бруннера-Мунцеля), если нельзя предположить, что распределения равны при нулевой гипотезе. [32]

Альтернативы

Если требуется простая интерпретация сдвига, U- тест Манна-Уитни не следует использовать, когда распределения двух выборок сильно различаются, поскольку он может дать ошибочную интерпретацию значимых результатов. [33] В этой ситуации версия t -теста с неравными дисперсиями может дать более надежные результаты.

Аналогично, некоторые авторы (например, Коновер [ полная ссылка необходима ] ) предлагают преобразовывать данные в ранги (если они еще не ранги) и затем выполнять t -тест на преобразованных данных, причем версия t -теста используется в зависимости от того, предполагается ли, что дисперсии генеральной совокупности различаются. Ранговые преобразования не сохраняют дисперсии, но дисперсии пересчитываются из выборок после ранговых преобразований.

Тест Брауна-Форсайта был предложен как подходящий непараметрический эквивалент F -теста для равных дисперсий. [ необходима ссылка ]

Более мощным тестом является тест Бруннера-Мюнцеля , превосходящий U- тест Манна-Уитни в случае нарушенного предположения о взаимозаменяемости. [34]

U- тест Манна-Уитни является частным случаем модели пропорциональных шансов , допускающим ковариационную корректировку. [35]

См. также тест Колмогорова–Смирнова .

Статистика по соответствующим тестам

тау Кендалла

Тест Манна–Уитни U связан с рядом других непараметрических статистических процедур. Например, он эквивалентен коэффициенту корреляции тау Кендалла, если одна из переменных является бинарной (то есть может принимать только два значения). [ необходима цитата ]

Реализации программного обеспечения

Во многих программных пакетах тест Манна-Уитни U (гипотезы равных распределений против соответствующих альтернатив) был плохо документирован. Некоторые пакеты неправильно обрабатывают связи или не документируют асимптотические методы (например, коррекцию непрерывности). В обзоре 2000 года обсуждались некоторые из следующих пакетов: [36]

История

Статистика появилась в статье 1914 года [40] немца Густава Дойхлера (с пропущенным членом в дисперсии).

В одной статье в 1945 году Фрэнк Уилкоксон предложил [41] как одновыборочный знаковый ранговый тест, так и двухвыборочный ранговый суммарный тест в тесте значимости с нулевой гипотезой точки против его дополнительной альтернативы (то есть, равно против не равно). Однако он свел в таблицу только несколько точек для случая равного размера выборки в этой статье (хотя в более поздней статье он привел более крупные таблицы).

Тщательный анализ статистики, включающий рекуррентность, позволяющую вычислять хвостовые вероятности для произвольных размеров выборки, и таблицы для размеров выборки восемь или меньше, появился в статье Генри Манна и его ученика Дональда Рэнсома Уитни в 1947 году. [1] В этой статье обсуждались альтернативные гипотезы, включая стохастическое упорядочение (где кумулятивные функции распределения удовлетворяют точечному неравенству F X ( t ) < F Y ( t ) ). В этой статье также были вычислены первые четыре момента и установлена ​​предельная нормальность статистики при нулевой гипотезе, таким образом устанавливая, что она асимптотически свободна от распределения.

Смотрите также

Примечания

  1. ^ ab Mann, Henry B. ; Whitney, Donald R. (1947). «О проверке того, является ли одна из двух случайных величин стохастически большей, чем другая». Annals of Mathematical Statistics . 18 (1): 50–60. doi : 10.1214/aoms/1177730491 . MR  0022058. Zbl  0041.26103.
  2. ^ ab Fay, Michael P.; Proschan, Michael A. (2010). «Wilcoxon–Mann–Whitney или t-тест? О предположениях для проверки гипотез и множественных интерпретациях правил принятия решений». Statistics Surveys . 4 : 1–39. doi :10.1214/09-SS051. MR  2595125. PMC 2857732. PMID  20414472 . 
  3. ^ [1], см. таблицу 2.1 Pratt (1964) "Robustness of Some Procedures for the Two-Sample Location Problem". Журнал Американской статистической ассоциации. 59 (307): 655–680. Если два распределения нормальны с одинаковым средним, но разными дисперсиями, то Pr[ X  >  Y ] = Pr[ Y  <  X ], но размер теста Манна–Уитни может быть больше номинального уровня. Поэтому мы не можем определить нулевую гипотезу как Pr[ X  >  Y ] = Pr[ Y  <  X ] и получить действительный тест.
  4. ^ Дивайн, Джордж У.; Нортон, Х. Джеймс; Барон, Анна Э.; Хуарес-Колунга, Элизабет (2018). «Процедура Уилкоксона–Манна–Уитни не годится в качестве теста медиан». The American Statistician . 72 (3): 278–286. doi : 10.1080/00031305.2017.1305291 .
  5. ^ Конрой, Ронан (2012). «Какие гипотезы на самом деле проверяют «непараметрические» двухгрупповые тесты?». Stata Journal . 12 (2): 182–190. doi : 10.1177/1536867X1201200202 . S2CID  118445807. Получено 24 мая 2021 г.
  6. ^ Харт, Анна (2001). «Тест Манна–Уитни — это не просто тест медиан: различия в разбросе могут быть важны». BMJ . 323 (7309): 391–393. doi : 10.1136/bmj.323.7309.391 . PMC 1120984 . PMID  11509435. 
  7. ^ Бостонский университет (SPH), 2017
  8. ^ Мейсон, С. Дж., Грэм, Н. Э. (2002). «Области под кривыми относительных рабочих характеристик (ROC) и относительных рабочих уровней (ROL): статистическая значимость и интерпретация». Quarterly Journal of the Royal Meteorological Society . 128 (584): 2145–2166. doi :10.1256/003590002320603584. ISSN  1477-870X.
  9. ^ Фосетт, Том (2006); Введение в анализ ROC , Pattern Recognition Letters, 27, 861–874.
  10. ^ Hand, David J.; Till, Robert J. (2001). «Простое обобщение площади под кривой ROC для задач классификации нескольких классов». Machine Learning . 45 (2): 171–186. doi : 10.1023/A:1010920819831 .
  11. ^ Зар, ​​Джерролд Х. (1998). Биостатистический анализ . Нью-Джерси: Prentice Hall International, INC. стр. 147. ISBN 978-0-13-082390-8.
  12. ^ Фриц, Кэтрин О.; Моррис, Питер Э.; Ричлер, Дженнифер Дж. (2012). «Оценки размера эффекта: текущее использование, расчеты и интерпретация». Журнал экспериментальной психологии: Общие сведения . 141 (1): 2–18. doi :10.1037/a0024338. ISSN  1939-2222. PMID  21823805.
  13. ^ Майлз Холландер; Дуглас А. Вулф (1999). Непараметрические статистические методы (2-е изд.). Wiley-Interscience. ISBN 978-0471190455.
  14. ^ ab Siegal, Sidney (1956). Непараметрическая статистика для поведенческих наук . McGraw-Hill. стр. 121.{{cite book}}: CS1 maint: числовые имена: список авторов ( ссылка )
  15. ^ Леманн, Эрих; Д'Абрера, Ховард (1975). Непараметрика: статистические методы, основанные на рангах . Холден-Дэй. стр. 20.{{cite book}}: CS1 maint: числовые имена: список авторов ( ссылка )
  16. ^ Уилкинсон, Леланд (1999). «Статистические методы в журналах по психологии: Руководства и пояснения». American Psychologist . 54 (8): 594–604. doi :10.1037/0003-066X.54.8.594.
  17. ^ Накагава, Шиничи; Катхилл, Иннес С. (2007). «Размер эффекта, доверительный интервал и статистическая значимость: практическое руководство для биологов». Биологические обзоры Кембриджского философского общества . 82 (4): 591–605. doi :10.1111/j.1469-185X.2007.00027.x. PMID  17944619. S2CID  615371.
  18. ^ ab Kerby, DS (2014). "Простая формула разности: подход к обучению непараметрической корреляции". Comprehensive Psychology . 3 : 11.IT.3.1. doi : 10.2466/11.IT.3.1 (неактивен 2024-06-02). S2CID  120622013.{{cite journal}}: CS1 maint: DOI неактивен по состоянию на июнь 2024 г. ( ссылка )
  19. ^ ab McGraw, KO; Wong, JJ (1992). "Статистика размера эффекта общего языка". Psychological Bulletin . 111 (2): 361–365. doi :10.1037/0033-2909.111.2.361.
  20. ^ Гриссом Р. Дж. (1994). «Статистический анализ порядкового категориального статуса после терапии». Журнал консультационной и клинической психологии . 62 (2): 281–284. doi :10.1037/0022-006X.62.2.281. PMID  8201065.
  21. ^ Herrnstein, Richard J.; Loveland, Donald H.; Cable, Cynthia (1976). «Естественные концепции у голубей». Журнал экспериментальной психологии: процессы поведения животных . 2 (4): 285–302. doi :10.1037/0097-7403.2.4.285. PMID  978139.
  22. ^ Cureton, EE (1956). «Рангово-бисериальная корреляция». Psychometrika . 21 (3): 287–290. doi :10.1007/BF02289138. S2CID  122500836.
  23. ^ Вендт, Х. В. (1972). «Решение общей проблемы в социальных науках: упрощенный рангово-бисериальный коэффициент корреляции на основе статистики U ». Европейский журнал социальной психологии . 2 (4): 463–465. doi :10.1002/ejsp.2420020412.
  24. ^ Мотульский, Харви Дж.; Руководство по статистике , Сан-Диего, Калифорния: GraphPad Software, 2007, стр. 123
  25. ^ Циммерман, Дональд В. (1998-01-01). «Недействительность параметрических и непараметрических статистических тестов при одновременном нарушении двух предположений». Журнал экспериментального образования . 67 (1): 55–68. doi :10.1080/00220979809598344. ISSN  0022-0973.
  26. ^ Лехамн, Эрих Л.; Элементы теории больших выборок , Springer, 1999, стр. 176
  27. ^ Коновер, Уильям Дж.; Практическая непараметрическая статистика, John Wiley & Sons, 1980 (2-е издание), стр. 225–226.
  28. ^ Ламли, Томас; Диер, Паула ; Эмерсон, Скотт; Чен, Лу (май 2002 г.). «Важность предположения о нормальности в больших наборах данных общественного здравоохранения». Ежегодный обзор общественного здравоохранения . 23 (1): 151–169. doi : 10.1146/annurev.publhealth.23.100901.140546 . ISSN  0163-7525. PMID  11910059.
  29. ^ Коновер, Уильям Дж.; Иман, Рональд Л. (1981). «Ранговые преобразования как мост между параметрической и непараметрической статистикой». Американский статистик . 35 (3): 124–129. doi :10.2307/2683975. JSTOR  2683975.
  30. ^ Ваарт, А. В. ван дер (1998-10-13). Асимптотическая статистика. Cambridge University Press. doi :10.1017/cbo9780511802256. ISBN 978-0-511-80225-6.
  31. ^ Бруннер, Эдгар; Батке, Арне К.; Коничек, Франк (2018). Ранговые и псевдоранговые процедуры для независимых наблюдений в факторных планах: использование R и SAS. Springer Series in Statistics. Cham: Springer International Publishing. doi : 10.1007/978-3-030-02914-2. ISBN 978-3-030-02912-8.
  32. ^ ab Karch, Julian D. (2021). «Психологи должны использовать тест Бруннера–Мунцеля вместо U-теста Манна–Уитни в качестве непараметрической процедуры по умолчанию». Достижения в методах и практиках психологической науки . 4 (2). doi : 10.1177/2515245921999602 . hdl : 1887/3209569 . ISSN  2515-2459.
  33. ^ Касуя, Эйити (2001). « U- тест Манна–Уитни при неравных дисперсиях». Animal Behaviour . 61 (6): 1247–1249. doi :10.1006/anbe.2001.1691. S2CID  140209347.
  34. ^ Карч, Джулиан (2021). «Психологи должны использовать тест Бруннера–Мунцеля вместо U-теста Манна–Уитни в качестве непараметрической процедуры по умолчанию». Достижения в методах и практиках психологической науки . 4 (2). doi : 10.1177/2515245921999602. hdl : 1887/3209569 . S2CID  235521799.
  35. ^ Харрелл, Фрэнк (20 сентября 2020 г.). «Нарушение пропорциональных коэффициентов не является фатальным». {{cite journal}}: Цитировать журнал требует |journal=( помощь )
  36. ^ Бергманн, Рейнхард; Ладбрук, Джон; Спорен, Уилл PJM (2000). «Различные результаты теста Вилкоксона–Манна–Уитни из разных статистических пакетов». Американский статистик . 54 (1): 72–77. doi :10.1080/00031305.2000.10474513. JSTOR  2685616. S2CID  120473946.
  37. ^ "scipy.stats.mannwhitneyu". Справочное руководство SciPy v0.16.0 . Сообщество Scipy. 24 июля 2015 г. Получено 11 сентября 2015 г. scipy.stats.mannwhitneyu(x, y, use_continuity=True): Вычисляет ранговый тест Манна-Уитни для выборок x и y.
  38. ^ "MannWhitneyUTest (API Apache Commons Math 3.3)". commons.apache.org .
  39. ^ "JuliaStats/HypothesisTests.jl". GitHub . 30 мая 2021 г.
  40. ^ Крускал, Уильям Х. (сентябрь 1957 г.). «Исторические заметки о непарном двухвыборочном тесте Вилкоксона». Журнал Американской статистической ассоциации . 52 (279): 356–360. doi :10.2307/2280906. JSTOR  2280906.
  41. ^ Уилкоксон, Фрэнк (1945). «Индивидуальные сравнения с помощью методов ранжирования». Biometrics Bulletin . 1 (6): 80–83. doi :10.2307/3001968. hdl : 10338.dmlcz/135688 . JSTOR  3001968.

Ссылки

Внешние ссылки