stringtranslate.com

U-тест Манна-Уитни

Критерий Манна-Уитни (также называемый критерием Манна-Уитни-Уитни ( MWW/MWU ), критерием суммы рангов Уилкоксона или критерием Уилкоксона-Манна-Уитни ) — это непараметрический тест нулевой гипотезы , которая для случайно выбранных значений X и Y из двух популяций вероятность того, что X больше Y , равна вероятности того, что Y больше  X .

Непараметрические критерии, используемые для двух зависимых выборок, — это знаковый критерий и знаково-ранговый критерий Уилкоксона .

Предположения и формальная формулировка гипотез

Хотя Генри Манн и Дональд Рэнсом Уитни [1] разработали U -критерий Манна-Уитни в предположении непрерывных ответов с альтернативной гипотезой , заключающейся в том, что одно распределение стохастически больше другого, существует много других способов сформулировать нулевую и альтернативную гипотезы. так что U -критерий Манна – Уитни даст действительный тест. [2]

В очень общей формулировке предполагается, что:

  1. Все наблюдения обеих групп независимы друг от друга,
  2. Ответы как минимум порядковые (т. е. можно сказать, по крайней мере, из любых двух наблюдений, какое из них больше),
  3. При нулевой гипотезе H 0 распределения обеих популяций идентичны. [3]
  4. Альтернативная гипотеза H 1 состоит в том, что распределения не идентичны.

Согласно общей формулировке, тест является состоятельным только тогда, когда при H 1 происходит следующее :

  1. Вероятность того, что наблюдение из популяции X превысит наблюдение из популяции Y, отличается (больше или меньше), чем вероятность того, что наблюдение из Y превысит наблюдение из X ; т. е. P( X > Y ) ≠ P( Y > X ) или P ( X > Y ) + 0,5 · P ( X = Y ) ≠ 0,5 .

При более строгих предположениях, чем общая формулировка, приведенная выше, например, если предполагается, что реакции непрерывны, а альтернатива ограничена сдвигом местоположения, т. е. F 1 ( x ) = F 2 ( x + δ ) , мы можем интерпретировать значительный U - критерий Манна-Уитни, показывающий разницу в медианах. В соответствии с этим предположением о смещении местоположения мы также можем интерпретировать U- критерий Манна-Уитни как оценку того, отличается ли оценка Ходжеса-Лемана разницы в центральной тенденции между двумя популяциями от нуля. Оценка Ходжеса -Лемана для этой задачи с двумя выборками представляет собой медиану всех возможных различий между наблюдением в первой выборке и наблюдением во второй выборке.

В противном случае, если как дисперсии, так и формы распределения обеих выборок различаются, U- критерий Манна – Уитни не проходит проверку медиан. Можно показать примеры, когда медианы численно равны, в то время как тест отклоняет нулевую гипотезу с небольшим значением p. [4] [5] [6]

U -критерий Манна-Уитни /критерий суммы рангов Уилкоксона — это не то же самое, что критерий знакового ранга Уилкоксона , хотя оба они являются непараметрическими и включают суммирование рангов . U -критерий Манна-Уитни применяется к независимым выборкам. Знако-ранговый критерий Уилкоксона применяется к совпадающим или зависимым выборкам.

статистика

Пусть это выборка iid из и выборка iid из , и обе выборки независимы друг от друга. Соответствующая U - статистика Манна – Уитни определяется как меньшая из:

с

представляет собой сумму рангов в группах 1 и 2 соответственно. [7]

Статистика площади под кривой (AUC) для кривых ROC

Статистика U связана с площадью под кривой рабочей характеристики приемника ( AUC ): [8]

Обратите внимание, что это то же определение, что и размер эффекта общего языка из раздела выше. т.е. вероятность того, что классификатор поставит случайно выбранный положительный экземпляр выше, чем случайно выбранный отрицательный (при условии, что «положительный» ранг выше, чем «отрицательный»). [9]

Благодаря своей вероятностной форме статистика U может быть обобщена до меры способности разделения классификатора для более чем двух классов: [10]

Где c — количество классов, а член R k , AUC k , учитывает только ранжирование элементов, принадлежащих классам k и (т. е. элементы, принадлежащие всем другим классам, игнорируются) согласно оценкам классификатора. вероятности того, что эти предметы принадлежат классу k . AUC k , k всегда будет равна нулю, но, в отличие от двухклассного случая, обычно AUC k , ≠ AUC , k , поэтому сумма показателей M суммируется по всем ( k , ) парам, фактически используя среднее значение AUC k , и AUC , k .

Расчеты

Тест включает в себя вычисление статистики , обычно называемой U , распределение которой при нулевой гипотезе известно. В случае небольших выборок распределение записывается в таблицу, но для размеров выборки более ~20 аппроксимация с использованием нормального распределения достаточно хороша. В некоторых книгах статистические данные, эквивалентные U , представлены в таблицах, например, сумма рангов в одной из выборок, а не сама U.

U -критерий Манна-Уитни включен в большинство современных статистических пакетов . Его также легко рассчитать вручную, особенно для небольших выборок. Есть два способа сделать это.

Способ первый:

Для сравнения двух небольших наборов наблюдений прямой метод является быстрым и дает представление о значении статистики U , которая соответствует количеству побед во всех парных соревнованиях (см. пример черепахи и зайца в разделе «Примеры» ниже). Для каждого наблюдения в одном наборе подсчитайте, сколько раз это первое значение выигрывает у любых наблюдений в другом наборе (другое значение проигрывает, если первое значение больше). При любой ничьей отсчитывайте 0,5. Сумма побед и ничьих равна U (т.е.: ) для первого сета. U для другого набора является обратным (т.е.: ).

Способ второй:

Для более крупных образцов:

  1. Присвойте числовые ранги всем наблюдениям (поместите наблюдения из обеих групп в один набор), начиная с 1 для наименьшего значения. При наличии групп связанных значений присвойте ранг, равный середине нескорректированных рейтингов (например, ранги (3, 5, 5, 5, 5, 8) равны (1, 3,5, 3,5, 3,5, 3,5, 6). ) , где нескорректированные ранги будут (1, 2, 3, 4, 5, 6) ).
  2. Теперь сложите ранги наблюдений, полученных из выборки 1. Теперь определена сумма рангов в выборке 2, поскольку сумма всех рангов равна N ( N + 1)/2 , где N — общее количество наблюдений. .
  3. Тогда U определяется следующим образом: [11]
где n 1 — размер выборки для выборки 1, а R 1 — сумма рангов в выборке 1.
Обратите внимание, что не имеет значения, какой из двух образцов считается образцом 1. Столь же верная формула для U :
Меньшее значение U 1 и U 2 используется при просмотре таблиц значимости. Сумма двух значений определяется выражением
Зная, что R 1 + R 2 = N ( N + 1)/2 и N = n 1 + n 2 , и занимаясь алгеброй , мы находим, что сумма равна
U 1 + U 2 знак равно п 1 п 2 .

Характеристики

Максимальное значение U представляет собой произведение размеров выборки для двух выборок (т.е.: ). В таком случае «другой» U будет равен 0.

Примеры

Иллюстрация методов расчета

Предположим, что Эзоп недоволен своим классическим экспериментом , в котором было обнаружено, что одна черепаха победила одного зайца в гонке, и решает провести проверку значимости, чтобы выяснить, можно ли распространить результаты на черепах и зайцев в целом. Он собирает выборку из 6 черепах и 6 зайцев и заставляет их всех участвовать в забеге одновременно. Порядок, в котором они достигают финишной стойки (их ранг, от первого до последнего пересечения финишной черты), следующий: T обозначает черепаху, а H — зайца:

ЭТЭТТТТТТТТТ

Какова ценность У ?

ранжируйте животных по времени, которое им потребуется на прохождение курса, поэтому присвойте первому приюту для животных ранг 12, второму ранг 11 и так далее.
сумма рангов, достигнутых черепахами, равна 12 + 6 + 5 + 4 + 3 + 2 = 32 .
Следовательно, U T = 32 — (6×7)/2 = 32 — 21 = 11 (так же, как и первый метод).
Сумма рангов, достигнутых зайцами, равна 11 + 10 + 9 + 8 + 7 + 1 = 46 , что приводит к U H = 46 - 21 = 25 .

Пример отчета о результатах

Сообщая о результатах U- теста Манна-Уитни, важно указать: [12]

На практике некоторая часть этой информации, возможно, уже была предоставлена, и при принятии решения о ее повторении следует руководствоваться здравым смыслом. Типичный отчет может выглядеть следующим образом:

«Средние задержки в группах E и C составляли 153 и 247 мс; распределения в двух группах значительно различались (Mann-Whitney U = 10,5 , n 1 = n 2 = 8 , P <0,05 двусторонний)».

Утверждение, которое полностью отражает статистический статус теста, может звучать так:

«Результаты двух методов лечения сравнивались с использованием двухвыборочного критерия суммы рангов Уилкоксона-Манна-Уитни. Эффект лечения (разница между методами лечения) оценивался количественно с использованием оценщика Ходжеса-Лемана (HL), который согласуется с критерием Вилкоксона. [13] Эта оценка (HLΔ) представляет собой медиану всех возможных различий в результатах между субъектом в группе B и субъектом в группе A. Эти оценки сопровождаются непараметрическим доверительным интервалом 0,95 для HLΔ, а также ρ, оценкой вероятность того, что случайно выбранный субъект из популяции B имеет более высокий вес, чем случайно выбранный субъект из популяции A. Средний вес [квартилей] для субъектов, получающих лечение A и B соответственно, составляет 147 [121, 177] и 151 [130, 180] ] кг. Лечение А уменьшило вес на HLΔ = 5 кг (0,95 CL [2, 9] кг, 2 P = 0,02 , ρ = 0,58 )».

Однако редко можно найти столь обширный отчет в документе, основной темой которого не были бы статистические выводы.

Нормальное приближение и коррекция связи

Для больших выборок U имеет примерно нормальное распределение . В этом случае стандартизированное значение

где m U и σ U — среднее значение и стандартное отклонение U , примерно соответствует стандартному нормальному отклонению, значимость которого можно проверить по таблицам нормального распределения. m U и σ U определяются выражениями

[14] и
[14]

Формула стандартного отклонения усложняется при наличии связанных рангов. Если есть связи в рангах, σ следует скорректировать следующим образом:

[15]

где левая часть — это просто дисперсия, а правая — поправка на связи, t k — количество связей для k -го ранга, а K — общее количество уникальных рангов со связями.

Более эффективная в вычислительном отношении форма с вычетом n 1 n 2 /12 :

где п знак равно п 1 + п 2 .

Если количество связей невелико (и особенно если нет больших связующих полос), связи можно не учитывать при выполнении расчетов вручную. Компьютерные статистические пакеты будут регулярно использовать правильно скорректированную формулу.

Обратите внимание, что поскольку U 1 + U 2 = n 1 n 2 , среднее значение n 1 n 2 /2 , используемое в нормальном приближении, является средним из двух значений U . Следовательно, абсолютное значение рассчитанной z -статистики будет одинаковым, какое бы значение U ни использовалось.

Размеры эффекта

Ученым широко рекомендуется сообщать о величине эффекта для логического теста. [16] [17]

Доля согласия среди всех пар

Следующие три меры эквивалентны.

Размер эффекта общего языка

Одним из методов сообщения о размере эффекта для U - критерия Манна-Уитни является использование f , размера общего языкового эффекта. [18] [19] В качестве выборочной статистики величина эффекта общего языка вычисляется путем формирования всех возможных пар между двумя группами, а затем определения доли пар, которые поддерживают определенное направление (скажем, что элементы из группы 1 больше, чем элементы из группы 2). [19] Для иллюстрации: в исследовании с выборкой из десяти зайцев и десяти черепах общее количество заказанных пар составляет десять раз по десять или 100 пар зайцев и черепах. Предположим, результаты показывают, что заяц бежал быстрее черепахи в 90 из 100 пар выборки; в этом случае величина эффекта общего языка выборки составляет 90%. Это значение выборки представляет собой несмещенную оценку ценности совокупности, поэтому выборка предполагает, что наилучшая оценка размера эффекта общего языка среди населения составляет 90%. [20]

Связь между f и U Манна – Уитни (в частности ) следующая:

Это то же самое, что площадь под кривой (AUC) для кривой ROC.

ρ статистика

Статистика под названием ρ , которая линейно связана с U и широко используется в исследованиях категоризации ( обучение распознаванию понятий ) и в других местах, [21] рассчитывается путем деления U на его максимальное значение для заданных размеров выборки, которое просто n 1 × п 2 . Таким образом, ρ является непараметрической мерой перекрытия двух распределений; он может принимать значения от 0 до 1 и представляет собой оценку P( Y > X ) + 0,5 P( Y = X ) , где X и Y — случайно выбранные наблюдения из двух распределений. Оба крайних значения представляют собой полное разделение распределений, а значение ρ , равное 0,5, представляет собой полное перекрытие. Полезность статистики ρ можно увидеть в случае нечетного примера, использованного выше, где два распределения, которые значительно различались по U -критерию Манна-Уитни, тем не менее, имели почти одинаковые медианы: значение ρ в этом случае составляет примерно 0,723 в пользу зайцев, что правильно отражает тот факт, что, хотя средняя черепаха победила среднего зайца, в совокупности зайцы показали лучшие результаты, чем черепахи вместе взятые. [ нужна цитата ]

Ранг-бисериальная корреляция

Метод сообщения о величине эффекта для U - критерия Манна-Уитни основан на использовании меры ранговой корреляции , известной как ранговая бисерийная корреляция. Эдвард Кюртон представил и назвал эту меру. [22] Как и другие корреляционные меры, двухрядная корреляция может варьироваться от минус одного до плюс одного, при этом нулевое значение указывает на отсутствие связи.

Существует простая формула разности для вычисления ранговой бисериальной корреляции на основе размера общего языкового эффекта: корреляция представляет собой разницу между долей пар, благоприятных для гипотезы ( f ), минус ее дополнение (т. е.: доля, которая является неблагоприятной ( u )). Эта простая формула разности представляет собой разницу в величине общего языкового эффекта каждой группы и выглядит следующим образом: [18]

Например, рассмотрим пример, где зайцы бегают быстрее черепах в 90 из 100 пар. Размер эффекта общего языка составляет 90%, поэтому двухрядная корреляция равна 90% минус 10%, а двухрядная корреляция  r = 0,80 .

Альтернативную формулу для рангового бисериала можно использовать для его расчета на основе U Манна – Уитни (либо или ) и размеров выборки каждой группы: [23]

Эта формула полезна, когда данные недоступны, но когда есть опубликованный отчет, поскольку U и размеры выборки сообщаются регулярно. Если использовать приведенный выше пример с 90 парами, предпочитающими зайцев, и 10 парами, предпочитающими черепаху, U 2 будет меньшим из двух, поэтому U 2 = 10 . Затем эта формула дает r = 1 – (2×10)/(10×10) = 0,80 , что является тем же результатом, что и для простой формулы разности, приведенной выше.

Связь с другими тестами

Сравнение с t -критерием Стьюдента

U -критерий Манна-Уитни проверяет нулевую гипотезу о том, что распределение вероятностей случайно выбранного наблюдения из одной группы такое же, как распределение вероятностей случайно выбранного наблюдения из другой группы, против альтернативы, согласно которой эти распределения не равны (см. U-тест Манна – Уитни # Предположения и формальная формулировка гипотез). Напротив, t-критерий проверяет нулевую гипотезу о равных средних в двух группах по сравнению с альтернативой о неравных средних. Следовательно, за исключением особых случаев, U -критерий Манна-Уитни и t-критерий не проверяют одни и те же гипотезы, и их следует учитывать с учетом этого.

Порядковые данные
U -критерий Манна-Уитни предпочтительнее t -критерия, когда данные имеют порядковый номер , но не масштабированы по интервалам, и в этом случае расстояние между соседними значениями шкалы не может считаться постоянным.
Надежность
При сравнении сумм рангов [24] U- критерий Манна-Уитни с меньшей вероятностью, чем t -критерий, будет ложно указывать на значимость из-за наличия выбросов . Однако U -критерий Манна-Уитни может иметь худший контроль ошибок типа I, когда данные одновременно гетероскедастичны и ненормальны. [25]
Эффективность
Когда сохраняется нормальность, U -критерий Манна-Уитни имеет (асимптотическую) эффективность 3/ π или около 0,95 по сравнению с t -тестом. [26] Для распределений, достаточно далеких от нормального, и для достаточно больших размеров выборки, U- критерий Манна-Уитни значительно более эффективен, чем t . [27] Однако это сравнение эффективности следует интерпретировать с осторожностью, поскольку Манн-Уитни и t-критерий не проверяют одни и те же величины. Если, например, основной интерес представляет разница групповых средних, критерий Манна-Уитни не подходит. [28]

U -критерий Манна-Уитни даст результаты, очень похожие на результаты обычного параметрического двухвыборочного t -теста для ранжирования данных. [29]

Различные дистрибутивы

U -критерий Манна-Уитни недействителен для проверки нулевой гипотезы в сравнении с альтернативной гипотезой без предположения, что распределения одинаковы при нулевой гипотезе (т. е. при условии, что ). [2] Для проверки этих гипотез существуют более эффективные тесты. Среди них тест Бруннера-Мюнцеля и тест Флиннера-Поличелло. [31] В частности, согласно более общей нулевой гипотезе , U -критерий Манна-Уитни может иметь завышенную частоту ошибок типа I даже в больших выборках (особенно, если дисперсии двух совокупностей неравны и размеры выборки различны), проблема, лучшие альтернативы решают. [32] В результате было предложено использовать одну из альтернатив (в частности, критерий Бруннера-Мюнцеля), если нельзя предположить, что распределения равны при нулевой гипотезе. [32]

Альтернативы

Если кто-то хочет получить простую интерпретацию сдвига, не следует использовать U- критерий Манна-Уитни, когда распределения двух выборок сильно различаются, поскольку он может дать ошибочную интерпретацию значимых результатов. [33] В этой ситуации версия t -критерия с неравными дисперсиями может дать более надежные результаты.

Аналогичным образом, некоторые авторы (например, Коновер [ нужна полная ссылка ] ) предлагают преобразовать данные в ранги (если они еще не являются рангами), а затем выполнить t -тест для преобразованных данных, причем используемая версия t -теста зависит от независимо от того, предполагается ли, что дисперсия генеральной совокупности различна. Преобразования рангов не сохраняют дисперсии, но дисперсии пересчитываются из выборок после преобразований рангов.

Тест Брауна-Форсайта был предложен в качестве подходящего непараметрического эквивалента F -теста для равных дисперсий. [ нужна цитата ]

Более мощный тест — это тест Бруннера-Мюнцеля , превосходящий U- критерий Манна-Уитни в случае нарушения предположения об обменности. [34]

U -тест Манна-Уитни представляет собой частный случай модели пропорциональных шансов , позволяющий корректировать ковариаты. [35]

См. также тест Колмогорова–Смирнова .

Связанная статистика тестов

тау Кендалла

U -критерий Манна-Уитни связан с рядом других непараметрических статистических процедур. Например, он эквивалентен тау-коэффициенту корреляции Кендалла , если одна из переменных является двоичной (то есть может принимать только два значения). [ нужна цитата ]

Реализации программного обеспечения

Во многих пакетах программного обеспечения U- критерий Манна-Уитни (гипотезы о равном распределении соответствующих альтернатив) плохо документирован. Некоторые пакеты неправильно обрабатывают связи или не документируют асимптотические методы (например, поправку на непрерывность). В обзоре 2000 года обсуждались некоторые из следующих пакетов: [36]

История

Статистика появилась в 1914 году в статье [40] немца Густава Дойхлера (с отсутствующим членом в дисперсии).

В единственной статье в 1945 году Фрэнк Уилкоксон предложил [41] как критерий знакового ранга с одной выборкой, так и критерий суммы рангов с двумя выборками, в тесте значимости с точечной нулевой гипотезой против ее дополнительной альтернативы (т. е. равенства против не равный). Однако в этой статье он свел в таблицы лишь несколько пунктов для случая равного размера выборки (хотя в более поздней статье он привел таблицы большего размера).

Тщательный анализ статистики, который включал повторение, позволяющее вычислить хвостовые вероятности для произвольных размеров выборки, и таблицы для выборок размером восемь или менее, появился в статье Генри Манна и его ученика Дональда Рэнсома Уитни в 1947 году . в статье обсуждались альтернативные гипотезы, включая стохастическое упорядочение (где кумулятивные функции распределения удовлетворяют точечному неравенству F X ( t ) < F Y ( t ) ). В этой статье также были вычислены первые четыре момента и установлена ​​предельная нормальность статистики при нулевой гипотезе, тем самым установив, что она асимптотически свободна от распределения.

Смотрите также

Примечания

  1. ^ аб Манн, Генри Б .; Уитни, Дональд Р. (1947). «О проверке того, является ли одна из двух случайных величин стохастически больше другой». Анналы математической статистики . 18 (1): 50–60. дои : 10.1214/aoms/1177730491 . МР  0022058. Збл  0041.26103.
  2. ^ аб Фэй, Майкл П.; Прощан, Майкл А. (2010). «Уилкоксона – Манна – Уитни или t-критерий? О предположениях для проверки гипотез и множественных интерпретациях правил принятия решений». Статистические опросы . 4 : 1–39. дои : 10.1214/09-SS051. МР  2595125. ПМЦ 2857732 . ПМИД  20414472. 
  3. ^ [1], см. таблицу 2.1 книги Пратта (1964) «Надежность некоторых процедур для задачи размещения двух выборок». Журнал Американской статистической ассоциации. 59 (307): 655–680. Если два распределения нормальны с одинаковым средним значением, но разными дисперсиями, то Pr[ X  >  Y ] = Pr[ Y  <  X ], но размер теста Манна – Уитни может быть больше номинального уровня. Поэтому мы не можем определить нулевую гипотезу как Pr[ X  >  Y ] = Pr[ Y  <  X ] и получить валидный тест.
  4. ^ Дивайн, Джордж В.; Нортон, Х. Джеймс; Барон, Анна Э.; Хуарес-Колунга, Элизабет (2018). «Процедура Уилкоксона-Манна-Уитни не удалась при проверке медиан». Американский статистик . 72 (3): 278–286. дои : 10.1080/00031305.2017.1305291 .
  5. ^ Конрой, Ронан (2012). «Какие гипотезы на самом деле проверяют «непараметрические» двухгрупповые тесты?». Статический журнал . 12 (2): 182–190. дои : 10.1177/1536867X1201200202 . S2CID  118445807 . Проверено 24 мая 2021 г.
  6. ^ Харт, Анна (2001). «Тест Манна-Уитни - это не просто тест медиан: различия в разбросе могут быть важны». БМЖ . 323 (7309): 391–393. дои : 10.1136/bmj.323.7309.391 . ПМЦ 1120984 . 
  7. ^ Бостонский университет (SPH), 2017 г.
  8. ^ Мейсон, С.Дж., Грэм, штат Невада (2002). «Области под кривыми относительных рабочих характеристик (ROC) и относительных рабочих уровней (ROL): статистическая значимость и интерпретация». Ежеквартальный журнал Королевского метеорологического общества . 128 (584): 2145–2166. дои : 10.1256/003590002320603584. ISSN  1477-870X.
  9. ^ Фосетт, Том (2006); Введение в ROC-анализ , Письма о распознавании образов, 27, 861–874.
  10. ^ Хэнд, Дэвид Дж.; Тилль, Роберт Дж. (2001). «Простое обобщение площади под кривой ROC для задач классификации нескольких классов». Машинное обучение . 45 (2): 171–186. дои : 10.1023/А:1010920819831 .
  11. ^ Зар, ​​Джеррольд Х. (1998). Биостатистический анализ . Нью-Джерси: Prentice Hall International, INC. с. 147. ИСБН 978-0-13-082390-8.
  12. ^ Фриц, Кэтрин О.; Моррис, Питер Э.; Ричлер, Дженнифер Дж. (2012). «Оценки размера эффекта: текущее использование, расчеты и интерпретация». Журнал экспериментальной психологии: Общие сведения . 141 (1): 2–18. дои : 10.1037/a0024338. ISSN  1939-2222.
  13. ^ Майлз Холландер; Дуглас А. Вулф (1999). Непараметрические статистические методы (2-е изд.). Уайли-Интерсайенс. ISBN 978-0471190455.
  14. ^ аб Сигал, Сидни (1956). Непараметрическая статистика для поведенческих наук . МакГроу-Хилл. п. 121.{{cite book}}: CS1 maint: numeric names: authors list (link)
  15. ^ Леманн, Эрих; Д'Абрера, Ховард (1975). Непараметрические методы: статистические методы, основанные на рангах . Холден-Дэй. п. 20.{{cite book}}: CS1 maint: numeric names: authors list (link)
  16. ^ Уилкинсон, Лиланд (1999). «Статистические методы в психологических журналах: рекомендации и пояснения». Американский психолог . 54 (8): 594–604. дои : 10.1037/0003-066X.54.8.594.
  17. ^ Накагава, Шиничи; Катхилл, Иннес С. (2007). «Размер эффекта, доверительный интервал и статистическая значимость: практическое руководство для биологов». Биологические обзоры Кембриджского философского общества . 82 (4): 591–605. дои : 10.1111/j.1469-185X.2007.00027.x. PMID  17944619. S2CID  615371.
  18. ^ Аб Керби, DS (2014). «Формула простой разницы: подход к обучению непараметрической корреляции». Комплексная психология . 3 : 11.IT.3.1. дои : 10.2466/11.IT.3.1 . S2CID  120622013.
  19. ^ аб МакГроу, КО; Вонг, Джей-Джей (1992). «Статистика размера общего языкового эффекта». Психологический вестник . 111 (2): 361–365. дои : 10.1037/0033-2909.111.2.361.
  20. ^ Гриссом Р.Дж. (1994). «Статистический анализ порядкового категориального статуса после терапии». Журнал консалтинговой и клинической психологии . 62 (2): 281–284. дои : 10.1037/0022-006X.62.2.281. ПМИД  8201065.
  21. ^ Хернштейн, Ричард Дж.; Лавленд, Дональд Х.; Кейбл, Синтия (1976). «Естественные концепции голубей». Журнал экспериментальной психологии: процессы поведения животных . 2 (4): 285–302. дои : 10.1037/0097-7403.2.4.285. ПМИД  978139.
  22. ^ Кюртон, Э.Э. (1956). «Ранг-бисериальная корреляция». Психометрика . 21 (3): 287–290. дои : 10.1007/BF02289138. S2CID  122500836.
  23. ^ Вендт, HW (1972). «Решение распространенной проблемы в социальных науках: упрощенный двухрядный коэффициент корреляции, основанный на статистике U ». Европейский журнал социальной психологии . 2 (4): 463–465. дои : 10.1002/ejsp.2420020412.
  24. ^ Мотульский, Харви Дж.; Руководство по статистике , Сан-Диего, Калифорния: GraphPad Software, 2007, стр. 123
  25. ^ Циммерман, Дональд В. (1 января 1998 г.). «Аннулирование параметрических и непараметрических статистических тестов одновременным нарушением двух предположений». Журнал экспериментального образования . 67 (1): 55–68. дои : 10.1080/00220979809598344. ISSN  0022-0973.
  26. ^ Лехамн, Эрих Л.; Элементы теории больших выборок , Springer, 1999, с. 176
  27. ^ Коновер, Уильям Дж.; Практическая непараметрическая статистика, John Wiley & Sons, 1980 (2-е издание), стр. 225–226.
  28. ^ Ламли, Томас; Дир, Паула ; Эмерсон, Скотт; Чен, Лу (май 2002 г.). «Важность предположения о нормальности в больших наборах данных общественного здравоохранения». Ежегодный обзор общественного здравоохранения . 23 (1): 151–169. doi : 10.1146/annurev.publhealth.23.100901.140546 . ISSN  0163-7525. ПМИД  11910059.
  29. ^ Коновер, Уильям Дж.; Иман, Рональд Л. (1981). «Ранговые преобразования как мост между параметрической и непараметрической статистикой». Американский статистик . 35 (3): 124–129. дои : 10.2307/2683975. JSTOR  2683975.
  30. ^ Ваарт, А.В. ван дер (13 октября 1998 г.). Асимптотическая статистика. Издательство Кембриджского университета. ISBN 978-0-511-80225-6.
  31. ^ Бруннер, Эдгар; Батке, Арне К.; Коничке, Франк (2018). Процедуры рангов и псевдорангов для независимых наблюдений в факторных планах: использование R и SAS. Серия Спрингера по статистике. Чам: Международное издательство Springer. дои : 10.1007/978-3-030-02914-2. ISBN 978-3-030-02912-8.
  32. ^ Аб Карч, Джулиан Д. (2021). «Психологи должны использовать U-тест Бруннера-Мюнцеля вместо U-теста Манна-Уитни в качестве непараметрической процедуры по умолчанию». Достижения в методах и практике психологической науки . 4 (2). дои : 10.1177/2515245921999602 . hdl : 1887/3209569 . ISSN  2515-2459.
  33. ^ Касуя, Эйити (2001). « U -тест Манна – Уитни , когда дисперсии неравны». Поведение животных . 61 (6): 1247–1249. дои : 10.1006/anbe.2001.1691. S2CID  140209347.
  34. ^ Карч, Джулиан (2021). «Психологи должны использовать U-тест Бруннера-Мюнцеля вместо U-теста Манна-Уитни в качестве непараметрической процедуры по умолчанию». Достижения в методах и практике психологической науки . 4 (2). дои : 10.1177/2515245921999602. hdl : 1887/3209569 . S2CID  235521799.
  35. Харрелл, Фрэнк (20 сентября 2020 г.). «Нарушение пропорциональных коэффициентов не смертельно». {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  36. ^ Бергманн, Рейнхард; Ладбрук, Джон; Спурен, Уилл ПиДжем (2000). «Различные результаты теста Уилкоксона – Манна – Уитни из разных статистических пакетов». Американский статистик . 54 (1): 72–77. дои : 10.1080/00031305.2000.10474513. JSTOR  2685616. S2CID  120473946.
  37. ^ "scipy.stats.mannwhitneyu" . Справочное руководство SciPy v0.16.0 . Сообщество Scipy. 24 июля 2015 года . Проверено 11 сентября 2015 г. scipy.stats.mannwhitneyu(x, y, use_continuity=True): вычисляет ранговый критерий Манна-Уитни на выборках x и y.
  38. ^ «MannWhitneyUTest (API Apache Commons Math 3.3)» . commons.apache.org .
  39. ^ "JuliaStats/HypothesisTests.jl" . Гитхаб . 30 мая 2021 г.
  40. ^ Краскал, Уильям Х. (сентябрь 1957 г.). «Исторические заметки о непарном двухвыборочном тесте Уилкоксона». Журнал Американской статистической ассоциации . 52 (279): 356–360. дои : 10.2307/2280906. JSTOR  2280906.
  41. ^ Уилкоксон, Фрэнк (1945). «Индивидуальные сравнения методами ранжирования». Биометрический бюллетень . 1 (6): 80–83. дои : 10.2307/3001968. hdl : 10338.dmlcz/135688 . JSTOR  3001968.

Рекомендации

Внешние ссылки