stringtranslate.com

Гамма Гудмана и Краскала

В статистике гамма Гудмана и Краскала является мерой ранговой корреляции , т. е . сходства порядка данных при ранжировании по каждой из величин. Он измеряет силу связи данных перекрестной таблицы , когда обе переменные измеряются на порядковом уровне . Он не делает никаких корректировок ни по размеру стола, ни по ничьим. Значения варьируются от −1 (100 % отрицательная ассоциация или полная инверсия) до +1 (100 % положительная ассоциация или полное согласие). Нулевое значение указывает на отсутствие ассоциации.

Эта статистика (которая отличается от лямбды Гудмана и Краскала ) названа в честь Лео Гудмана и Уильяма Краскала , которые предложили ее в серии статей с 1954 по 1972 год. [1] [2] [3] [4]

Определение

Оценка гаммы G зависит от двух величин:

  • N s — количество пар случаев, ранжированных в одинаковом порядке по обеим переменным (количество согласованных пар ),
  • N d — количество пар случаев, ранжированных в обратном порядке по обеим переменным (количество перевернутых пар),

где «связи» (случаи, когда любая из двух переменных в паре равна) отбрасываются. Затем

Эту статистику можно рассматривать как оценку максимального правдоподобия для теоретической величины , где

и где P s и P d — вероятности того, что случайно выбранная пара наблюдений расположится в том же или противоположном порядке соответственно при ранжировании по обеим переменным.

Критические значения для гамма-статистики иногда находятся с использованием аппроксимации, при которой преобразованное значение t статистики относится к распределению Стьюдента t , где [ нужна ссылка ]

и где n — количество наблюдений (а не количество пар):

Вопрос Йоля

Особым случаем гаммы Гудмана и Краскала является Q Юла , также известный как коэффициент ассоциации Юла [5] , который характерен для матриц 2×2. Рассмотрим следующую таблицу непредвиденных обстоятельств событий, где каждое значение представляет собой счетчик частоты события:

Вопрос Йоля задается следующим образом:

Хотя она рассчитывается тем же способом, что и гамма Гудмана и Краскала, она имеет несколько более широкую интерпретацию, поскольку различие между номинальными и порядковыми шкалами становится вопросом произвольного обозначения дихотомических различий. Таким образом, является ли Q положительным или отрицательным, зависит только от того, какие пары аналитик считает согласованными, но в остальном он симметричен.

Q варьируется от −1 до +1. −1 отражает полную отрицательную ассоциацию, +1 отражает полную положительную ассоциацию, а 0 отражает отсутствие ассоциации вообще. Знак зависит от того, какие пары аналитик изначально считал конкордантными, но на величину этот выбор не влияет.

С точки зрения отношения шансов OR, Q Юла определяется выражением

и поэтому Q Юла и Y Юла связаны соотношением

Смотрите также

Рекомендации

  1. ^ Гудман, Лео А.; Краскал, Уильям Х. (1954). «Меры объединения перекрестных классификаций». Журнал Американской статистической ассоциации . 49 (268): 732–764. дои : 10.2307/2281536. JSTOR  2281536.
  2. ^ Гудман, Лео А.; Краскал, Уильям Х. (1959). «Меры объединения перекрестных классификаций. II: Дальнейшее обсуждение и ссылки». Журнал Американской статистической ассоциации . 54 (285): 123–163. дои : 10.1080/01621459.1959.10501503. JSTOR  2282143.
  3. ^ Гудман, Лео А.; Краскал, Уильям Х. (1963). «Меры связи для перекрестных классификаций III: приблизительная теория выборки». Журнал Американской статистической ассоциации . 58 (302): 310–364. дои : 10.1080/01621459.1963.10500850. JSTOR  2283271.
  4. ^ Гудман, Лео А.; Краскал, Уильям Х. (1972). «Меры ассоциации для перекрестных классификаций, IV: упрощение асимптотических дисперсий». Журнал Американской статистической ассоциации . 67 (338): 415–421. дои : 10.1080/01621459.1972.10482401. JSTOR  2284396.
  5. ^ Юл, Г. У. (1912). «О методах измерения связи между двумя атрибутами». Журнал Королевского статистического общества . 49 (6): 579–652. дои : 10.2307/2340126. JSTOR  2340126.

дальнейшее чтение