stringtranslate.com

Гамма Гудмена и Краскала

В статистике гамма Гудмана и Краскала является мерой ранговой корреляции , т. е. сходства упорядочений данных при ранжировании по каждой из величин. Она измеряет силу ассоциации перекрестных табулированных данных, когда обе переменные измеряются на порядковом уровне . Она не делает никаких поправок ни на размер таблицы, ни на связи. Значения варьируются от −1 (100% отрицательная ассоциация или идеальная инверсия) до +1 (100% положительная ассоциация или идеальное согласие). Нулевое значение указывает на отсутствие ассоциации.

Эта статистика (которая отличается от лямбды Гудмена и Краскала ) названа в честь Лео Гудмена и Уильяма Краскала , которые предложили ее в серии статей с 1954 по 1972 год. [1] [2] [3] [4]

Определение

Оценка гаммы, G , зависит от двух величин:

  • N s , количество пар случаев, ранжированных в одинаковом порядке по обеим переменным (количество согласованных пар ),
  • N d , количество пар случаев, ранжированных в обратном порядке по обеим переменным (количество обратных пар),

где «связи» (случаи, когда любая из двух переменных в паре равна) опускаются. Тогда

Эту статистику можно рассматривать как оценку максимального правдоподобия для теоретической величины , где

и где P s и P d — вероятности того, что случайно выбранная пара наблюдений расположится в том же или противоположном порядке соответственно при ранжировании по обеим переменным.

Критические значения для гамма-статистики иногда находятся с помощью аппроксимации, при которой преобразованное значение t статистики относится к распределению Стьюдента t , где [ необходима ссылка ]

и где n — количество наблюдений (не количество пар):

Вопрос Юла

Частным случаем гаммы Гудмана и Краскала является Q Юла , также известный как коэффициент ассоциации Юла , [5], который специфичен для матриц 2×2. Рассмотрим следующую таблицу сопряженности событий, где каждое значение является подсчетом частоты события:

Q Юла определяется по формуле:

Хотя она вычисляется таким же образом, как гамма Гудмана и Краскала, она имеет немного более широкую интерпретацию, поскольку различие между номинальной и порядковой шкалами становится вопросом произвольной маркировки для дихотомических различий. Таким образом, то, является ли Q положительным или отрицательным, зависит только от того, какие пары аналитик считает согласованными, но в остальном является симметричным.

Q варьируется от −1 до +1. −1 отражает полную отрицательную ассоциацию, +1 отражает совершенную положительную ассоциацию, а 0 отражает отсутствие ассоциации вообще. Знак зависит от того, какие пары аналитик изначально считал согласованными, но этот выбор не влияет на величину.

С точки зрения отношения шансов OR, Q Юла определяется как

и поэтому Q Юла и Y Юла связаны соотношением

Смотрите также

Ссылки

  1. ^ Гудман, Лео А.; Крускал, Уильям Х. (1954). «Меры ассоциации для перекрестных классификаций». Журнал Американской статистической ассоциации . 49 (268): 732–764. doi :10.2307/2281536. JSTOR  2281536.
  2. ^ Гудман, Лео А.; Крускал, Уильям Х. (1959). «Меры ассоциации для перекрестных классификаций. II: Дальнейшее обсуждение и ссылки». Журнал Американской статистической ассоциации . 54 (285): 123–163. doi :10.1080/01621459.1959.10501503. JSTOR  2282143.
  3. ^ Гудман, Лео А.; Крускал, Уильям Х. (1963). «Меры ассоциации для перекрестных классификаций III: Приблизительная теория выборки». Журнал Американской статистической ассоциации . 58 (302): 310–364. doi :10.1080/01621459.1963.10500850. JSTOR  2283271.
  4. ^ Гудман, Лео А.; Крускал, Уильям Х. (1972). «Меры ассоциации для перекрестных классификаций, IV: Упрощение асимптотических дисперсий». Журнал Американской статистической ассоциации . 67 (338): 415–421. doi :10.1080/01621459.1972.10482401. JSTOR  2284396.
  5. ^ Юл, Г. У. (1912). «О методах измерения связи между двумя атрибутами». Журнал Королевского статистического общества . 49 (6): 579–652. doi :10.2307/2340126. JSTOR  2340126.

Дальнейшее чтение