В статистике гамма Гудмана и Краскала является мерой ранговой корреляции , т. е. сходства упорядочений данных при ранжировании по каждой из величин. Она измеряет силу ассоциации перекрестных табулированных данных, когда обе переменные измеряются на порядковом уровне . Она не делает никаких поправок ни на размер таблицы, ни на связи. Значения варьируются от −1 (100% отрицательная ассоциация или идеальная инверсия) до +1 (100% положительная ассоциация или идеальное согласие). Нулевое значение указывает на отсутствие ассоциации.
Эта статистика (которая отличается от лямбды Гудмена и Краскала ) названа в честь Лео Гудмена и Уильяма Краскала , которые предложили ее в серии статей с 1954 по 1972 год. [1] [2] [3] [4]
Оценка гаммы, G , зависит от двух величин:
где «связи» (случаи, когда любая из двух переменных в паре равна) опускаются. Тогда
Эту статистику можно рассматривать как оценку максимального правдоподобия для теоретической величины , где
и где P s и P d — вероятности того, что случайно выбранная пара наблюдений расположится в том же или противоположном порядке соответственно при ранжировании по обеим переменным.
Критические значения для гамма-статистики иногда находятся с помощью аппроксимации, при которой преобразованное значение t статистики относится к распределению Стьюдента t , где [ необходима ссылка ]
и где n — количество наблюдений (не количество пар):
Частным случаем гаммы Гудмана и Краскала является Q Юла , также известный как коэффициент ассоциации Юла , [5], который специфичен для матриц 2×2. Рассмотрим следующую таблицу сопряженности событий, где каждое значение является подсчетом частоты события:
Q Юла определяется по формуле:
Хотя она вычисляется таким же образом, как гамма Гудмана и Краскала, она имеет немного более широкую интерпретацию, поскольку различие между номинальной и порядковой шкалами становится вопросом произвольной маркировки для дихотомических различий. Таким образом, то, является ли Q положительным или отрицательным, зависит только от того, какие пары аналитик считает согласованными, но в остальном является симметричным.
Q варьируется от −1 до +1. −1 отражает полную отрицательную ассоциацию, +1 отражает совершенную положительную ассоциацию, а 0 отражает отсутствие ассоциации вообще. Знак зависит от того, какие пары аналитик изначально считал согласованными, но этот выбор не влияет на величину.
С точки зрения отношения шансов OR, Q Юла определяется как
и поэтому Q Юла и Y Юла связаны соотношением