В статистике гамма Гудмана и Краскала является мерой ранговой корреляции , т. е . сходства порядка данных при ранжировании по каждой из величин. Он измеряет силу связи данных перекрестной таблицы , когда обе переменные измеряются на порядковом уровне . Он не делает никаких корректировок ни по размеру стола, ни по ничьим. Значения варьируются от −1 (100 % отрицательная ассоциация или полная инверсия) до +1 (100 % положительная ассоциация или полное согласие). Нулевое значение указывает на отсутствие ассоциации.
Эта статистика (которая отличается от лямбды Гудмана и Краскала ) названа в честь Лео Гудмана и Уильяма Краскала , которые предложили ее в серии статей с 1954 по 1972 год. [1] [2] [3] [4]
Оценка гаммы G зависит от двух величин:
где «связи» (случаи, когда любая из двух переменных в паре равна) отбрасываются. Затем
Эту статистику можно рассматривать как оценку максимального правдоподобия для теоретической величины , где
и где P s и P d — вероятности того, что случайно выбранная пара наблюдений расположится в том же или противоположном порядке соответственно при ранжировании по обеим переменным.
Критические значения для гамма-статистики иногда находятся с использованием аппроксимации, при которой преобразованное значение t статистики относится к распределению Стьюдента t , где [ нужна ссылка ]
и где n — количество наблюдений (а не количество пар):
Особым случаем гаммы Гудмана и Краскала является Q Юла , также известный как коэффициент ассоциации Юла [5] , который характерен для матриц 2×2. Рассмотрим следующую таблицу непредвиденных обстоятельств событий, где каждое значение представляет собой счетчик частоты события:
Вопрос Йоля задается следующим образом:
Хотя она рассчитывается тем же способом, что и гамма Гудмана и Краскала, она имеет несколько более широкую интерпретацию, поскольку различие между номинальными и порядковыми шкалами становится вопросом произвольного обозначения дихотомических различий. Таким образом, является ли Q положительным или отрицательным, зависит только от того, какие пары аналитик считает согласованными, но в остальном он симметричен.
Q варьируется от −1 до +1. −1 отражает полную отрицательную ассоциацию, +1 отражает полную положительную ассоциацию, а 0 отражает отсутствие ассоциации вообще. Знак зависит от того, какие пары аналитик изначально считал конкордантными, но на величину этот выбор не влияет.
С точки зрения отношения шансов OR, Q Юла определяется выражением
и поэтому Q Юла и Y Юла связаны соотношением