Коэффициент корреляции — это численная мера некоторого типа линейной корреляции , то есть статистической связи между двумя переменными . [a] Переменными могут быть два столбца заданного набора данных наблюдений, часто называемого выборкой , или два компонента многомерной случайной величины с известным распределением . [ требуется ссылка ]
Существует несколько типов коэффициентов корреляции, каждый из которых имеет собственное определение и собственный диапазон применимости и характеристик. Все они принимают значения в диапазоне от −1 до +1, где ±1 указывает на самую сильную возможную корреляцию, а 0 указывает на отсутствие корреляции. [2] Как инструменты анализа, коэффициенты корреляции представляют определенные проблемы, включая склонность некоторых типов искажаться выбросами и возможность неправильного использования для вывода причинно-следственной связи между переменными (подробнее см. Корреляция не подразумевает причинно-следственную связь ). [3]
Существует несколько различных мер для измерения степени корреляции данных в зависимости от типа данных: главным образом, являются ли данные измерением, порядковыми или категориальными .
Коэффициент корреляции Пирсона-момента , также известный как r , R или r Пирсона , является мерой силы и направления линейной связи между двумя переменными, которая определяется как ковариация переменных, деленная на произведение их стандартных отклонений. [4] Это наиболее известный и наиболее часто используемый тип коэффициента корреляции. Когда термин «коэффициент корреляции» используется без дополнительных уточнений, он обычно относится к коэффициенту корреляции Пирсона-момента.
Внутриклассовая корреляция (ВКК) — это описательная статистика, которая может использоваться при проведении количественных измерений единиц, организованных в группы; она описывает, насколько сильно единицы в одной группе похожи друг на друга.
Ранговая корреляция — это мера взаимосвязи между рейтингами двух переменных или двумя рейтингами одной и той же переменной:
Коэффициент полихорической корреляции измеряет связь между двумя упорядоченными категориальными переменными. Технически он определяется как оценка коэффициента корреляции Пирсона, которую можно получить, если:
Когда обе переменные являются дихотомическими, а не упорядоченно-категорическими, полихорический коэффициент корреляции называется тетрахорическим коэффициентом корреляции.