Тот факт, что 0 градусов и 360 градусов являются идентичными углами , так что, например, 180 градусов не являются разумным средним значением 2 градусов и 358 градусов, дает одну иллюстрацию того, что для анализа некоторых типов данных (в данном случае угловых данных) требуются специальные статистические методы. Другие примеры данных, которые можно рассматривать как направленные, включают статистику, включающую временные периоды (например, время дня, неделя, месяц, год и т. д.), направления компаса, двугранные углы в молекулах, ориентации, вращения и т. д.
Эту концепцию можно распространить на многомерный контекст, расширив простую сумму до ряда сумм, охватывающих все измерения в пространстве признаков:
где — -й евклидов базисный вектор.
В следующих разделах показаны некоторые соответствующие круговые распределения.
Круговое распределение фон Мизеса
Распределение фон Мизеса является круговым распределением, которое, как и любое другое круговое распределение, можно рассматривать как обертывание определенного линейного распределения вероятностей вокруг круга. Базовое линейное распределение вероятностей для распределения фон Мизеса математически не поддается обработке; однако для статистических целей нет необходимости иметь дело с базовым линейным распределением. Полезность распределения фон Мизеса двояка: оно является наиболее математически поддающимся обработке из всех круговых распределений, позволяя проводить более простой статистический анализ, и оно является близким приближением к обернутому нормальному распределению, которое, аналогично линейному нормальному распределению, важно, поскольку является предельным случаем для суммы большого числа малых угловых отклонений. Фактически, распределение фон Мизеса часто называют «круговым нормальным» распределением из-за его простоты использования и его тесной связи с обернутым нормальным распределением. [3]
PDF распределения фон Мизеса имеет вид: где — модифицированная функция Бесселя порядка 0.
Круговое равномерное распределение
Функция плотности вероятности (pdf) кругового равномерного распределения определяется выражением
Его также можно рассматривать как аналогичный подход фон Мизеса.
Нормальное распределение в обертке
PDF обернутого нормального распределения (WN) имеет вид:
где μ и σ — среднее значение и стандартное отклонение развернутого распределения соответственно, а — тета-функция Якоби : где и
Обернутое распределение Коши
PDF обернутого распределения Коши (WC) имеет вид:
где — масштабный коэффициент, а — положение пика.
Распределение упакованных Леви
PDF обернутого распределения Леви (WL) имеет вид:
где значение слагаемого принимается равным нулю, когда , — масштабный коэффициент, а — параметр местоположения.
Прогнозируемое нормальное распределение
Проецируемое нормальное распределение представляет собой круговое распределение, представляющее направление случайной величины с многомерным нормальным распределением, полученное радиальной проекцией переменной на единичную (n-1)-сферу. В связи с этим, и в отличие от других обычно используемых круговых распределений, оно не является ни симметричным, ни унимодальным .
Распределения на многообразиях более высокой размерности
Распределение Бингама — это распределение по осям в N измерениях или, что эквивалентно, по точкам на ( N − 1)-мерной сфере с идентифицированными антиподами. [9] Например, если N = 2, оси являются ненаправленными прямыми, проходящими через начало координат на плоскости. В этом случае каждая ось пересекает единичную окружность на плоскости (которая является одномерной сферой) в двух точках, которые являются антиподами друг друга. Для N = 4 распределение Бингама — это распределение по пространству единичных кватернионов ( версоров ). Поскольку версор соответствует матрице вращения, распределение Бингама для N = 4 можно использовать для построения распределений вероятностей по пространству вращений, как и распределение Матрицы фон Мизеса–Фишера.
Необработанные векторные (или тригонометрические) моменты кругового распределения определяются как
где — любой интервал длины , — функция плотности вероятности кругового распределения, и . Поскольку интеграл равен единице, а интервал интегрирования конечен, отсюда следует, что моменты любого кругового распределения всегда конечны и хорошо определены.
Аналогично определяются выборочные моменты:
Результирующий вектор популяции, длина и средний угол определяются по аналогии с соответствующими параметрами выборки.
Кроме того, длины высших моментов определяются как:
в то время как угловые части высших моментов просто . Длины всех моментов будут лежать между 0 и 1.
Наиболее распространенной мерой местоположения является круговое среднее. Круговое среднее по популяции — это просто первый момент распределения, тогда как выборочное среднее — это первый момент выборки. Выборочное среднее будет служить несмещенной оценкой среднего по популяции.
Когда данные сконцентрированы, медиану и моду можно определить по аналогии с линейным случаем, но для более разбросанных или многомодальных данных эти концепции бесполезны.
Дисперсия
Наиболее распространенными мерами кругового спреда являются:
Theкруговая дисперсия . Для выборки круговая дисперсия определяется как:а для генеральной совокупностиобе будут иметь значения от 0 до 1.
Theкруговое стандартное отклонение со значениями от 0 до бесконечности. Это определение стандартного отклонения (а не квадратного корня дисперсии) полезно, поскольку для обернутого нормального распределения оно является оценщиком стандартного отклонения базового нормального распределения. Таким образом, оно позволит стандартизировать круговое распределение, как в линейном случае, для малых значений стандартного отклонения. Это также применимо к распределению фон Мизеса, которое близко приближается к обернутому нормальному распределению. Обратите внимание, что для малыхмы имеем.
Theкруговая дисперсия со значениями от 0 до бесконечности. Эта мера дисперсии оказывается полезной в статистическом дисперсионном анализе.
Распределение среднего
При наличии набора из N измерений среднее значение z определяется как:
что может быть выражено как
где
или, альтернативно, как:
где
Распределение среднего угла ( ) для круговой функции распределения P ( θ ) будет определяться выражением:
где — на любом интервале длины , а интеграл подчиняется ограничению, что и являются постоянными, или, альтернативно, что и являются постоянными.
Расчет распределения среднего значения для большинства круговых распределений аналитически невозможен, и для проведения дисперсионного анализа необходимы числовые или математические приближения. [14]
^ Бингем, К. (1974). «Антиподально симметричное распределение на сфере». Ann. Stat . 2 (6): 1201–1225. doi : 10.1214/aos/1176342874 .
^ Пил, Д.; Уайтен, В. Дж.; Маклахлан, Г. Дж. (2001). «Подгонка смесей распределений Кента для помощи в идентификации совместных множеств» (PDF) . J. Am. Stat. Assoc . 96 (453): 56–63. doi :10.1198/016214501750332974. S2CID 11667311.
^ Кригер Лассен, NC; Юул Йенсен, D.; Конрадсен, K. (1994). «О статистическом анализе данных об ориентации». Acta Crystallogr . A50 (6): 741–748. Bibcode : 1994AcCrA..50..741K. doi : 10.1107/S010876739400437X.
^ Кент, Дж. Т., Хамелрик, Т. (2005). Использование распределения Фишера–Бингама в стохастических моделях для структуры белка. В S. Barber, PD Baxter, KVMardia, & RE Walls (ред.), Количественная биология, анализ формы и вейвлеты, стр. 57–60. Лидс, Leeds University Press
^ Boomsma, Wouter; Mardia, Kanti V.; Taylor, Charles C.; Ferkinghoff-Borg, Jesper; Krogh, Anders; Hamelryck, Thomas (2008). «Генеративная, вероятностная модель локальной структуры белка». Труды Национальной академии наук . 105 (26): 8932–8937. Bibcode : 2008PNAS..105.8932B. doi : 10.1073/pnas.0801715105 . PMC 2440424. PMID 18579771 .