В теории вероятностей и направленной статистике обернутое распределение вероятностей — это непрерывное распределение вероятностей , которое описывает точки данных, лежащие на единичной n -сфере . В одном измерении обернутое распределение состоит из точек на единичной окружности . Если — случайная величина в интервале с функцией плотности вероятности (PDF) , то — круговая переменная, распределенная в соответствии с обернутым распределением , а — угловая переменная в интервале, распределенная в соответствии с обернутым распределением .
Любая функция плотности вероятности на линии может быть «обернута» вокруг окружности единичного радиуса. [1] То есть, PDF обернутой переменной
- в некотором интервале длины
является
который является периодической суммой периода . Предпочтительный интервал обычно для которого .
Теория
В большинстве ситуаций процесс, включающий круговую статистику, производит углы ( ), которые лежат в интервале , и описываются "развернутой" функцией плотности вероятности . Однако измерение даст угол , который лежит в некотором интервале длины (например, от 0 до ). Другими словами, измерение не может сказать , был ли измерен истинный угол или свернутый угол , где - некоторое неизвестное целое число.
Если мы хотим вычислить ожидаемое значение некоторой функции измеренного угла, то оно будет:
- .
Мы можем выразить интеграл как сумму интегралов по периодам :
- .
Меняя переменную интегрирования на и меняя порядок интегрирования и суммирования, имеем
где — PDF обернутого распределения, а — еще одно неизвестное целое число . Неизвестное целое число вносит неоднозначность в ожидаемое значение , аналогично проблеме вычисления углового среднего . Это можно решить, введя параметр , поскольку имеет однозначную связь с истинным углом :
- .
Вычисление ожидаемого значения функции даст однозначные ответы:
- .
По этой причине параметр предпочтительнее измеренных углов в круговом статистическом анализе. Это предполагает, что обернутая функция распределения сама по себе может быть выражена как функция от такой, что:
где определяется таким образом , что . Эту концепцию можно распространить на многомерный контекст путем расширения простой суммы до ряда сумм, которые охватывают все измерения в пространстве признаков:
где - -й евклидов базисный вектор.
Выражение через характеристические функции
Фундаментальным обернутым распределением является гребень Дирака , который представляет собой обернутую дельта-функцию Дирака :
- .
Используя дельта-функцию, можно записать общее обернутое распределение
- .
Меняя порядок суммирования и интегрирования, любое свернутое распределение можно записать в виде свертки развернутого распределения и гребня Дирака:
- .
Гребень Дирака также можно выразить как сумму экспонент, поэтому мы можем записать:
- .
Снова меняем порядок суммирования и интегрирования:
- .
Используя определение , характеристическая функция дает ряд Лорана около нуля для обернутого распределения в терминах характеристической функции развернутого распределения:
или
Аналогично линейным распределениям, называется характеристической функцией обернутого распределения (или, точнее, характеристической последовательностью ). [2] Это пример формулы суммирования Пуассона , и можно видеть, что коэффициенты ряда Фурье для обернутого распределения являются просто коэффициентами преобразования Фурье развернутого распределения при целочисленных значениях.
Моменты
Моменты обернутого распределения определяются как:
- .
Выражая через характеристическую функцию и меняя порядок интегрирования и суммирования, получаем:
- .
Из теоремы о вычетах имеем
где — дельта-функция Кронекера . Отсюда следует, что моменты просто равны характеристической функции развернутого распределения для целочисленных аргументов:
- .
Генерация случайных величин
Если — случайная величина, полученная из линейного распределения вероятностей , то — круговая величина, распределенная в соответствии с обернутым распределением, а — угловая величина, распределенная в соответствии с обернутым распределением, причем .
Энтропия
Информационная энтропия кругового распределения с плотностью вероятности определяется как:
где — любой интервал длины . [1] Если и плотность вероятности, и ее логарифм можно выразить в виде ряда Фурье (или, в более общем случае, любого интегрального преобразования на окружности), то ортогональный базис ряда можно использовать для получения замкнутого выражения для энтропии.
Моменты распределения являются коэффициентами Фурье для разложения плотности вероятности в ряд Фурье:
- .
Если логарифм плотности вероятности также можно выразить в виде ряда Фурье:
где
- .
Тогда, поменяв порядок интегрирования и суммирования, энтропию можно записать в виде:
- .
Используя ортогональность базиса Фурье, интеграл можно свести к:
- .
Для частного случая, когда плотность вероятности симметрична относительно среднего значения, а логарифм можно записать:
и
и, поскольку нормализация требует, чтобы , энтропия может быть записана:
- .
Смотрите также
Ссылки
- Боррадейл, Грэм (2003). Статистика данных наук о Земле. Спрингер. ISBN 978-3-540-43603-4.
- Фишер, NI (1996). Статистический анализ круговых данных. Cambridge University Press. ISBN 978-0-521-56890-6.
Внешние ссылки
- Круговые значения Математика и статистика с C++11, инфраструктура C++11 для круговых значений (углы, время суток и т. д.) Математика и статистика