Распределение Коши , названное в честь Огюстена-Луи Коши , является непрерывным распределением вероятностей . Оно также известно, особенно среди физиков , как распределение Лоренца (в честь Хендрика Лоренца ), распределение Коши–Лоренца , функция Лоренца (японская) или распределение Брейта–Вигнера . Распределение Коши — это распределение пересечения оси x луча, выходящего из с равномерно распределенным углом. Это также распределение отношения двух независимых нормально распределенных случайных величин со средним значением нуль.
Распределение Коши часто используется в статистике как канонический пример « патологического » распределения, поскольку и его ожидаемое значение , и его дисперсия не определены (но см. § Моменты ниже). Распределение Коши не имеет конечных моментов порядка, большего или равного единице; существуют только дробные абсолютные моменты. [1] Распределение Коши не имеет функции, производящей моменты .
Функция с формой функции плотности распределения Коши была изучена геометрически Ферма в 1659 году и позже была известна как ведьма Аньези , после того как Аньези включила ее в качестве примера в свой учебник по исчислению 1748 года. Несмотря на свое название, первый явный анализ свойств распределения Коши был опубликован французским математиком Пуассоном в 1824 году, а Коши стал ассоциироваться с ним только во время академической полемики в 1853 году. [2] Пуассон заметил, что если взять среднее значение наблюдений, следующих за таким распределением, средняя ошибка [ необходимо дальнейшее объяснение ] не сходится ни к какому конечному числу. Таким образом, использование Лапласом центральной предельной теоремы с таким распределением было неуместным, поскольку она предполагала конечное среднее значение и дисперсию. Несмотря на это, Пуассон не считал этот вопрос важным, в отличие от Бьенеме , который должен был вовлечь Коши в долгий спор по этому вопросу.
Конструкции
Вот наиболее важные конструкции.
Вращательная симметрия
Если встать перед линией и бить по мячу ногой в случайном направлении (точнее, под углом) равномерно по направлению к линии, то распределение точек, в которых мяч касается линии, является распределением Коши.
Более формально, рассмотрим точку в плоскости xy и выберем линию, проходящую через точку, с ее направлением (углом с осью -), выбранным равномерно (между -90° и +90°) случайным образом. Пересечение линии с осью x является распределением Коши с местоположением и масштабом .
Это определение дает простой способ сделать выборку из стандартного распределения Коши. Пусть будет выборкой из равномерного распределения из , тогда мы можем сгенерировать выборку из стандартного распределения Коши, используя
Максимальное значение или амплитуда функции плотности вероятности Коши составляет , расположенное при .
Иногда удобно выразить PDF через комплексный параметр
Частный случай, когда и называется стандартным распределением Коши с функцией плотности вероятности [5] [6]
В физике часто используется трехпараметрическая функция Лоренца:
где - высота пика. Указанная трехпараметрическая функция Лоренца в общем случае не является функцией плотности вероятности, поскольку она не интегрируется до 1, за исключением особого случая, когда
Отсюда следует, что первый и третий квартили равны , и, следовательно, межквартильный размах равен .
Для стандартного распределения кумулятивная функция распределения упрощается до функции арктангенса :
Другие конструкции
Стандартное распределение Коши представляет собой t -распределение Стьюдента с одной степенью свободы, и поэтому его можно построить любым методом, который строит t-распределение Стьюдента. [7]
Если — положительно-полуопределенная ковариационная матрица со строго положительными диагональными элементами, то для независимых и одинаково распределенных и любого случайного -вектора, независимого от и такого, что и (определяющего категориальное распределение ), справедливо следующее:
[8]
Характеристики
Распределение Коши является примером распределения, которое не имеет определенного среднего значения , дисперсии или высших моментов . Его мода и медиана хорошо определены и оба равны .
Сумма случайных величин, распределенных по закону Коши
Если мы являемся выборкой IID из стандартного распределения Коши, то их выборочное среднее также является стандартным распределением Коши. В частности, среднее не сходится к среднему, и поэтому стандартное распределение Коши не подчиняется закону больших чисел.
Это можно доказать путем повторного интегрирования с функцией плотности вероятности или, что более удобно, с помощью характеристической функции стандартного распределения Коши (см. ниже): При этом мы имеем , и поэтому имеем стандартное распределение Коши.
В более общем случае, если независимы и распределены Коши с параметрами местоположения и масштабами , и являются действительными числами, то распределены Коши с местоположением и масштабом . Мы видим, что не существует закона больших чисел для любой взвешенной суммы независимых распределений Коши.
Это показывает, что условие конечной дисперсии в центральной предельной теореме не может быть отброшено. Это также пример более обобщенной версии центральной предельной теоремы, которая характерна для всех устойчивых распределений , частным случаем которых является распределение Коши.
Центральная предельная теорема
Если и выборка IID с плотностью распределения такая, что конечна, но ненулевая, то сходится по распределению к распределению Коши с масштабом . [11]
Характерная функция
Пусть обозначает случайную величину, распределенную по закону Коши. Характеристическая функция распределения Коши задается выражением
что является просто преобразованием Фурье плотности вероятности. Исходная плотность вероятности может быть выражена через характеристическую функцию, по сути, с помощью обратного преобразования Фурье:
N - й момент распределения — это n -я производная характеристической функции, вычисленная при . Обратите внимание, что характеристическая функция не дифференцируема в начале координат: это соответствует тому факту, что распределение Коши не имеет четко определенных моментов выше нулевого момента.
Расхождение Кульбака–Лейблера
Расхождение Кульбака –Лейблера между двумя распределениями Коши имеет следующую симметричную формулу в замкнутой форме: [12]
Распределение Коши обычно используется в качестве наглядного контрпримера в элементарных курсах теории вероятностей как распределение без четко определенных (или «неопределенных») моментов.
Примеры моментов
Если мы возьмем выборку IID из стандартного распределения Коши, то последовательность их выборочного среднего будет , что также имеет стандартное распределение Коши. Следовательно, независимо от того, сколько членов мы возьмем, выборочное среднее не сойдется.
Аналогично, выборочная дисперсия также не сходится.
Типичная траектория выглядит как длительные периоды медленной конвергенции к нулю, прерываемые большими скачками от нуля, но никогда не уходящие слишком далеко. Типичная траектория выглядит похоже, но скачки накапливаются быстрее, чем распад, расходясь к бесконечности. Эти два вида траекторий изображены на рисунке.
Моменты выборки ниже порядка 1 будут сходиться к нулю. Моменты выборки выше порядка 2 будут расходиться к бесконечности даже быстрее, чем дисперсия выборки.
Мы можем оценить этот двусторонний несобственный интеграл , вычислив сумму двух односторонних несобственных интегралов. То есть,
для произвольного действительного числа .
Для того чтобы интеграл существовал (даже как бесконечное значение), по крайней мере один из членов в этой сумме должен быть конечным, или оба должны быть бесконечными и иметь одинаковый знак. Но в случае распределения Коши оба члена в этой сумме ( 2 ) бесконечны и имеют противоположные знаки. Следовательно, ( 1 ) не определено, и, следовательно, не определено и среднее значение. [16] Когда среднее значение функции распределения вероятностей (PDF) не определено, никто не может вычислить надежное среднее значение по точкам экспериментальных данных, независимо от размера выборки.
Обратите внимание, что главное значение Коши среднего значения распределения Коши
равно нулю. С другой стороны, соответствующий интеграл не
равен нулю, как можно увидеть, вычислив интеграл. Это снова показывает, что среднее значение ( 1 ) не может существовать.
Распределение Коши не имеет конечных моментов любого порядка. Некоторые из высших сырых моментов существуют и имеют значение бесконечности, например, сырой второй момент:
Переставляя формулу, можно увидеть, что второй момент по сути является бесконечным интегралом константы (здесь 1). Более высокие четные степенные сырые моменты также будут оцениваться как бесконечность. Однако нечетные степенные сырые моменты не определены, что отчетливо отличается от существования со значением бесконечности. Нечетные степенные сырые моменты не определены, потому что их значения по сути эквивалентны, поскольку обе половины интеграла расходятся и имеют противоположные знаки. Первый сырой момент является средним значением, которое, будучи нечетным, не существует. (См. также обсуждение выше по этому поводу.) Это, в свою очередь, означает, что все центральные моменты и стандартизированные моменты не определены, поскольку все они основаны на среднем значении. Дисперсия, которая является вторым центральным моментом, также не существует (несмотря на то, что сырой второй момент существует со значением бесконечности).
Результаты для более высоких моментов следуют из неравенства Гёльдера , которое подразумевает, что более высокие моменты (или половины моментов) расходятся, если расходятся более низкие.
Моменты усеченных распределений
Рассмотрим усеченное распределение , определенное путем ограничения стандартного распределения Коши интервалом [−10 100 , 10 100 ] . Такое усеченное распределение имеет все моменты (и центральная предельная теорема применима для независимых случайных наблюдений из него); тем не менее, для почти всех практических целей оно ведет себя как распределение Коши. [17]
Оценка параметров
Поскольку параметры распределения Коши не соответствуют среднему значению и дисперсии, попытка оценить параметры распределения Коши с использованием выборочного среднего значения и выборочной дисперсии не увенчается успехом. [18] Например, если из распределения Коши взята недифференцированная выборка размера n , можно вычислить выборочное среднее значение следующим образом:
Хотя значения выборки будут концентрироваться вокруг центрального значения , среднее значение выборки будет становиться все более изменчивым по мере того, как будет сделано больше наблюдений, из-за возросшей вероятности встретить точки выборки с большим абсолютным значением. Фактически, распределение среднего значения выборки будет равно распределению самих наблюдений; т. е. среднее значение выборки большой выборки не является лучшей (или худшей) оценкой, чем любое отдельное наблюдение из выборки. Аналогично, вычисление дисперсии выборки приведет к значениям, которые будут расти по мере того, как будет сделано больше наблюдений.
Поэтому необходимы более надежные средства оценки центрального значения и параметра масштабирования . Один простой метод заключается в том, чтобы взять медианное значение выборки в качестве оценки и половину выборочного межквартильного размаха в качестве оценки . Были разработаны другие, более точные и надежные методы [19] [20] Например, усеченное среднее средних 24% выборочных порядковых статистик дает оценку для , которая более эффективна, чем использование либо выборочной медианы, либо полного выборочного среднего. [21] [ 22] Однако из-за толстых хвостов распределения Коши эффективность оценки снижается, если используется более 24% выборки. [21] [22]
Максимальное правдоподобие также может быть использовано для оценки параметров и . Однако это, как правило, осложняется тем фактом, что для этого требуется нахождение корней полинома высокой степени, и может быть несколько корней, которые представляют локальные максимумы. [23] Кроме того, хотя оценка максимального правдоподобия асимптотически эффективна, она относительно неэффективна для небольших выборок. [24] [25] Функция логарифмического правдоподобия для распределения Коши для размера выборки имеет вид:
Максимизация логарифмической функции правдоподобия относительно и путем взятия первой производной дает следующую систему уравнений:
Обратите внимание, что
является монотонной функцией в и что решение должно удовлетворять
Решение только для требует решения многочлена степени , [23] а решение только для требует решения многочлена степени . Поэтому, независимо от того, решается ли для одного параметра или для обоих параметров одновременно, обычно требуется численное решение на компьютере. Преимущество оценки максимального правдоподобия заключается в асимптотической эффективности; оценка с использованием выборочной медианы всего на 81% асимптотически эффективна, как оценка по максимальному правдоподобию. [22] [26] Усеченное выборочное среднее с использованием статистики среднего 24%-го порядка асимптотически эффективно примерно на 88% в качестве оценки в качестве оценки максимального правдоподобия. [22] Когда метод Ньютона используется для поиска решения для оценки максимального правдоподобия, статистика среднего 24%-го порядка может использоваться в качестве начального решения для .
Форму можно оценить с помощью медианы абсолютных значений, так как для местоположения 0 переменные Коши имеют параметр формы.
Многомерное распределение Коши
Говорят, что случайный вектор имеет многомерное распределение Коши, если каждая линейная комбинация его компонентов имеет распределение Коши. То есть, для любого постоянного вектора случайная величина должна иметь одномерное распределение Коши. [27] Характеристическая функция многомерного распределения Коши определяется как:
где и — действительные функции с однородной функцией первой степени и положительной однородной функцией первой степени. [27] Более формально: [27]
для всех .
Пример двумерного распределения Коши можно привести следующим образом: [28]
Обратите внимание, что в этом примере, даже несмотря на то, что ковариация между и равна 0, и не являются статистически независимыми . [28]
Мы также можем записать эту формулу для комплексной переменной. Тогда функция плотности вероятности комплексного Коши будет:
Подобно тому, как стандартное распределение Коши является распределением Стьюдента с одной степенью свободы, многомерная плотность Коши является многомерным распределением Стьюдента с одной степенью свободы. Плотность размерного распределения Стьюдента с одной степенью свободы равна:
Свойства многомерного распределения Коши являются тогда частными случаями многомерного распределения Стьюдента.
Свойства трансформации
Если тогда [29]
Если и независимы, то и
Если тогда
Параметризация МакКаллага распределений Коши : [30] Выражая распределение Коши через один комплексный параметр , определим , что означает . Если тогда: где , , и — действительные числа.
Приложения распределения Коши или его преобразования можно найти в областях, работающих с экспоненциальным ростом . В статье Уайта 1958 года [33] была выведена тестовая статистика для оценок для уравнения , и где оценка максимального правдоподобия находится с использованием обычных наименьших квадратов, было показано, что выборочное распределение статистики является распределением Коши.
Распределение Коши часто является распределением наблюдений для вращающихся объектов. Классическая ссылка на это называется задачей о маяке Гулла [35] и, как в предыдущем разделе, распределением Брейта–Вигнера в физике элементарных частиц.
В гидрологии распределение Коши применяется к экстремальным событиям, таким как годовые максимальные однодневные осадки и речные сбросы. Синяя картинка иллюстрирует пример подгонки распределения Коши к ранжированным ежемесячным максимальным однодневным осадкам, показывая также 90% доверительный пояс на основе биномиального распределения . Данные об осадках представлены путем построения позиций в рамках кумулятивного частотного анализа .
Выражение для мнимой части комплексной диэлектрической проницаемости , согласно модели Лоренца, представляет собой распределение Коши.
^ abc NL Johnson; S. Kotz; N. Balakrishnan (1994). Непрерывные одномерные распределения, том 1. Нью-Йорк: Wiley., Глава 16.
^ Коши и ведьма Аньези в Статистике на столе , SM Stigler Гарвард 1999 Глава 18
^ Феллер, Уильям (1971). Введение в теорию вероятностей и ее приложения, том II (2-е изд.). Нью-Йорк: John Wiley & Sons Inc. стр. 704. ISBN978-0-471-25709-7.
^ "Функция Лоренца". MathWorld . Wolfram Research . Получено 27 октября 2024 г. .
^ Райли, Кен Ф.; Хобсон, Майкл П.; Бенс, Стивен Дж. (2006). Математические методы для физики и инженерии (3-е изд.). Кембридж, Великобритания: Cambridge University Press. стр. 1333. ISBN978-0-511-16842-0.
^ «Обновления центрального предела Коши». Квантовое исчисление . 13 ноября 2022 г. Получено 21 июня 2023 г.
^ Фредерик, Чизак; Нильсен, Франк (2019). «Формула замкнутой формы для расхождения Кульбака-Лейблера между распределениями Коши». arXiv : 1905.10965 [cs.IT].
^ Нильсен, Франк; Окамура, Казуки (2023). «О f-расхождениях между распределениями Коши». Труды IEEE по теории информации . 69 (5): 3150–3171. arXiv : 2101.12459 . doi : 10.1109/TIT.2022.3231645. S2CID 231728407.
^ Васичек, Олдрич (1976). «Тест на нормальность на основе выборочной энтропии». Журнал Королевского статистического общества, серия B. 38 ( 1): 54–59. doi :10.1111/j.2517-6161.1976.tb01566.x.
^ Park, Sung Y.; Bera, Anil K. (2009). "Модель условной гетероскедастичности с максимальной энтропией" (PDF) . Journal of Econometrics . 150 (2). Elsevier: 219–230. doi :10.1016/j.jeconom.2008.12.014. Архивировано из оригинала (PDF) 2011-09-30 . Получено 2011-06-02 .
^ ab Kyle Siegrist. "Распределение Коши". Случайно . Архивировано из оригинала 9 июля 2021 г. Получено 5 июля 2021 г.
^ Хампель, Фрэнк (1998), «Слишком ли сложна статистика?» (PDF) , Канадский журнал статистики , 26 (3): 497–513, doi : 10.2307/3315772, hdl : 20.500.11850/145503 , JSTOR 3315772, S2CID 53117661, заархивировано из оригинала 25.01.2022 , извлечено 25.09.2019.
^ Кейн, Гвенда Дж. (1974). «Линейная оценка параметров распределения Коши на основе выборочных квантилей». Журнал Американской статистической ассоциации . 69 (345): 243–245. doi :10.1080/01621459.1974.10480163. JSTOR 2285535.
^ ab Rothenberg, Thomas J.; Fisher, Franklin, M.; Tilanus, CB (1964). «Заметка об оценке по выборке Коши». Журнал Американской статистической ассоциации . 59 (306): 460–463. doi :10.1080/01621459.1964.10482170.{{cite journal}}: CS1 maint: multiple names: authors list (link)
^ abcd Блох, Дэниел (1966). «Заметка об оценке параметров местоположения распределения Коши». Журнал Американской статистической ассоциации . 61 (316): 852–855. doi :10.1080/01621459.1966.10480912. JSTOR 2282794.
^ ab Фергюсон, Томас С. (1978). «Оценки максимального правдоподобия параметров распределения Коши для выборок размера 3 и 4». Журнал Американской статистической ассоциации . 73 (361): 211–213. doi :10.1080/01621459.1978.10480031. JSTOR 2286549.
^ Cohen Freue, Gabriella V. (2007). "Оценка Питмана параметра местоположения Коши" (PDF) . Журнал статистического планирования и вывода . 137 (6): 1901. doi :10.1016/j.jspi.2006.05.002. Архивировано из оригинала (PDF) 2011-08-16.
^ Уилкокс, Рэнд (2012). Введение в надежную оценку и проверку гипотез . Elsevier.
^ Барнетт, В. Д. (1966). «Оценки порядка статистики расположения распределения Коши». Журнал Американской статистической ассоциации . 61 (316): 1205–1218. doi :10.1080/01621459.1966.10482205. JSTOR 2283210.
^ abc Ferguson, Thomas S. (1962). «Представление симметричного двумерного распределения Коши». Анналы математической статистики . 33 (4): 1256–1266. doi : 10.1214/aoms/1177704357 . JSTOR 2237984. Получено 07.01.2017 .
^ ab Molenberghs, Geert; Lesaffre, Emmanuel (1997). "Нелинейные интегральные уравнения для аппроксимации двумерных плотностей с заданными маргиналами и функцией зависимости" (PDF) . Statistica Sinica . 7 : 713–738. Архивировано из оригинала (PDF) 2009-09-14.
^ Лемонс, Дон С. (2002), «Введение в стохастические процессы в физике», Американский журнал физики , 71 (2), Издательство Университета Джонса Хопкинса: 35, Bibcode : 2003AmJPh..71..191L, doi : 10.1119/1.1526134, ISBN0-8018-6866-1
^ ab McCullagh, P. , «Условный вывод и модели Коши», Biometrika , том 79 (1992), страницы 247–259. PDF Архивировано 10 июня 2010 г. на Wayback Machine с домашней страницы McCullagh.
^ Киприану, Андреас (2009). Процессы Леви и ветвящиеся процессы с непрерывным состоянием: часть I (PDF) . стр. 11. Архивировано (PDF) из оригинала 2016-03-03 . Получено 2016-05-04 .
^ Уайт, Дж. С. (декабрь 1958 г.). «Предельное распределение коэффициента последовательной корреляции в случае взрывчатых веществ». Анналы математической статистики . 29 (4): 1188–1197. doi : 10.1214/aoms/1177706450 .
^ "CumFreq, бесплатное программное обеспечение для кумулятивного частотного анализа и подгонки распределения вероятностей". Архивировано из оригинала 21.02.2018.
^ Gull, SF (1988) Байесовский индуктивный вывод и максимальная энтропия. Kluwer Academic Publishers, Берлин. https://doi.org/10.1007/978-94-009-3049-0_4 Архивировано 25 января 2022 г. на Wayback Machine
^ Тонг Лю (2012), Промежуточное распределение между гауссовым и распределением Коши. https://arxiv.org/pdf/1208.5109.pdf Архивировано 24.06.2020 на Wayback Machine