Распределение переменных, удовлетворяющее свойству устойчивости относительно линейных комбинаций
В теории вероятностей распределение называется устойчивым, если линейная комбинация двух независимых случайных величин с этим распределением имеет то же распределение, с точностью до параметров местоположения и масштаба . Случайная величина называется устойчивой, если ее распределение устойчиво. Семейство устойчивых распределений иногда также называют альфа-устойчивым распределением Леви , в честь Поля Леви , первого математика, который его изучал. [1] [2]
Из четырех параметров, определяющих семейство, наибольшее внимание было сосредоточено на параметре устойчивости (см. панель). Устойчивые распределения имеют , с верхней границей, соответствующей нормальному распределению , и распределению Коши . Распределения имеют неопределенную дисперсию для , и неопределенное среднее для . Важность устойчивых распределений вероятностей заключается в том, что они являются « аттракторами » для правильно нормированных сумм независимых и одинаково распределенных ( iid ) случайных величин. Нормальное распределение определяет семейство устойчивых распределений. По классической центральной предельной теореме правильно нормированная сумма набора случайных величин, каждая из которых имеет конечную дисперсию, будет стремиться к нормальному распределению по мере увеличения числа переменных. Без предположения о конечной дисперсии предел может быть устойчивым распределением, которое не является нормальным. Мандельброт называл такие распределения «устойчивыми паретианскими распределениями», [3] [4] [5] в честь Вильфредо Парето . В частности, он называл те, которые максимально смещены в положительном направлении , «распределениями Парето–Леви» [1] , которые он считал лучшими описаниями цен на акции и товары, чем нормальные распределения. [6]
Определение
Невырожденное распределение является устойчивым распределением, если оно удовлетворяет следующему свойству:
Пусть X 1 и X 2 — независимые реализации случайной величины X . Тогда X называется устойчивой, если для любых констант a > 0 и b > 0 случайная величина aX 1 + bX 2 имеет то же распределение, что и cX + d для некоторых констант c > 0 и d . Распределение называется строго устойчивым, если это выполняется при d = 0 . [7]
Такие распределения образуют четырехпараметрическое семейство непрерывных распределений вероятностей, параметризованных параметрами местоположения и масштаба μ и c , соответственно, и двумя параметрами формы и , примерно соответствующими мерам асимметрии и концентрации, соответственно (см. рисунки).
Характеристическая функция любого распределения вероятностей — это преобразование Фурье его функции плотности вероятности . Таким образом, функция плотности — это обратное преобразование Фурье характеристической функции: [8]
Хотя функция плотности вероятности для общего устойчивого распределения не может быть записана аналитически, общая характеристическая функция может быть выражена аналитически. Случайная величина X называется стабильной, если ее характеристическая функция может быть записана как [7] [9]
где sgn( t ) — это просто знак t , а μ ∈ R — это параметр сдвига, называемый параметром асимметрии , является мерой асимметрии. Обратите внимание, что в этом контексте обычная асимметрия не определена хорошо, поскольку распределение не допускает 2-го или более высоких моментов , а обычное определение асимметрии — это 3-й центральный момент .
Причина, по которой это дает стабильное распределение, заключается в том, что характеристическая функция для суммы двух независимых случайных величин равна произведению двух соответствующих характеристических функций. Сложение двух случайных величин из стабильного распределения дает что-то с одинаковыми значениями и , но, возможно, с разными значениями μ и c .
Не каждая функция является характеристической функцией законного распределения вероятностей (то есть, чья кумулятивная функция распределения действительна и изменяется от 0 до 1 без убывания), но характеристические функции, приведенные выше, будут законными, пока параметры находятся в своих диапазонах. Значение характеристической функции при некотором значении t является комплексно сопряженным значением ее значения при − t , как и должно быть, чтобы функция распределения вероятностей была действительной.
В простейшем случае характеристическая функция представляет собой просто растянутую экспоненциальную функцию ; распределение симметрично относительно μ и называется симметричным альфа-устойчивым распределением (Леви) , часто сокращенно SαS .
Когда и , распределение поддерживается на [ μ , ∞).
Параметр c > 0 представляет собой масштабный коэффициент, который является мерой ширины распределения, в то время как является показателем или индексом распределения и определяет асимптотическое поведение распределения.
Параметризации
Параметризация стабильных распределений не является уникальной. Нолан [10] приводит 11 параметризаций, встречающихся в литературе, и приводит формулы преобразования. Две наиболее часто используемые параметризации — это та, что выше (Нолановская «1») и та, что непосредственно ниже (Нолановская «0»).
Параметризацию, приведенную выше, проще всего использовать для теоретической работы, но ее плотность вероятности не является непрерывной по параметрам при . [11] Непрерывная параметризация, более подходящая для численной работы, выглядит так [7],
где:
Диапазоны и те же, что и раньше, γ (как и c ) должно быть положительным, а δ (как и μ ) должно быть действительным.
В любой параметризации можно выполнить линейное преобразование случайной величины, чтобы получить случайную величину, плотность которой равна . В первой параметризации это делается путем определения новой переменной:
Для второй параметризации просто используйте
независимую от . В первой параметризации, если среднее значение существует (то есть ), то оно равно μ , тогда как во второй параметризации, когда среднее значение существует, оно равно
Распределение
Стабильное распределение, таким образом, определяется четырьмя указанными выше параметрами. Можно показать, что любое невырожденное стабильное распределение имеет гладкую (бесконечно дифференцируемую) функцию плотности. [7] Если обозначает плотность X , а Y — сумму независимых копий X :
тогда Y имеет плотность с
Асимптотическое поведение описывается для следующим образом: [7]
где Γ — гамма-функция (за исключением того, что при и хвост не исчезает слева или справа от μ , хотя приведенное выше выражение равно 0). Это поведение « тяжелого хвоста » приводит к тому, что дисперсия устойчивых распределений становится бесконечной для всех . Это свойство проиллюстрировано на графиках в двойном логарифмическом масштабе ниже.
При распределение является гауссовым (см. ниже) с хвостами, асимптотическими к exp(− x 2 /4 c 2 )/(2 c √ π ).
Одностороннее стабильное распределение и стабильное распределение количества
Когда и , распределение поддерживается на [ μ , ∞). Это семейство называется односторонним устойчивым распределением . [12] Его стандартное распределение ( μ = 0) определяется как
, где
Пусть , его характеристическая функция . Таким образом, интегральная форма его PDF равна (примечание: )
Интеграл двойного синуса более эффективен для очень малых .
Рассмотрим сумму Леви , где , тогда Y имеет плотность , где . Установить , чтобы прийти к устойчивому распределению счетов . [13] Его стандартное распределение определяется как
Устойчивое распределение счетов является сопряженным априорным распределением одностороннего устойчивого распределения. Его семейство местоположений-масштабов определяется как
,
Это также одностороннее распределение, поддерживаемое на . Параметр местоположения является местоположением отсечки, а определяет его масштаб.
Когда , — распределение Леви , которое является обратным гамма-распределением. Таким образом, — смещенное гамма-распределение формы 3/2 и масштаба ,
Его среднее значение равно , а его стандартное отклонение равно . Предполагается, что VIX распределен как с и (см. раздел 7 [13] ). Таким образом, стабильное распределение счета является маргинальным распределением первого порядка процесса волатильности. В этом контексте называется «половой волатильностью».
Другой подход к получению устойчивого распределения количества состоит в использовании преобразования Лапласа одностороннего устойчивого распределения (раздел 2.4 [13] ).
Пусть , и можно разложить интеграл в левой части как произведение стандартного распределения Лапласа и стандартного устойчивого распределения счета,
Это называется «лямбда-разложением» (см. раздел 4 [13] ), поскольку правая часть была названа «симметричным лямбда-распределением» в предыдущих работах Лина. Однако у него есть несколько более популярных названий, таких как « экспоненциальное распределение мощности » или «обобщенное распределение ошибок/нормальное распределение», часто упоминаемое, когда .
N-й момент является -м моментом , а все положительные моменты конечны.
Устойчивые распределения замкнуты относительно свертки .
Устойчивые распределения замкнуты относительно свертки для фиксированного значения . Поскольку свертка эквивалентна умножению преобразованной Фурье функции, то отсюда следует, что произведение двух устойчивых характеристических функций с тем же самым даст еще одну такую же характеристическую функцию. Произведение двух устойчивых характеристических функций определяется как:
Поскольку Φ не является функцией μ , c или переменных, то эти параметры для свернутой функции определяются следующим образом:
В каждом случае можно показать, что полученные параметры лежат в требуемых интервалах для устойчивого распределения.
Обобщенная центральная предельная теорема
Обобщенная центральная предельная теорема (GCLT) была результатом усилий многих математиков ( Берштейна , Линдеберга , Леви , Феллера , Колмогорова и других) в период с 1920 по 1937 год. [14]
Первое опубликованное полное доказательство (на французском языке) GCLT было в 1937 году Полем Леви . [15]
Англоязычная версия полного доказательства GCLT доступна в переводе книги Гнеденко и Колмогорова 1954 года. [16]
Заявление GLCT выглядит следующим образом: [10]
Невырожденная случайная величина Z является α-устойчивой для некоторого 0 < α ≤ 2 тогда и только тогда, когда существует независимая, одинаково распределенная последовательность случайных величин X 1 , X 2 , X 3 , ... и констант a n > 0, b n ∈ ℝ с
а н ( Х 1 + ... + Х n ) − б н → Z.
Здесь → означает, что последовательность сумм случайных величин сходится по распределению, т. е. соответствующие распределения удовлетворяют F n ( y ) → F ( y ) во всех точках непрерывности F.
Другими словами, если суммы независимых одинаково распределенных случайных величин сходятся по распределению к некоторому Z , то Z должно быть устойчивым распределением.
Особые случаи
Не существует общего аналитического решения для формы f ( x ). Однако есть три особых случая, которые могут быть выражены в терминах элементарных функций , как можно увидеть при рассмотрении характеристической функции : [7] [9] [17]
Для распределения это распределение сводится к гауссову с дисперсией σ 2 = 2 c 2 и средним значением μ ; параметр асимметрии не имеет никакого эффекта.
Для и распределение сводится к распределению Коши с параметром масштаба c и параметром сдвига μ .
Для и распределение сводится к распределению Леви с параметром масштаба c и параметром сдвига μ .
Обратите внимание, что три вышеупомянутых распределения также связаны следующим образом: стандартную случайную величину Коши можно рассматривать как смесь гауссовых случайных величин (все со средним значением, равным нулю), с дисперсией, взятой из стандартного распределения Леви. И на самом деле это частный случай более общей теоремы (см. стр. 59 [18] ), которая позволяет рассматривать любое симметричное альфа-устойчивое распределение таким образом (с параметром альфа распределения смеси, равным удвоенному параметру альфа распределения смешивания, и параметром бета распределения смешивания, всегда равным единице).
Общее выражение в замкнутой форме для устойчивых PDF с рациональными значениями доступно в терминах G-функций Мейера . [19] H-функции Фокса также могут использоваться для выражения устойчивых функций плотности вероятности. Для простых рациональных чисел выражение в замкнутой форме часто выражается в терминах менее сложных специальных функций . Доступно несколько выражений в замкнутой форме, имеющих довольно простые выражения в терминах специальных функций. В таблице ниже PDF, выражаемые элементарными функциями, обозначены буквой E , а те, которые выражаются специальными функциями, обозначены буквой s . [18]
Некоторые особые случаи известны под конкретными названиями:
Для и распределение представляет собой распределение Ландау ( L ), которое имеет конкретное применение в физике под этим названием.
Для и распределение сводится к распределению Хольцмарка с параметром масштаба c и параметром сдвига μ .
Кроме того, в пределе, когда c стремится к нулю или когда α стремится к нулю, распределение будет приближаться к дельта-функции Дирака δ ( x − μ ) .
Представление серии
Устойчивое распределение можно переформулировать как действительную часть более простого интеграла: [20]
Выражая вторую экспоненту в виде ряда Тейлора , это приводит к:
где . Обратный порядок интегрирования и суммирования и выполнение интегрирования дает:
что будет справедливо для x ≠ μ и будет сходиться для соответствующих значений параметров. (Обратите внимание, что член n = 0, который дает дельта-функцию в x − μ, поэтому был опущен.) Выражение первой экспоненты в виде ряда даст другой ряд по положительным степеням x − μ , который, как правило, менее полезен.
Для одностороннего устойчивого распределения приведенное выше разложение ряда необходимо модифицировать, поскольку и . Нет действительной части для суммирования. Вместо этого интеграл характеристической функции следует выполнять по отрицательной оси, что дает: [21] [12]
Оценка параметров
В дополнение к существующим тестам на нормальность и последующей оценке параметров , Маккалок разработал общий метод, который опирается на квантили и работает как для симметричных, так и для асимметричных устойчивых распределений и параметра устойчивости . [22]
Моделирование стабильных переменных
Нет аналитических выражений для обратной функции или самой функции CDF , поэтому метод инверсии не может быть использован для генерации стабильно распределенных переменных. [11] [13] Другие стандартные подходы, такие как метод отбрасывания, потребовали бы утомительных вычислений. Элегантное и эффективное решение было предложено Чемберсом, Маллоусом и Стаком (CMS), [23], которые заметили, что определенная интегральная формула [24] дает следующий алгоритм: [25]
Этот алгоритм выдает случайную величину . Подробное доказательство см. [26]
Для моделирования устойчивой случайной величины для всех допустимых значений параметров , и используйте следующее свойство: Если
, то . Для (и ) метод CMS сводится к хорошо известному преобразованию Бокса-Мюллера для генерации гауссовых случайных величин. [27] Хотя в литературе были предложены и другие подходы, включая применение разложений рядов Бергстрёма [28] и ЛеПейджа [29] , метод CMS считается самым быстрым и точным.
Приложения
Стабильные распределения обязаны своей важностью как в теории, так и на практике обобщению центральной предельной теоремы на случайные величины без моментов второго (и, возможно, первого) порядка и сопутствующей самоподобности стабильного семейства. Именно кажущееся отклонение от нормальности вместе с потребностью в самоподобной модели для финансовых данных (т. е. форма распределения для годовых изменений цен активов должна напоминать форму ежедневных или ежемесячных изменений цен составляющих) привело Бенуа Мандельброта к предположению, что цены на хлопок следуют альфа-стабильному распределению с коэффициентом, равным 1,7. [6] Распределения Леви часто встречаются при анализе критического поведения и финансовых данных. [9] [30]
Распределение Леви событий времени ожидания солнечных вспышек (время между событиями вспышек) было продемонстрировано для жестких рентгеновских солнечных вспышек CGRO BATSE в декабре 2001 года. Анализ статистической сигнатуры Леви показал, что были очевидны две различные сигнатуры памяти: одна связана с солнечным циклом, а вторая, происхождение которой, по-видимому, связано с локализованными или комбинацией локализованных эффектов солнечной активной области. [31]
Другие аналитические случаи
Известен ряд случаев аналитически выражаемых устойчивых распределений. Пусть устойчивое распределение выражается через , тогда:
Программа STABLE для Windows доступна на стабильной веб-странице Джона Нолана: http://www.robustanalysis.com/public/stable.html. Она вычисляет плотность (pdf), кумулятивную функцию распределения (cdf) и квантили для общего стабильного распределения, а также выполняет оценку максимального правдоподобия стабильных параметров и некоторые методы разведочного анализа данных для оценки соответствия набора данных.
В научной библиотеке GNU , написанной на языке C, имеется пакет randist , который помимо распределений Гаусса и Коши включает также реализацию альфа-устойчивого распределения Леви, как с параметром перекоса, так и без него.
libstable — это реализация на языке C для функций стабильного распределения PDF, CDF, случайных чисел, квантилей и подгонки (вместе с пакетом репликации эталонных данных и пакетом R).
Пакет R 'stabledist' от Дитхельма Вюрца, Мартина Мейхлера и членов основной команды Rmetrics. Вычисляет стабильную плотность, вероятность, квантили и случайные числа.
Julia предоставляет пакет StableDistributions.jl, который содержит методы генерации, подгонки, плотности вероятности, кумулятивной функции распределения, характеристических и моментных генерирующих функций, квантильных и связанных функций, свертки и аффинных преобразований устойчивых распределений. Он использует модернизированные алгоритмы, улучшенные Джоном П. Ноланом. [10]
Ссылки
^ ab Мандельброт, Б. (1960). «Закон Парето–Леви и распределение доходов». International Economic Review . 1 (2): 79–106. doi :10.2307/2525289. JSTOR 2525289.
^ Мандельброт, Б. (1961). «Стабильные паретианские случайные функции и мультипликативная вариация дохода». Econometrica . 29 (4): 517–543. doi :10.2307/1911802. JSTOR 1911802.
^ Мандельброт, Б. (1963). «Изменение некоторых спекулятивных цен». Журнал бизнеса . 36 (4): 394–419. doi :10.1086/294632. JSTOR 2350970.
^ Фама, Юджин Ф. (1963). «Мандельброт и стабильная паретианская гипотеза». Журнал бизнеса . 36 (4): 420–429. doi :10.1086/294633. JSTOR 2350971.
^ ab Мандельброт, Б. (1963). «Новые методы в статистической экономике». Журнал политической экономии . 71 (5): 421–440. doi :10.1086/258792. S2CID 53004476.
^ abcdef Нолан, Джон П. "Стабильные распределения – модели для данных с тяжелыми хвостами" (PDF) . Архивировано из оригинала (PDF) 2011-07-17 . Получено 2009-02-21 .
^ Сигрист, Кайл. «Стабильные распределения». www.randomservices.org . Получено 18 октября 2018 г.
^ abc Voit, Johannes (2005). Balian, R; Beiglböck, W; Grosse, H; Thirring, W (ред.). Статистическая механика финансовых рынков – Springer . Тексты и монографии по физике. Springer. doi :10.1007/b137351. ISBN978-3-540-26285-5.
^ abc Нолан, Джон П. (2020). Одномерные стабильные распределения, модели для данных с тяжелыми хвостами. Серия Springer по исследованию операций и финансовому инжинирингу. Швейцария: Springer. doi : 10.1007/978-3-030-52915-4. ISBN978-3-030-52914-7. S2CID 226648987.
^ ab Nolan, John P. (1997). «Численный расчет устойчивых плотностей и функций распределения». Communications in Statistics. Стохастические модели . 13 (4): 759–774. doi :10.1080/15326349708807450. ISSN 0882-0287.
^ ab Penson, KA; Górska, K. (2010-11-17). "Точные и явные плотности вероятности для односторонних распределений Леви". Physical Review Letters . 105 (21): 210604. arXiv : 1007.0193 . Bibcode :2010PhRvL.105u0604P. doi :10.1103/PhysRevLett.105.210604. PMID 21231282. S2CID 27497684.
^ abcde Лихн, Стивен (2017). «Теория доходности активов и волатильности при стабильном законе и стабильном лямбда-распределении». SSRN .
^ Le Cam, L. (февраль 1986 г.). «Центральная предельная теорема около 1935 г.». Статистическая наука . 1 (1): 78–91. JSTOR 2245503.
^ Гнеденко, Борис Владимирович; Кологоров, Андрей Николаевич; Дуб, Джозеф Л.; Сюй, Пао-Лу (1968). Предельные распределения для сумм независимых случайных величин . Reading, MA: Addison-wesley.
^ Самородницкий, Г.; Такку, М.С. (1994). Устойчивые негауссовские случайные процессы: стохастические модели с бесконечной дисперсией. CRC Press. ISBN9780412051715.
^ ab Lee, Wai Ha (2010). Непрерывные и дискретные свойства стохастических процессов. Кандидатская диссертация, Ноттингемский университет.
^ Золотарев, В. (1995). «О представлении плотностей устойчивых законов специальными функциями». Теория вероятностей и ее приложения . 39 (2): 354–362. doi :10.1137/1139025. ISSN 0040-585X.
^ ab Peach, G. (1981). "Теория уширения и сдвига спектральных линий под давлением". Advances in Physics . 30 (3): 367–474. Bibcode :1981AdPhy..30..367P. doi :10.1080/00018738100101467. ISSN 0001-8732.
^ Маккалок, Дж. Хьюстон (1986). "Простые согласованные оценки параметров устойчивого распределения" (PDF) . Сообщения по статистике. Моделирование и вычисления . 15 : 1109–1136. doi :10.1080/03610918608812563.
^ Chambers, JM; Mallows, CL; Stuck, BW (1976). «Метод моделирования стабильных случайных величин». Журнал Американской статистической ассоциации . 71 (354): 340–344. doi :10.1080/01621459.1976.10480344. ISSN 0162-1459.
^ Золотарев, В. М. (1986). Одномерные устойчивые распределения . Американское математическое общество. ISBN978-0-8218-4519-6.
^ Misiorek, Adam; Weron, Rafał (2012). Gentle, James E.; Härdle, Wolfgang Karl; Mori, Yuichi (ред.). Heavy-Tailed Distributions in VaR Calculations (PDF) . Springer Handbooks of Computational Statistics. Springer Berlin Heidelberg. стр. 1025–1059. doi :10.1007/978-3-642-21551-3_34. ISBN978-3-642-21550-6.
^ Верон, Рафал (1996). «О методе Чемберса-Мэллоуса-Стак для моделирования перекошенных устойчивых случайных величин». Statistics & Probability Letters . 28 (2): 165–171. CiteSeerX 10.1.1.46.3280 . doi :10.1016/0167-7152(95)00113-1. S2CID 9500064.
^ Яницкий, Александр; Верон, Александр (1994). Моделирование и хаотическое поведение альфа-устойчивых стохастических процессов. CRC Press. ISBN9780824788827.
^ Мантенья, Росарио Нунцио (1994). «Быстрый, точный алгоритм для численного моделирования стабильных стохастических процессов Леви». Physical Review E. 49 ( 5): 4677–4683. Bibcode : 1994PhRvE..49.4677M. doi : 10.1103/PhysRevE.49.4677. PMID 9961762.
^ Яницкий, Александр; Кокошка, Петр (1992). «Компьютерное исследование скорости сходимости рядов типа Лепажа к α-устойчивым случайным величинам». Статистика . 23 (4): 365–373. doi :10.1080/02331889208802383. ISSN 0233-1888.
^ Рачев, Светлозар Т.; Миттник, Стефан (2000). Стабильные паретианские модели в финансах. Wiley. ISBN978-0-471-95314-2.
^ Леддон, Д., Статистическое исследование жестких рентгеновских солнечных вспышек.
^ ab Garoni, TM; Frankel, NE (2002). «Полеты Леви: Точные результаты и асимптотика за пределами всех порядков». Журнал математической физики . 43 (5): 2670–2689. Bibcode : 2002JMP....43.2670G. doi : 10.1063/1.1467095.
^ ab Hopcraft, KI; Jakeman, E.; Tanner, RMJ (1999). «Случайные блуждания Леви с флуктуирующим числом шагов и многомасштабным поведением». Physical Review E. 60 ( 5): 5327–5343. Bibcode :1999PhRvE..60.5327H. doi :10.1103/physreve.60.5327. PMID 11970402.
^ Учайкин, В.В.; Золотарев, В.М. (1999). «Случайность и устойчивость – устойчивые распределения и их приложения». VSP .
^ Злотарев, В. М. (1961). «Выражение плотности устойчивого распределения с показателем альфа больше единицы через частоту с показателем 1/альфа». Избранные переводы по математической статистике и теории вероятностей (перевод с русского: Докл. АН СССР. 98, 735–738 (1954)) . 1 : 163–167.