stringtranslate.com

Характеристическая функция (теория вероятностей)

Характеристическая функция равномерной случайной величины U (–1,1). Эта функция является действительной, поскольку она соответствует случайной величине, симметричной относительно начала координат; однако характеристические функции, как правило, могут быть комплексными.

В теории вероятностей и статистике характеристическая функция любой действительной случайной величины полностью определяет ее распределение вероятностей . Если случайная величина допускает функцию плотности вероятности , то характеристическая функция является преобразованием Фурье (с обратным знаком) функции плотности вероятности. Таким образом, она обеспечивает альтернативный путь к аналитическим результатам по сравнению с работой напрямую с функциями плотности вероятности или кумулятивными функциями распределения . Существуют особенно простые результаты для характеристических функций распределений, определяемых взвешенными суммами случайных величин.

Помимо одномерных распределений , характеристические функции могут быть определены для векторных или матричных случайных величин, а также могут быть расширены на более общие случаи.

Характеристическая функция всегда существует, если рассматривать ее как функцию действительного аргумента, в отличие от функции, генерирующей моменты . Существуют связи между поведением характеристической функции распределения и свойствами распределения, такими как существование моментов и существование функции плотности.

Введение

Характеристическая функция — это способ описания случайной величины . Характеристическая функция ,

функция от t , определяет поведение и свойства распределения вероятностей случайной величины X . Она эквивалентна функции плотности вероятности или кумулятивной функции распределения в том смысле, что зная одну из функций, всегда можно найти другие, однако они дают разное представление о свойствах случайной величины. Более того, в отдельных случаях могут быть различия в том, могут ли эти функции быть представлены в виде выражений, включающих простые стандартные функции.

Если случайная величина допускает функцию плотности , то характеристическая функция является ее Фурье-дуальной , в том смысле, что каждая из них является преобразованием Фурье другой. Если случайная величина имеет функцию, генерирующую момент , то область определения характеристической функции может быть расширена до комплексной плоскости, и

[1]

Однако следует отметить, что характеристическая функция распределения хорошо определена для всех действительных значений t , даже если функция , генерирующая моменты, хорошо определена для всех действительных значений t .

Подход характеристической функции особенно полезен при анализе линейных комбинаций независимых случайных величин: классическое доказательство Центральной предельной теоремы использует характеристические функции и теорему Леви о непрерывности . Другое важное приложение — теория разложимости случайных величин.

Определение

Для скалярной случайной величины X характеристическая функция определяется как ожидаемое значение e itX , где iмнимая единица , а tR — аргумент характеристической функции:

Здесь F Xкумулятивная функция распределения X , f X — соответствующая функция плотности вероятности , Q X ( p ) — соответствующая обратная кумулятивная функция распределения, также называемая функцией квантиля , [2] а интегралы имеют вид Римана–Стилтьеса . Если случайная величина X имеет функцию плотности вероятности , то характеристическая функция — это ее преобразование Фурье с обратным знаком в комплексной экспоненте [3] [ нужна страница ] . [4] Это соглашение для констант, появляющихся в определении характеристической функции, отличается от обычного соглашения для преобразования Фурье. [5] Например, некоторые авторы [6] определяют φ X ( t ) = E[ e −2 πitX ] , что по сути является заменой параметра. В литературе можно встретить и другие обозначения: как характеристическую функцию для вероятностной меры p или как характеристическую функцию, соответствующую плотности f .

Обобщения

Понятие характеристической функции обобщается на многомерные случайные величины и более сложные случайные элементы . Аргумент характеристической функции всегда будет принадлежать непрерывному сопряженному пространству, в котором случайная величина X принимает свои значения. Для общих случаев такие определения перечислены ниже:

Примеры

Оберхеттингер (1973) приводит обширные таблицы характеристических функций.

Характеристики

Непрерывность

Указанная выше биекция между распределениями вероятностей и характеристическими функциями является последовательно непрерывной . То есть, всякий раз, когда последовательность функций распределения F j ( x ) сходится (слабо) к некоторому распределению F ( x ) , соответствующая последовательность характеристических функций φ j ( t ) также будет сходиться, и предел φ ( t ) будет соответствовать характеристической функции закона F . Более формально это формулируется как

Теорема Леви о непрерывности : Последовательность X j n -мерныхслучайных величин сходится по распределению к случайной величине X тогда и только тогда, когда последовательность φ X j сходится поточечно к функции φ, которая непрерывна в начале координат. Где φ — характеристическая функция X . [13]

Эту теорему можно использовать для доказательства закона больших чисел и центральной предельной теоремы .

Формула обращения

Между кумулятивными функциями распределения и характеристическими функциями существует взаимно-однозначное соответствие , поэтому можно найти одну из этих функций, если мы знаем другую. Формула в определении характеристической функции позволяет нам вычислить φ , когда мы знаем функцию распределения F (или плотность f ). Если, с другой стороны, мы знаем характеристическую функцию φ и хотим найти соответствующую функцию распределения, то можно использовать одну из следующих теорем обращения .

Теорема . Если характеристическая функция φ X случайной величины X интегрируема , то F X абсолютно непрерывна, и поэтому X имеет функцию плотности вероятности . В одномерном случае (т.е. когда X имеет скалярное значение) функция плотности имеет вид

В многомерном случае это

где — скалярное произведение .

Функция плотности представляет собой производную Радона–Никодима распределения μ X по мере Лебега λ :

Теорема (Леви) . [примечание 1] Если φ X является характеристической функцией функции распределения F X , две точки a < b таковы, что { x | a < x < b } является множеством непрерывности μ X (в одномерном случае это условие эквивалентно непрерывности F X в точках a и b ), то

Теорема . Если a (возможно) является атомом X (в одномерном случае это означает точку разрыва F X ), то

Теорема (Жиль-Пелаес) . [16] Для одномерной случайной величины X , если x является точкой непрерывности F X, то

где мнимая часть комплексного числа определяется выражением .

И его функция плотности:

Интеграл может не быть интегрируемым по Лебегу ; например, когда Xдискретная случайная величина , которая всегда равна 0, он становится интегралом Дирихле .

Доступны формулы инверсии для многомерных распределений. [14] [17]

Критерии характеристических функций

Множество всех характеристических функций замкнуто относительно некоторых операций:

Хорошо известно, что любая неубывающая функция càdlàg F с пределами F (−∞) = 0 , F (+∞) = 1 соответствует кумулятивной функции распределения некоторой случайной величины. Также интересно найти подобные простые критерии для случая, когда заданная функция φ может быть характеристической функцией некоторой случайной величины. Центральным результатом здесь является теорема Бохнера , хотя ее полезность ограничена, поскольку основное условие теоремы, неотрицательная определенность , очень трудно проверить. Существуют и другие теоремы, такие как теоремы Хинчина, Матиаса или Крамера, хотя их применение столь же сложно. Теорема Полиа , с другой стороны, обеспечивает очень простое условие выпуклости, которое является достаточным, но не необходимым. Характеристические функции, которые удовлетворяют этому условию, называются функциями типа Полиа. [18]

Теорема Бохнера . Произвольная функция φ  : R nC является характеристической функцией некоторой случайной величины тогда и только тогда, когда φ положительно определена , непрерывна в начале координат и если φ (0) = 1 .

Критерий Хинчина . Комплекснозначная, абсолютно непрерывная функция φ , при φ (0) = 1 , является характеристической функцией тогда и только тогда, когда она допускает представление

Теорема Матиаса . Действительная, четная, непрерывная, абсолютно интегрируемая функция φ , при φ (0) = 1 , является характеристической функцией тогда и только тогда, когда

для n = 0,1,2,... и всех p > 0. Здесь H 2 n обозначает многочлен Эрмита степени 2 n .

Теорему Полиа можно использовать для построения примера двух случайных величин, характеристические функции которых совпадают на конечном интервале, но различны в других местах.

Теорема Полиа . Если — вещественная, четная, непрерывная функция, удовлетворяющая условиям

тогда φ ( t ) является характеристической функцией абсолютно непрерывного распределения, симметричного относительно 0.

Использует

Из-за теоремы о непрерывности характеристические функции используются в наиболее часто встречающемся доказательстве центральной предельной теоремы . Основной метод, используемый при выполнении вычислений с характеристической функцией, заключается в распознавании функции как характеристической функции конкретного распределения.

Базовые манипуляции с распределениями

Характеристические функции особенно полезны для работы с линейными функциями независимых случайных величин. Например, если X 1 , X 2 , ..., X n — это последовательность независимых (и не обязательно одинаково распределенных) случайных величин, и

где a i — константы, тогда характеристическая функция для S n определяется выражением

В частности, φ X+Y ( t ) = φ X ( t ) φ Y ( t ) . Чтобы увидеть это, запишем определение характеристической функции:

Для установления равенства третьего и четвертого выражений требуется независимость X и Y.

Другой особый случай, представляющий интерес для одинаково распределенных случайных величин, — это когда a i = 1 / n , а затем S n — это выборочное среднее. В этом случае, записывая X для среднего,

Моменты

Характеристические функции также могут быть использованы для нахождения моментов случайной величины. При условии, что n - й момент существует, характеристическую функцию можно дифференцировать n раз:

Это можно формально записать с использованием производных дельта-функции Дирака : что позволяет формально решить проблему моментов . Например, предположим, что X имеет стандартное распределение Коши . Тогда φ X ( t ) = e −| t | . Это не дифференцируемо при t = 0 , что показывает, что распределение Коши не имеет ожидания . Кроме того, характеристическая функция выборочного среднего X из n независимых наблюдений имеет характеристическую функцию φ X ( t ) = ( e −| t |/ n ) n = e −| t | , используя результат из предыдущего раздела. Это характеристическая функция стандартного распределения Коши: таким образом, выборочное среднее имеет то же распределение, что и сама популяция.

В качестве еще одного примера предположим, что X следует гауссовскому распределению , т.е. Тогда и

Подобный расчет показывает и его легче выполнить, чем применять определение ожидания и использовать интегрирование по частям для оценки .

Логарифм характеристической функции — это функция, производящая кумулянты , которая полезна для нахождения кумулянтов ; некоторые вместо этого определяют функцию, производящую кумулянты, как логарифм функции, производящей момент , и называют логарифм характеристической функции второй функцией, производящей кумулянты.

Анализ данных

Характеристические функции могут использоваться как часть процедур для подгонки распределений вероятностей к выборкам данных. Случаи, когда это обеспечивает практически осуществимый вариант по сравнению с другими возможностями, включают подгонку устойчивого распределения , поскольку выражения в замкнутой форме для плотности недоступны, что затрудняет реализацию оценки максимального правдоподобия . Доступны процедуры оценки, которые сопоставляют теоретическую характеристическую функцию с эмпирической характеристической функцией , рассчитанной по данным. Полсон и др. (1975) [19] и Хиткот (1977) [20] предоставляют некоторую теоретическую основу для такой процедуры оценки. Кроме того, Ю (2004) [21] описывает применение эмпирических характеристических функций для подгонки моделей временных рядов , где процедуры правдоподобия непрактичны. Эмпирические характеристические функции также использовались Ансари и др. (2020) [22] и Ли и др. (2020) [23] для обучения генеративно-состязательных сетей .

Пример

Гамма -распределение с параметром масштаба θ и параметром формы k имеет характеристическую функцию

Теперь предположим, что у нас есть

где X и Y независимы друг от друга, и мы хотим знать, каково распределение X + Y. Характеристические функции имеют вид

что в силу независимости и основных свойств характеристической функции приводит к

Это характеристическая функция параметра масштаба гамма-распределения θ и параметра формы k 1 + k 2 , и поэтому мы заключаем

Результат можно расширить до n независимых гамма-распределенных случайных величин с тем же параметром масштаба, и мы получим

Полные характеристические функции

Как определено выше, аргумент характеристической функции рассматривается как действительное число: однако некоторые аспекты теории характеристических функций развиваются путем расширения определения на комплексную плоскость с помощью аналитического продолжения в случаях, когда это возможно. [24]

Связанные концепции

Связанные концепции включают функцию генерации момента и функцию генерации вероятности . Характеристическая функция существует для всех распределений вероятности. Это не относится к функции генерации момента.

Характеристическая функция тесно связана с преобразованием Фурье : характеристическая функция функции плотности вероятности p ( x ) является комплексно сопряженной функцией непрерывного преобразования Фурье p ( x ) (согласно обычному соглашению; см. непрерывное преобразование Фурье – другие соглашения ).

где P ( t ) обозначает непрерывное преобразование Фурье функции плотности вероятности p ( x ) . Аналогично, p ( x ) может быть восстановлено из φ X ( t ) посредством обратного преобразования Фурье:

Действительно, даже когда случайная величина не имеет плотности, характеристическую функцию можно рассматривать как преобразование Фурье меры, соответствующей случайной величине.

Другая связанная концепция — представление распределений вероятностей как элементов воспроизводящего ядра гильбертова пространства через вложение ядра распределений . Эту структуру можно рассматривать как обобщение характеристической функции при определенных вариантах выбора функции ядра .

Смотрите также

Примечания

  1. ^ назван в честь французского математика Поля Леви

Ссылки

Цитаты

  1. ^ Лукач (1970), стр. 196.
  2. ^ Шоу, У. Т.; МакКейб, Дж. (2009). «Выборка Монте-Карло с учетом характеристической функции: квантильная механика в импульсном пространстве». arXiv : 0903.1592 [q-fin.CP].
  3. ^ Статистическая и адаптивная обработка сигналов (2005)
  4. ^ Биллинсли (1995).
  5. ^ Пинский (2002).
  6. ^ Бохнер (1955).
  7. ^ Андерсен и др. (1995), Определение 1.10.
  8. ^ Андерсен и др. (1995), Определение 1.20.
  9. ^ Собчик (2001), стр. 20.
  10. ^ Kotz & Nadarajah (2004), стр. 37, используя 1 как число степеней свободы для восстановления распределения Коши
  11. ^ Лукач (1970), Следствие 1 к теореме 2.3.1.
  12. ^ "Совместная характеристическая функция". www.statlect.com . Получено 7 апреля 2018 г. .
  13. ^ Куппенс (1975), Теорема 2.6.9.
  14. ^ abc Шепард (1991a).
  15. ^ Куппенс (1975), Теорема 2.3.2.
  16. ^ Вендель (1961).
  17. ^ Шепард (1991b).
  18. ^ Лукач (1970), стр. 84.
  19. ^ Полсон, Холкомб и Лейтч (1975).
  20. ^ Хиткот (1977).
  21. ^ Ю (2004).
  22. ^ Ансари, Скарлетт и Со (2020).
  23. ^ Ли и др. (2020).
  24. Лукач (1970), Глава 7.

Источники

Внешние ссылки