stringtranslate.com

Характеристическая функция (теория вероятностей)

Характеристическая функция равномерной случайной величины U (–1,1). Эта функция имеет действительное значение, поскольку она соответствует случайной величине, симметричной относительно начала координат; однако характеристические функции обычно могут быть комплексными.

В теории вероятностей и статистике характеристическая функция любой действительной случайной величины полностью определяет ее распределение вероятностей . Если случайная величина допускает функцию плотности вероятности , то характеристическая функция представляет собой преобразование Фурье (с изменением знака) функции плотности вероятности. Таким образом, это обеспечивает альтернативный путь к аналитическим результатам по сравнению с прямой работой с функциями плотности вероятности или кумулятивными функциями распределения . Особенно простые результаты получены для характеристических функций распределений, определяемых взвешенными суммами случайных величин.

В дополнение к одномерным распределениям характеристические функции могут быть определены для случайных величин с векторными или матричными значениями, а также могут быть распространены на более общие случаи.

Характеристическая функция всегда существует, если рассматривать ее как функцию действительного аргумента, в отличие от функции, порождающей момент . Существуют связи между поведением характеристической функции распределения и свойствами распределения, такими как существование моментов и существование функции плотности.

Введение

Характеристическая функция – это способ описания случайной величины . Характеристическая функция ,

функция t , полностью определяет поведение и свойства распределения вероятностей случайной величины X. Характеристическая функция аналогична кумулятивной функции распределения ,

(где 1 { X ≤ x }индикаторная функция — она равна 1 при X ≤ x и нулю в противном случае), что также полностью определяет поведение и свойства распределения вероятностей случайной величины X . Эти два подхода эквивалентны в том смысле, что, зная одну из функций, всегда можно найти другую, но они дают разные идеи для понимания особенностей случайной величины. Более того, в отдельных случаях могут быть различия в том, можно ли представить эти функции в виде выражений, включающих простые стандартные функции.

Если случайная величина допускает функцию плотности , то характеристическая функция является ее двойственной Фурье в том смысле, что каждая из них является преобразованием Фурье другой. Если случайная величина имеет производящую момент функцию , то область определения характеристической функции можно расширить до комплексной плоскости, и

[1]

Однако обратите внимание, что характеристическая функция распределения всегда существует, даже если функция плотности вероятности или функция, генерирующая момент, не существуют.

Подход характеристических функций особенно полезен при анализе линейных комбинаций независимых случайных величин: классическое доказательство Центральной предельной теоремы использует характеристические функции и теорему о непрерывности Леви . Другое важное приложение — к теории разложимости случайных величин.

Определение

Для скалярной случайной величины X характеристическая функция определяется как ожидаемое значение e itX , где iмнимая единица , а tR аргумент характеристической функции:

Здесь F Xкумулятивная функция распределения X , f X — соответствующая функция плотности вероятности , Q X ( p ) — соответствующая обратная кумулятивная функция распределения, также называемая функцией квантиля , [2] и интегралы имеют вид Римана –Стилтьеса добрый. Если случайная величина X имеет функцию плотности вероятности , то характеристической функцией является ее преобразование Фурье с изменением знака в комплексной экспоненте [3] [ нужна страница ] . [4] Это соглашение о константах, входящих в определение характеристической функции, отличается от обычного соглашения о преобразовании Фурье. [5] Например, некоторые авторы [6] определяют φ X ( t ) = E e −2 πitX , что по сути является заменой параметра. В литературе можно встретить и другие обозначения: как характеристическую функцию для вероятностной меры p или как характеристическую функцию, соответствующую плотности f .

Обобщения

Понятие характеристических функций распространяется на многомерные случайные величины и более сложные случайные элементы . Аргумент характеристической функции всегда будет принадлежать непрерывному двойственному пространству, в котором случайная величина X принимает свои значения. Для распространенных случаев такие определения перечислены ниже:

Примеры

Оберхеттингер (1973) приводит обширные таблицы характеристических функций.

Характеристики

Непрерывность

Установленная выше биекция между распределениями вероятностей и характеристическими функциями является секвенциально непрерывной . То есть всякий раз, когда последовательность функций распределения F j ( x ) сходится (слабо) к некоторому распределению F ( x ), соответствующая последовательность характеристических функций φ j ( t ) также будет сходиться, и предел φ ( t ) будет соответствовать к характеристической функции закона F . Более формально это формулируется как

Теорема Леви о непрерывности : последовательность X j случайных величин с n-мерамисходится по распределению к случайной величине X тогда и только тогда, когда последовательность φ X j сходится поточечно к функции φ, непрерывной в начале координат.—характеристическая функция X. [13]

Эту теорему можно использовать для доказательства закона больших чисел и центральной предельной теоремы .

Формула инверсии

Между кумулятивными функциями распределения и характеристическими функциями существует взаимно однозначное соответствие , поэтому можно найти одну из этих функций, если мы знаем другую. Формула в определении характеристической функции позволяет нам вычислить φ , когда мы знаем функцию распределения F (или плотность f ). Если, с другой стороны, мы знаем характеристическую функцию φ и хотим найти соответствующую функцию распределения, то можно использовать одну из следующих теорем обращения .

Теорема . Если характеристическая функция φ X случайной величины X интегрируема , то F X абсолютно непрерывна, и, следовательно, X имеет функцию плотности вероятности . В одномерном случае (т.е. когда X скалярнозначно) функция плотности определяется выражением

В многомерном случае это

где скалярное произведение .

Функция плотности представляет собой производную Радона–Никодима распределения µ X по мере Лебега λ :

Теорема (Леви) . [примечание 1] Если φ X является характеристической функцией функции распределения F X , две точки a  <  b таковы, что { x | a < x < b }множество непрерывности µ X (в одномерном случае это условие эквивалентно непрерывности F X в точках a и b ), тогда

Теорема . Если a (возможно) является атомом X (в одномерном случае это означает точку разрыва F X ), то

Теорема (Жиль-Пелаес) . [16] Для одномерной случайной величины X , если x является точкой непрерывности F X , то

где мнимая часть комплексного числа равна .

А его функция плотности:

Интеграл может быть не интегрируемым по Лебегу ; например, когда Xдискретная случайная величина , которая всегда равна 0, она становится интегралом Дирихле .

Доступны формулы обращения для многомерных распределений. [14] [17]

Критерии характеристических функций

Множество всех характеристических функций замыкается при определенных операциях:

Хорошо известно, что любая неубывающая функция распределения F с пределами F (−∞) = 0, F (+∞) = 1 соответствует кумулятивной функции распределения некоторой случайной величины. Также существует интерес найти аналогичные простые критерии того, когда данная функция φ может быть характеристической функцией некоторой случайной величины. Центральным результатом здесь является теорема Бохнера , хотя ее полезность ограничена, поскольку главное условие теоремы — неотрицательная определенность — очень трудно проверить. Существуют и другие теоремы, например теоремы Хинчина, Матиаса или Крамера, хотя их применение столь же сложно. С другой стороны, теорема Полиа дает очень простое условие выпуклости, которое является достаточным, но не необходимым . Характеристические функции, удовлетворяющие этому условию, называются типами Полиа. [18]

Теорема Бохнера . Произвольная функция φ  : Rn C является характеристической функцией некоторой случайной величины тогда и только тогда, когда φ положительно определена , непрерывна в начале координат и если φ (0) = 1.

Критерий Хинчина . Комплекснозначная абсолютно непрерывная функция φ с φ (0) = 1 является характеристической функцией тогда и только тогда, когда она допускает представление

Теорема Матиаса . Действительная, четная, непрерывная, абсолютно интегрируемая функция φ с φ (0) = 1 является характеристической функцией тогда и только тогда, когда

для n = 0,1,2,... и всех p > 0. Здесь H 2 n обозначает полином Эрмита степени 2 n .

Теорему Полиа можно использовать для построения примера двух случайных величин, характеристические функции которых совпадают на конечном интервале, но различны в других местах.

Теорема Полиа . If — вещественная четная непрерывная функция, удовлетворяющая условиям

тогда φ ( t ) — характеристическая функция абсолютно непрерывного распределения, симметричного относительно 0.

Использование

Из-за теоремы о непрерывности характеристические функции используются в наиболее часто встречающемся доказательстве центральной предельной теоремы . Основной прием вычислений с характеристической функцией заключается в признании этой функции характеристической функцией определенного распределения.

Базовые манипуляции с дистрибутивами

Характеристические функции особенно полезны при работе с линейными функциями независимых случайных величин. Например, если X 1 , X 2 , ..., X n представляет собой последовательность независимых (и не обязательно одинаково распределенных) случайных величин, и

где a i константы, то характеристическая функция для Sn определяется выражением

В частности, φ X+Y ( t ) = φ X ( t ) φ Y ( t ) . Чтобы убедиться в этом, выпишите определение характеристической функции:

Независимость X и Y необходима для установления равенства третьего и четвертого выражений.

Другой особый случай, представляющий интерес для одинаково распределенных случайных величин, — это когда a i = 1/ n , а затем S n — выборочное среднее. В этом случае, записывая X для обозначения среднего значения,

Моменты

Характеристические функции также можно использовать для поиска моментов случайной величины. При условии существования n- го момента характеристическую функцию можно дифференцировать n раз:

Формально это можно записать с помощью производных дельта-функции Дирака :

проблему моментовXраспределение Кошиφ Икс ( т ) знак равно е −| т |дифференцируемоtожиданияXнезависимыхφ X ( t ) = ( e −| t | / n ) n = e −| т |

В качестве дальнейшего примера предположим, что X соответствует распределению Гаусса , т.е. Тогда и

Подобный расчет показывает, что его легче выполнить, чем применять определение ожидания и использовать для оценки интегрирование по частям .

Логарифм характеристической функции является производящей функцией кумулянта , которая полезна для нахождения кумулянтов ; некоторые вместо этого определяют кумулянтную производящую функцию как логарифм функции, генерирующей момент , и называют логарифм характеристической функции второй кумулянтной производящей функцией.

Анализ данных

Характеристические функции могут использоваться как часть процедур подбора вероятностных распределений к выборкам данных. Случаи, когда это обеспечивает практический вариант по сравнению с другими возможностями, включают подбор стабильного распределения , поскольку выражения для плотности в замкнутой форме недоступны, что затрудняет реализацию оценки максимального правдоподобия . Доступны процедуры оценки, которые сопоставляют теоретическую характеристическую функцию с эмпирической характеристической функцией , рассчитанной на основе данных. Полсон и др. (1975) [19] и Heathcote (1977) [20] предоставляют некоторую теоретическую основу для такой процедуры оценки. Кроме того, Ю (2004) [21] описывает применение эмпирических характеристических функций для подбора моделей временных рядов , где процедуры правдоподобия непрактичны. Эмпирические характеристические функции также использовались Ансари и др. (2020) [22] и Ли и др. (2020) [23] для обучения генеративно-состязательных сетей .

Пример

Гамма- распределение с параметром масштаба θ и параметром формы k имеет характеристическую функцию

Теперь предположим, что у нас есть

где X и Y независимы друг от друга, и мы хотим знать, каково распределение X + Y. Характеристическими функциями являются

что в силу независимости и основных свойств характеристической функции приводит к

Это характеристическая функция параметра масштаба гамма-распределения θ и параметра формы k 1 + k 2 , и поэтому мы заключаем

Результат можно расширить до n независимых гамма-распределенных случайных величин с тем же масштабным параметром, и мы получим

Целые характеристические функции

Как определено выше, аргумент характеристической функции рассматривается как действительное число: однако некоторые аспекты теории характеристических функций развиваются путем расширения определения в комплексную плоскость путем аналитического продолжения в тех случаях, когда это возможно. [24]

Связанные понятия

Связанные понятия включают функцию, генерирующую момент, и функцию, генерирующую вероятность . Характеристическая функция существует для всех распределений вероятностей. Это не относится к функции, производящей момент.

Характеристическая функция тесно связана с преобразованием Фурье : характеристическая функция функции плотности вероятности p ( x ) является комплексно-сопряженным непрерывным преобразованием Фурье p ( x ) (согласно обычному соглашению; см. непрерывное преобразование Фурье - другое конвенции ).

где P ( t ) обозначает непрерывное преобразование Фурье функции плотности вероятности p ( x ). Аналогично, p ( x ) можно восстановить из φ X ( t ) посредством обратного преобразования Фурье:

Действительно, даже если случайная величина не имеет плотности, характеристическую функцию можно рассматривать как преобразование Фурье меры, соответствующей случайной величине.

Другая связанная концепция — представление вероятностных распределений как элементов воспроизводящего ядра гильбертова пространства посредством встраивания распределений в ядро . Эту структуру можно рассматривать как обобщение характеристической функции при конкретном выборе функции ядра .

Смотрите также

Примечания

  1. ^ назван в честь французского математика Поля Леви

Рекомендации

Цитаты

  1. ^ Лукач (1970), с. 196.
  2. ^ Шоу, WT; Маккейб, Дж. (2009). «Выборка методом Монте-Карло с учетом характеристической функции: квантильная механика в пространстве импульсов». arXiv : 0903.1592 [q-fin.CP].
  3. ^ Статистическая и адаптивная обработка сигналов (2005)
  4. ^ Биллингсли (1995).
  5. ^ Пинский (2002).
  6. ^ Бохнер (1955).
  7. ^ Андерсен и др. (1995), Определение 1.10.
  8. ^ Андерсен и др. (1995), Определение 1.20.
  9. ^ Собчик (2001), с. 20.
  10. ^ Коц и Надараджа (2004), с. 37, используя 1 как число степеней свободы для восстановления распределения Коши.
  11. ^ Лукач (1970), Следствие 1 к теореме 2.3.1.
  12. ^ «Совместная характеристическая функция» . www.statlect.com . Проверено 7 апреля 2018 г.
  13. ^ Куппенс (1975), Теорема 2.6.9.
  14. ^ abc Шепард (1991a).
  15. ^ Куппенс (1975), Теорема 2.3.2.
  16. ^ Вендель (1961).
  17. ^ Шепард (1991b).
  18. ^ Лукач (1970), с. 84.
  19. ^ Полсон, Холкомб и Лейтч (1975).
  20. ^ Хиткот (1977).
  21. ^ Ю (2004).
  22. ^ Ансари, Скарлетт и Со (2020).
  23. ^ Ли и др. (2020).
  24. ^ Лукач (1970), Глава 7.

Источники

Внешние ссылки