Преобразование Фурье функции плотности вероятности
Характеристическая функция равномерной случайной величины U (–1,1). Эта функция имеет действительное значение, поскольку она соответствует случайной величине, симметричной относительно начала координат; однако характеристические функции обычно могут быть комплексными.
В дополнение к одномерным распределениям характеристические функции могут быть определены для случайных величин с векторными или матричными значениями, а также могут быть распространены на более общие случаи.
Характеристическая функция всегда существует, если рассматривать ее как функцию действительного аргумента, в отличие от функции, порождающей момент . Существуют связи между поведением характеристической функции распределения и свойствами распределения, такими как существование моментов и существование функции плотности.
Введение
Характеристическая функция – это способ описания случайной величины . Характеристическая функция ,
функция t , полностью определяет поведение и свойства распределения вероятностей случайной величины X. Характеристическая функция аналогична кумулятивной функции распределения ,
(где 1 { X ≤ x } — индикаторная функция — она равна 1 при X ≤ x и нулю в противном случае), что также полностью определяет поведение и свойства распределения вероятностей случайной величины X . Эти два подхода эквивалентны в том смысле, что, зная одну из функций, всегда можно найти другую, но они дают разные идеи для понимания особенностей случайной величины. Более того, в отдельных случаях могут быть различия в том, можно ли представить эти функции в виде выражений, включающих простые стандартные функции.
Если случайная величина допускает функцию плотности , то характеристическая функция является ее двойственной Фурье в том смысле, что каждая из них является преобразованием Фурье другой. Если случайная величина имеет производящую момент функцию , то область определения характеристической функции можно расширить до комплексной плоскости, и
Подход характеристических функций особенно полезен при анализе линейных комбинаций независимых случайных величин: классическое доказательство Центральной предельной теоремы использует характеристические функции и теорему о непрерывности Леви . Другое важное приложение — к теории разложимости случайных величин.
Определение
Для скалярной случайной величины X характеристическая функция определяется как ожидаемое значение e itX , где i — мнимая единица , а t ∈ R — аргумент характеристической функции:
Здесь F X — кумулятивная функция распределения X , f X — соответствующая функция плотности вероятности , Q X ( p ) — соответствующая обратная кумулятивная функция распределения, также называемая функцией квантиля , [2] и интегралы имеют вид Римана –Стилтьеса добрый. Если случайная величина X имеет функцию плотности вероятности , то характеристической функцией является ее преобразование Фурье с изменением знака в комплексной экспоненте [3] [ нужна страница ] . [4] Это соглашение о константах, входящих в определение характеристической функции, отличается от обычного соглашения о преобразовании Фурье. [5] Например, некоторые авторы [6] определяют φ X ( t ) = E e −2 πitX , что по сути является заменой параметра. В литературе можно встретить и другие обозначения: как характеристическую функцию для вероятностной меры p или как характеристическую функцию, соответствующую плотности f .
Обобщения
Понятие характеристических функций распространяется на многомерные случайные величины и более сложные случайные элементы . Аргумент характеристической функции всегда будет принадлежать непрерывному двойственному пространству, в котором случайная величина X принимает свои значения. Для распространенных случаев такие определения перечислены ниже:
Если X ( s ) — случайный процесс , то для всех функций t ( s ) таких, что интеграл сходится для почти всех реализаций X [9]
Примеры
Оберхеттингер (1973) приводит обширные таблицы характеристических функций.
Характеристики
Характеристическая функция вещественной случайной величины всегда существует, поскольку она является интегралом от ограниченной непрерывной функции в пространстве, мера которого конечна.
Оно не обращается в нуль в области около нуля: φ(0) = 1.
Оно ограничено: |φ( t )| ≤ 1.
Оно эрмитово : φ(− t ) = φ( t ) . В частности, характеристическая функция симметричной (вокруг начала координат) случайной величины является вещественной и четной .
Существует биекция между распределениями вероятностей и характеристическими функциями. То есть для любых двух случайных величин X 1 , X 2 обе имеют одинаковое распределение вероятностей тогда и только тогда, когда . [ нужна цитата ]
Если случайная величина X имеет моменты до k -го порядка, то характеристическая функция φ X k раз непрерывно дифференцируема на всей вещественной прямой. В этом случае
Если характеристическая функция φ X имеет k -ю производную в нуле, то случайная величина X имеет все моменты до k , если k четное, и только до k – 1, если k нечетное. [11]
Если X 1 , ..., X n — независимые случайные величины, а a 1 , ..., an — некоторые константы, то характеристическая функция линейной комбинации X i равна
Одним из конкретных случаев является сумма двух независимых случайных величин X 1 и X 2 , и в этом случае имеем
Пусть и две случайные величины с характеристическими функциями и . и независимы тогда и только тогда, когда .
Хвостовое поведение характеристической функции определяет гладкость соответствующей функции плотности.
Пусть случайная величина является линейным преобразованием случайной величины . Характеристическая функция . Для случайных векторов и (где A — постоянная матрица, а B — постоянный вектор) имеем . [12]
Непрерывность
Установленная выше биекция между распределениями вероятностей и характеристическими функциями является секвенциально непрерывной . То есть всякий раз, когда последовательность функций распределения F j ( x ) сходится (слабо) к некоторому распределению F ( x ), соответствующая последовательность характеристических функций φ j ( t ) также будет сходиться, и предел φ ( t ) будет соответствовать к характеристической функции закона F . Более формально это формулируется как
Теорема Леви о непрерывности : последовательность X j случайных величин с n-мерамисходится по распределению к случайной величине X тогда и только тогда, когда последовательность φ X j сходится поточечно к функции φ, непрерывной в начале координат.—характеристическая функция X. [13]
Между кумулятивными функциями распределения и характеристическими функциями существует взаимно однозначное соответствие , поэтому можно найти одну из этих функций, если мы знаем другую. Формула в определении характеристической функции позволяет нам вычислить φ , когда мы знаем функцию распределения F (или плотность f ). Если, с другой стороны, мы знаем характеристическую функцию φ и хотим найти соответствующую функцию распределения, то можно использовать одну из следующих теорем обращения .
Теорема . Если характеристическая функция φ X случайной величины X интегрируема , то F X абсолютно непрерывна, и, следовательно, X имеет функцию плотности вероятности . В одномерном случае (т.е. когда X скалярнозначно) функция плотности определяется выражением
Теорема (Леви) . [примечание 1] Если φ X является характеристической функцией функции распределения F X , две точки a < b таковы, что { x | a < x < b } — множество непрерывности µ X (в одномерном случае это условие эквивалентно непрерывности F X в точках a и b ), тогда
Если X скаляр:
Эту формулу можно переформулировать в более удобном для численного расчета виде: [14]
Для случайной величины, ограниченной снизу, можно получить , взяв такое, что В противном случае, если случайная величина не ограничена снизу, предел для дает , но численно непрактично. [14]
Если X — векторная случайная величина:
Теорема . Если a (возможно) является атомом X (в одномерном случае это означает точку разрыва F X ), то
Если X скаляр:
Если X — векторная случайная величина: [15]
Теорема (Жиль-Пелаес) . [16] Для одномерной случайной величины X , если x является точкой непрерывности F X , то
Доступны формулы обращения для многомерных распределений. [14] [17]
Критерии характеристических функций
Множество всех характеристических функций замыкается при определенных операциях:
Выпуклая линейная комбинация (с ) конечного или счетного числа характеристических функций также является характеристической функцией.
Произведение конечного числа характеристических функций также является характеристической функцией. То же самое справедливо и для бесконечного произведения при условии, что оно сходится к функции, непрерывной в начале координат.
Если φ — характеристическая функция и α — действительное число, то , Re( φ ), | φ | 2 и φ ( αt ) также являются характеристическими функциями.
Хорошо известно, что любая неубывающая функция распределения F с пределами F (−∞) = 0, F (+∞) = 1 соответствует кумулятивной функции распределения некоторой случайной величины. Также существует интерес найти аналогичные простые критерии того, когда данная функция φ может быть характеристической функцией некоторой случайной величины. Центральным результатом здесь является теорема Бохнера , хотя ее полезность ограничена, поскольку главное условие теоремы — неотрицательная определенность — очень трудно проверить. Существуют и другие теоремы, например теоремы Хинчина, Матиаса или Крамера, хотя их применение столь же сложно. С другой стороны, теорема Полиа дает очень простое условие выпуклости, которое является достаточным, но не необходимым . Характеристические функции, удовлетворяющие этому условию, называются типами Полиа. [18]
Теорема Бохнера . Произвольная функция φ : Rn → C является характеристической функцией некоторой случайной величины тогда и только тогда, когда φ положительно определена , непрерывна в начале координат и если φ (0) = 1.
Критерий Хинчина . Комплекснозначная абсолютно непрерывная функция φ с φ (0) = 1 является характеристической функцией тогда и только тогда, когда она допускает представление
Теорема Матиаса . Действительная, четная, непрерывная, абсолютно интегрируемая функция φ с φ (0) = 1 является характеристической функцией тогда и только тогда, когда
для n = 0,1,2,... и всех p > 0. Здесь H 2 n обозначает полином Эрмита степени 2 n .
Теорему Полиа можно использовать для построения примера двух случайных величин, характеристические функции которых совпадают на конечном интервале, но различны в других местах.
тогда φ ( t ) — характеристическая функция абсолютно непрерывного распределения, симметричного относительно 0.
Использование
Из-за теоремы о непрерывности характеристические функции используются в наиболее часто встречающемся доказательстве центральной предельной теоремы . Основной прием вычислений с характеристической функцией заключается в признании этой функции характеристической функцией определенного распределения.
Базовые манипуляции с дистрибутивами
Характеристические функции особенно полезны при работе с линейными функциями независимых случайных величин. Например, если X 1 , X 2 , ..., X n представляет собой последовательность независимых (и не обязательно одинаково распределенных) случайных величин, и
где a i — константы, то характеристическая функция для Sn определяется выражением
В частности, φ X+Y ( t ) = φ X ( t ) φ Y ( t ) . Чтобы убедиться в этом, выпишите определение характеристической функции:
Независимость X и Y необходима для установления равенства третьего и четвертого выражений.
Другой особый случай, представляющий интерес для одинаково распределенных случайных величин, — это когда a i = 1/ n , а затем S n — выборочное среднее. В этом случае, записывая X для обозначения среднего значения,
Моменты
Характеристические функции также можно использовать для поиска моментов случайной величины. При условии существования n- го момента характеристическую функцию можно дифференцировать n раз:
В качестве дальнейшего примера предположим, что X соответствует распределению Гаусса , т.е. Тогда и
Подобный расчет показывает, что его легче выполнить, чем применять определение ожидания и использовать для оценки интегрирование по частям .
Логарифм характеристической функции является производящей функцией кумулянта , которая полезна для нахождения кумулянтов ; некоторые вместо этого определяют кумулянтную производящую функцию как логарифм функции, генерирующей момент , и называют логарифм характеристической функции второй кумулянтной производящей функцией.
Анализ данных
Характеристические функции могут использоваться как часть процедур подбора вероятностных распределений к выборкам данных. Случаи, когда это обеспечивает практический вариант по сравнению с другими возможностями, включают подбор стабильного распределения , поскольку выражения для плотности в замкнутой форме недоступны, что затрудняет реализацию оценки максимального правдоподобия . Доступны процедуры оценки, которые сопоставляют теоретическую характеристическую функцию с эмпирической характеристической функцией , рассчитанной на основе данных. Полсон и др. (1975) [19] и Heathcote (1977) [20] предоставляют некоторую теоретическую основу для такой процедуры оценки. Кроме того, Ю (2004) [21] описывает применение эмпирических характеристических функций для подбора моделей временных рядов , где процедуры правдоподобия непрактичны. Эмпирические характеристические функции также использовались Ансари и др. (2020) [22] и Ли и др. (2020) [23] для обучения генеративно-состязательных сетей .
Пример
Гамма- распределение с параметром масштаба θ и параметром формы k имеет характеристическую функцию
Теперь предположим, что у нас есть
где X и Y независимы друг от друга, и мы хотим знать, каково распределение X + Y. Характеристическими функциями являются
что в силу независимости и основных свойств характеристической функции приводит к
Это характеристическая функция параметра масштаба гамма-распределения θ и параметра формы k 1 + k 2 , и поэтому мы заключаем
Результат можно расширить до n независимых гамма-распределенных случайных величин с тем же масштабным параметром, и мы получим
Целые характеристические функции
Как определено выше, аргумент характеристической функции рассматривается как действительное число: однако некоторые аспекты теории характеристических функций развиваются путем расширения определения в комплексную плоскость путем аналитического продолжения в тех случаях, когда это возможно. [24]
где P ( t ) обозначает непрерывное преобразование Фурье функции плотности вероятности p ( x ). Аналогично, p ( x ) можно восстановить из φ X ( t ) посредством обратного преобразования Фурье:
Действительно, даже если случайная величина не имеет плотности, характеристическую функцию можно рассматривать как преобразование Фурье меры, соответствующей случайной величине.
Другая связанная концепция — представление вероятностных распределений как элементов воспроизводящего ядра гильбертова пространства посредством встраивания распределений в ядро . Эту структуру можно рассматривать как обобщение характеристической функции при конкретном выборе функции ядра .
Смотрите также
Субнезависимость — более слабое условие, чем независимость, определяемое через характеристические функции.
Кумулянт — член производящих функций кумулянта , которые представляют собой журналы характеристических функций.
Примечания
^ назван в честь французского математика Поля Леви
Рекомендации
Цитаты
^ Лукач (1970), с. 196.
^ Шоу, WT; Маккейб, Дж. (2009). «Выборка методом Монте-Карло с учетом характеристической функции: квантильная механика в пространстве импульсов». arXiv : 0903.1592 [q-fin.CP].
^ Статистическая и адаптивная обработка сигналов (2005)
^ Биллингсли (1995).
^ Пинский (2002).
^ Бохнер (1955).
^ Андерсен и др. (1995), Определение 1.10.
^ Андерсен и др. (1995), Определение 1.20.
^ Собчик (2001), с. 20.
^ Коц и Надараджа (2004), с. 37, используя 1 как число степеней свободы для восстановления распределения Коши.
^ Лукач (1970), Следствие 1 к теореме 2.3.1.
^ «Совместная характеристическая функция» . www.statlect.com . Проверено 7 апреля 2018 г.
^ Куппенс (1975), Теорема 2.6.9.
^ abc Шепард (1991a).
^ Куппенс (1975), Теорема 2.3.2.
^ Вендель (1961).
^ Шепард (1991b).
^ Лукач (1970), с. 84.
^ Полсон, Холкомб и Лейтч (1975).
^ Хиткот (1977).
^ Ю (2004).
^ Ансари, Скарлетт и Со (2020).
^ Ли и др. (2020).
^ Лукач (1970), Глава 7.
Источники
Андерсен, Х.Х.; Хойбьерре, М.; Соренсен, Д.; Эриксен, П.С. (1995). Линейные и графические модели многомерного комплексного нормального распределения . Конспекты лекций по статистике 101. Нью-Йорк: Springer-Verlag. ISBN 978-0-387-94521-7.
Биллингсли, Патрик (1995). Вероятность и мера (3-е изд.). Джон Уайли и сыновья. ISBN 978-0-471-00710-4.
Бисгаард, ТМ; Сасвари, З. (2000). Характеристические функции и последовательности моментов . Нова Наука.
Бохнер, Саломон (1955). Гармонический анализ и теория вероятностей . Издательство Калифорнийского университета.
Куппенс, Р. (1975). Разложение многомерных вероятностей . Академическая пресса. ISBN 9780121994501.
Лукач, Э. (1970). Характеристические функции . Лондон: Гриффин.
Коц, Сэмюэл; Надараджа, Саралис (2004). Многомерные Т-распределения и их приложения . Издательство Кембриджского университета.
Манолакис, Димитрис Г.; Ингл, Винай К.; Когон, Стивен М. (2005). Статистическая и адаптивная обработка сигналов: спектральная оценка, моделирование сигналов, адаптивная фильтрация и обработка массивов. Артех Хаус. ISBN 978-1-58053-610-3.
Оберхеттингер, Фриц (1973). Преобразования Фурье распределений и их обратные значения; сборник таблиц . Нью-Йорк: Академическая пресса. ISBN 9780125236508.
Вендель, Дж. Г. (1961). «Неабсолютная сходимость интеграла обращения Жиля-Пелаеса». Анналы математической статистики . 32 (1): 338–339. дои : 10.1214/aoms/1177705164 .
Ю, Дж. (2004). «Оценка эмпирической характеристической функции и ее приложения» (PDF) . Эконометрические обзоры . 23 (2): 93–1223. дои : 10.1081/ETC-120039605. S2CID 9076760.
Шепард, Нью-Йорк (1991a). «От характеристической функции к функции распределения: простая основа теории». Эконометрическая теория . 7 (4): 519–529. дои : 10.1017/s0266466600004746. S2CID 14668369.
Шепард, Нью-Йорк (1991b). «Правила численного интегрирования для многомерных инверсий». Журнал статистических вычислений и моделирования . 39 (1–2): 37–46. дои : 10.1080/00949659108811337.
Ансари, Абдул Фатир; Скарлетт, Джонатан; Итак, Гарольд (2020). «Подход с характеристическими функциями к глубокому неявному генеративному моделированию». Материалы конференции IEEE/CVF по компьютерному зрению и распознаванию образов (CVPR), 2020 . стр. 7478–7487.
Ли, Шэнси; Ю, Цзэян; Сян, Мин; Мандич, Данило (2020). «Взаимное состязательное обучение через характеристические функции». Достижения в области нейронных систем обработки информации 33 (NeurIPS 2020) .