Помимо одномерных распределений , характеристические функции могут быть определены для векторных или матричных случайных величин, а также могут быть расширены на более общие случаи.
Характеристическая функция всегда существует, если рассматривать ее как функцию действительного аргумента, в отличие от функции, генерирующей моменты . Существуют связи между поведением характеристической функции распределения и свойствами распределения, такими как существование моментов и существование функции плотности.
Введение
Характеристическая функция — это способ описания случайной величины . Характеристическая функция ,
функция от t , определяет поведение и свойства распределения вероятностей случайной величины X . Она эквивалентна функции плотности вероятности или кумулятивной функции распределения в том смысле, что зная одну из функций, всегда можно найти другие, однако они дают разное представление о свойствах случайной величины. Более того, в отдельных случаях могут быть различия в том, могут ли эти функции быть представлены в виде выражений, включающих простые стандартные функции.
Если случайная величина допускает функцию плотности , то характеристическая функция является ее Фурье-дуальной , в том смысле, что каждая из них является преобразованием Фурье другой. Если случайная величина имеет функцию, генерирующую момент , то область определения характеристической функции может быть расширена до комплексной плоскости, и
[1]
Однако следует отметить, что характеристическая функция распределения хорошо определена для всех действительных значений t , даже если функция , генерирующая моменты, хорошо определена для всех действительных значений t .
Подход характеристической функции особенно полезен при анализе линейных комбинаций независимых случайных величин: классическое доказательство Центральной предельной теоремы использует характеристические функции и теорему Леви о непрерывности . Другое важное приложение — теория разложимости случайных величин.
Определение
Для скалярной случайной величины X характеристическая функция определяется как ожидаемое значение e itX , где i — мнимая единица , а t ∈ R — аргумент характеристической функции:
Здесь F X — кумулятивная функция распределения X , f X — соответствующая функция плотности вероятности , Q X ( p ) — соответствующая обратная кумулятивная функция распределения, также называемая функцией квантиля , [2] а интегралы имеют вид Римана–Стилтьеса . Если случайная величина X имеет функцию плотности вероятности , то характеристическая функция — это ее преобразование Фурье с обратным знаком в комплексной экспоненте [3] [ нужна страница ] . [4] Это соглашение для констант, появляющихся в определении характеристической функции, отличается от обычного соглашения для преобразования Фурье. [5] Например, некоторые авторы [6] определяют φ X ( t ) = E[ e −2 πitX ] , что по сути является заменой параметра. В литературе можно встретить и другие обозначения: как характеристическую функцию для вероятностной меры p или как характеристическую функцию, соответствующую плотности f .
Обобщения
Понятие характеристической функции обобщается на многомерные случайные величины и более сложные случайные элементы . Аргумент характеристической функции всегда будет принадлежать непрерывному сопряженному пространству, в котором случайная величина X принимает свои значения. Для общих случаев такие определения перечислены ниже:
Если X — k -мерный комплексный случайный вектор , то для t ∈ C k [8] где — сопряженное транспонирование вектора ,
Если X ( s ) — случайный процесс , то для всех функций t ( s ) таких, что интеграл сходится для почти всех реализаций X [9]
Примеры
Оберхеттингер (1973) приводит обширные таблицы характеристических функций.
Характеристики
Характеристическая функция действительной случайной величины всегда существует, поскольку она является интегралом ограниченной непрерывной функции по пространству, мера которого конечна.
Он не обращается в нуль в области около нуля: φ (0) = 1 .
Он ограничен: | φ ( t ) | ≤ 1 .
Она эрмитова : φ (− t ) = φ ( t ) . В частности, характеристическая функция симметричной (вокруг начала координат) случайной величины является действительной и четной .
Существует биекция между распределениями вероятностей и характеристическими функциями. То есть, для любых двух случайных величин X 1 , X 2 , обе имеют одинаковое распределение вероятностей тогда и только тогда, когда . [ необходима цитата ]
Если случайная величина X имеет моменты до k -го порядка, то характеристическая функция φ X k раз непрерывно дифференцируема на всей действительной прямой. В этом случае
Если характеристическая функция φ X имеет k -ю производную в нуле, то случайная величина X имеет все моменты до k , если k четное, но только до k – 1 , если k нечетное. [11]
Если X 1 , ..., X n — независимые случайные величины, а a 1 , ..., a n — некоторые константы, то характеристическая функция линейной комбинации переменных X i равна Одним из частных случаев является сумма двух независимых случайных величин X 1 и X 2 , в этом случае имеем
Пусть и — две случайные величины с характеристическими функциями и . И независимы тогда и только тогда, когда .
Поведение хвоста характеристической функции определяет гладкость соответствующей функции плотности.
Пусть случайная величина будет линейным преобразованием случайной величины . Характеристическая функция есть . Для случайных векторов и (где A — постоянная матрица, а B — постоянный вектор) имеем . [12]
Непрерывность
Указанная выше биекция между распределениями вероятностей и характеристическими функциями является последовательно непрерывной . То есть, всякий раз, когда последовательность функций распределения F j ( x ) сходится (слабо) к некоторому распределению F ( x ) , соответствующая последовательность характеристических функций φ j ( t ) также будет сходиться, и предел φ ( t ) будет соответствовать характеристической функции закона F . Более формально это формулируется как
Теорема Леви о непрерывности : Последовательность X j n -мерныхслучайных величин сходится по распределению к случайной величине X тогда и только тогда, когда последовательность φ X j сходится поточечно к функции φ, которая непрерывна в начале координат. Где φ — характеристическая функция X . [13]
Между кумулятивными функциями распределения и характеристическими функциями существует взаимно-однозначное соответствие , поэтому можно найти одну из этих функций, если мы знаем другую. Формула в определении характеристической функции позволяет нам вычислить φ , когда мы знаем функцию распределения F (или плотность f ). Если, с другой стороны, мы знаем характеристическую функцию φ и хотим найти соответствующую функцию распределения, то можно использовать одну из следующих теорем обращения .
Теорема . Если характеристическая функция φ X случайной величины X интегрируема , то F X абсолютно непрерывна, и поэтому X имеет функцию плотности вероятности . В одномерном случае (т.е. когда X имеет скалярное значение) функция плотности имеет вид
Теорема (Леви) . [примечание 1] Если φ X является характеристической функцией функции распределения F X , две точки a < b таковы, что { x | a < x < b } является множеством непрерывности μ X (в одномерном случае это условие эквивалентно непрерывности F X в точках a и b ), то
Если X скалярно: Эту формулу можно переформулировать в форме, более удобной для численных вычислений, как [14] Для случайной величины, ограниченной снизу, можно получить, взяв такое, что В противном случае, если случайная величина не ограничена снизу, предел для дает , но численно непрактичен. [14]
Если X — векторная случайная величина:
Теорема . Если a (возможно) является атомом X (в одномерном случае это означает точку разрыва F X ), то
Если X скаляр:
Если X — векторная случайная величина: [15]
Теорема (Жиль-Пелаес) . [16] Для одномерной случайной величины X , если x является точкой непрерывности F X, то
где мнимая часть комплексного числа определяется выражением .
Доступны формулы инверсии для многомерных распределений. [14] [17]
Критерии характеристических функций
Множество всех характеристических функций замкнуто относительно некоторых операций:
Выпуклая линейная комбинация (при ) конечного или счетного числа характеристических функций также является характеристической функцией.
Произведение конечного числа характеристических функций также является характеристической функцией. То же самое справедливо и для бесконечного произведения при условии, что оно сходится к функции, непрерывной в начале координат.
Если φ — характеристическая функция, а α — действительное число, то , Re( φ ), | φ | 2 и φ ( αt ) также являются характеристическими функциями.
Хорошо известно, что любая неубывающая функция càdlàg F с пределами F (−∞) = 0 , F (+∞) = 1 соответствует кумулятивной функции распределения некоторой случайной величины. Также интересно найти подобные простые критерии для случая, когда заданная функция φ может быть характеристической функцией некоторой случайной величины. Центральным результатом здесь является теорема Бохнера , хотя ее полезность ограничена, поскольку основное условие теоремы, неотрицательная определенность , очень трудно проверить. Существуют и другие теоремы, такие как теоремы Хинчина, Матиаса или Крамера, хотя их применение столь же сложно. Теорема Полиа , с другой стороны, обеспечивает очень простое условие выпуклости, которое является достаточным, но не необходимым. Характеристические функции, которые удовлетворяют этому условию, называются функциями типа Полиа. [18]
Теорема Бохнера . Произвольная функция φ : R n → C является характеристической функцией некоторой случайной величины тогда и только тогда, когда φ положительно определена , непрерывна в начале координат и если φ (0) = 1 .
Критерий Хинчина . Комплекснозначная, абсолютно непрерывная функция φ , при φ (0) = 1 , является характеристической функцией тогда и только тогда, когда она допускает представление
Теорема Матиаса . Действительная, четная, непрерывная, абсолютно интегрируемая функция φ , при φ (0) = 1 , является характеристической функцией тогда и только тогда, когда
для n = 0,1,2,... и всех p > 0. Здесь H 2 n обозначает многочлен Эрмита степени 2 n .
тогда φ ( t ) является характеристической функцией абсолютно непрерывного распределения, симметричного относительно 0.
Использует
Из-за теоремы о непрерывности характеристические функции используются в наиболее часто встречающемся доказательстве центральной предельной теоремы . Основной метод, используемый при выполнении вычислений с характеристической функцией, заключается в распознавании функции как характеристической функции конкретного распределения.
Базовые манипуляции с распределениями
Характеристические функции особенно полезны для работы с линейными функциями независимых случайных величин. Например, если X 1 , X 2 , ..., X n — это последовательность независимых (и не обязательно одинаково распределенных) случайных величин, и
где a i — константы, тогда характеристическая функция для S n определяется выражением
В частности, φ X+Y ( t ) = φ X ( t ) φ Y ( t ) . Чтобы увидеть это, запишем определение характеристической функции:
Для установления равенства третьего и четвертого выражений требуется независимость X и Y.
Другой особый случай, представляющий интерес для одинаково распределенных случайных величин, — это когда a i = 1 / n , а затем S n — это выборочное среднее. В этом случае, записывая X для среднего,
Моменты
Характеристические функции также могут быть использованы для нахождения моментов случайной величины. При условии, что n - й момент существует, характеристическую функцию можно дифференцировать n раз:
Это можно формально записать с использованием производных дельта-функции Дирака : что позволяет формально решить проблему моментов . Например, предположим, что X имеет стандартное распределение Коши . Тогда φ X ( t ) = e −| t | . Это не дифференцируемо при t = 0 , что показывает, что распределение Коши не имеет ожидания . Кроме того, характеристическая функция выборочного среднего X из n независимых наблюдений имеет характеристическую функцию φ X ( t ) = ( e −| t |/ n ) n = e −| t | , используя результат из предыдущего раздела. Это характеристическая функция стандартного распределения Коши: таким образом, выборочное среднее имеет то же распределение, что и сама популяция.
Подобный расчет показывает и его легче выполнить, чем применять определение ожидания и использовать интегрирование по частям для оценки .
Логарифм характеристической функции — это функция, производящая кумулянты , которая полезна для нахождения кумулянтов ; некоторые вместо этого определяют функцию, производящую кумулянты, как логарифм функции, производящей момент , и называют логарифм характеристической функции второй функцией, производящей кумулянты.
Анализ данных
Характеристические функции могут использоваться как часть процедур для подгонки распределений вероятностей к выборкам данных. Случаи, когда это обеспечивает практически осуществимый вариант по сравнению с другими возможностями, включают подгонку устойчивого распределения , поскольку выражения в замкнутой форме для плотности недоступны, что затрудняет реализацию оценки максимального правдоподобия . Доступны процедуры оценки, которые сопоставляют теоретическую характеристическую функцию с эмпирической характеристической функцией , рассчитанной по данным. Полсон и др. (1975) [19] и Хиткот (1977) [20] предоставляют некоторую теоретическую основу для такой процедуры оценки. Кроме того, Ю (2004) [21] описывает применение эмпирических характеристических функций для подгонки моделей временных рядов , где процедуры правдоподобия непрактичны. Эмпирические характеристические функции также использовались Ансари и др. (2020) [22] и Ли и др. (2020) [23] для обучения генеративно-состязательных сетей .
Пример
Гамма -распределение с параметром масштаба θ и параметром формы k имеет характеристическую функцию
Теперь предположим, что у нас есть
где X и Y независимы друг от друга, и мы хотим знать, каково распределение X + Y. Характеристические функции имеют вид
что в силу независимости и основных свойств характеристической функции приводит к
Это характеристическая функция параметра масштаба гамма-распределения θ и параметра формы k 1 + k 2 , и поэтому мы заключаем
Результат можно расширить до n независимых гамма-распределенных случайных величин с тем же параметром масштаба, и мы получим
Полные характеристические функции
Как определено выше, аргумент характеристической функции рассматривается как действительное число: однако некоторые аспекты теории характеристических функций развиваются путем расширения определения на комплексную плоскость с помощью аналитического продолжения в случаях, когда это возможно. [24]
где P ( t ) обозначает непрерывное преобразование Фурье функции плотности вероятности p ( x ) . Аналогично, p ( x ) может быть восстановлено из φ X ( t ) посредством обратного преобразования Фурье:
Действительно, даже когда случайная величина не имеет плотности, характеристическую функцию можно рассматривать как преобразование Фурье меры, соответствующей случайной величине.
Вендель, Дж. Г. (1961). «Неабсолютная сходимость интеграла обращения Жиля-Пелаеса». Анналы математической статистики . 32 (1): 338–339. doi : 10.1214/aoms/1177705164 .
Ю, Дж. (2004). "Оценка эмпирической характеристической функции и ее применение" (PDF) . Econometric Reviews . 23 (2): 93–1223. doi :10.1081/ETC-120039605. S2CID 9076760.
Шепард, НГ (1991a). «От характеристической функции к функции распределения: простая структура теории». Эконометрическая теория . 7 (4): 519–529. doi :10.1017/s0266466600004746. S2CID 14668369.
Шепард, НГ (1991б). «Численные правила интегрирования для многомерных инверсий». Журнал статистических вычислений и моделирования . 39 (1–2): 37–46. doi :10.1080/00949659108811337.
Ансари, Абдул Фатир; Скарлетт, Джонатан; Сох, Гарольд (2020). «Подход на основе характеристических функций к глубокому неявному генеративному моделированию». Труды конференции IEEE/CVF по компьютерному зрению и распознаванию образов (CVPR), 2020. С. 7478–7487.
Ли, Шэнси; Ю, Цзэян; Сян, Мин; Мандич, Данило (2020). «Взаимносостязательное обучение с помощью характеристических функций». Достижения в области нейронных систем обработки информации 33 (NeurIPS 2020) .