В теории вероятности и статистики функция квантиля выводит значение случайной величины , вероятность которого меньше или равна входному значению вероятности. Интуитивно функция квантиля связывает с диапазоном на уровне и ниже входного значения вероятности вероятность того, что случайная величина реализуется в этом диапазоне для некоторого распределения вероятности. Ее также называют процентильной функцией (после процентиля ), процентной точечной функцией , обратной кумулятивной функцией распределения (после кумулятивной функции распределения или cdf) или обратной функцией распределения .
Ссылаясь на непрерывную и строго монотонную кумулятивную функцию распределения (cdf) случайной величины X , функция квантиля отображает свой вход p в пороговое значение x так, что вероятность того, что X будет меньше или равно x , равна p . В терминах функции распределения F , функция квантиля Q возвращает значение x, такое что
что можно записать как обратную функцию cdf
В общем случае функций распределения, которые не являются строго монотонными и, следовательно, не допускают обратного cdf , квантиль представляет собой (потенциально) заданный функционал функции распределения F , заданный интервалом [1]
Часто стандартно выбирают наименьшее значение, которое можно эквивалентно записать как (используя непрерывность справа F )
Здесь мы фиксируем тот факт, что функция квантиля возвращает минимальное значение x среди всех тех значений, значение cdf которых превышает p , что эквивалентно предыдущему утверждению о вероятности в частном случае, когда распределение непрерывно. Обратите внимание, что функцию инфимума можно заменить минимальной функцией, поскольку функция распределения непрерывна справа и слабо монотонно возрастает.
Квантиль — это единственная функция, удовлетворяющая неравенствам Галуа
Если функция F непрерывна и строго монотонно возрастает, то неравенства можно заменить равенствами, и мы имеем
В общем случае, даже если функция распределения F не имеет левой или правой обратной функции , функция квантиля Q ведет себя как «почти наверняка левая обратная» для функции распределения, в том смысле, что
Например, кумулятивная функция распределения экспоненты ( λ ) (т.е. интенсивности λ и ожидаемого значения ( среднего ) 1/ λ ) равна
Функция квантиля для Exponential( λ ) выводится путем нахождения значения Q, для которого :
для 0 ≤ p < 1. Таким образом, квартили равны:
Квантильные функции используются как в статистических приложениях, так и в методах Монте-Карло .
Функция квантиля — это один из способов задания распределения вероятностей, и она является альтернативой функции плотности вероятности (pdf) или функции массы вероятности , кумулятивной функции распределения (cdf) и характеристической функции . Функция квантиля Q распределения вероятностей является обратной функцией ее кумулятивной функции распределения F. Производная функции квантиля, а именно функция плотности квантиля , является еще одним способом задания распределения вероятностей. Она является обратной величиной pdf, составленной с функцией квантиля.
Рассмотрим статистическое приложение, в котором пользователю необходимо знать ключевые процентные точки заданного распределения. Например, им требуются медиана и 25% и 75% квартили, как в примере выше, или уровни 5%, 95%, 2,5%, 97,5% для других приложений, таких как оценка статистической значимости наблюдения, распределение которого известно; см. запись квантиля . До популяризации компьютеров было не редкостью, когда книги имели приложения со статистическими таблицами, выбирающими функцию квантиля. [2] Статистические приложения функций квантиля подробно обсуждаются Гилкристом. [3]
Моделирование Монте-Карло использует квантильные функции для получения неравномерных случайных или псевдослучайных чисел для использования в различных типах расчетов моделирования. Выборка из заданного распределения может быть получена в принципе путем применения ее квантильной функции к выборке из равномерного распределения. Требования методов моделирования, например, в современных вычислительных финансах , фокусируют все большее внимание на методах, основанных на квантильных функциях, поскольку они хорошо работают с многомерными методами, основанными либо на методах копулы , либо на методах квази-Монте-Карло [4] и методах Монте-Карло в финансах .
Оценка квантильных функций часто включает численные методы , такие как экспоненциальное распределение выше, которое является одним из немногих распределений, где можно найти выражение в замкнутой форме (другие включают равномерное , Вейбулла , лямбда Тьюки (которое включает логистическое ) и логарифмически-логистическое ). Когда сама cdf имеет выражение в замкнутой форме, всегда можно использовать численный алгоритм нахождения корня, такой как метод бисекции, чтобы инвертировать cdf. Другие методы основаны на приближении обратного с помощью методов интерполяции. [5] [6] Дополнительные алгоритмы для оценки квантильных функций приведены в серии книг Numerical Recipes . Алгоритмы для общих распределений встроены во многие статистические программные пакеты. Общие методы численного вычисления квантильных функций для общих классов распределений можно найти в следующих библиотеках:
Квантильные функции также могут быть охарактеризованы как решения нелинейных обыкновенных и частных дифференциальных уравнений . Были даны и решены обыкновенные дифференциальные уравнения для случаев нормального , Стьюдента , бета и гамма распределения. [11]
Нормальное распределение , возможно, является наиболее важным случаем. Поскольку нормальное распределение является семейством масштаба местоположения , его квантильная функция для произвольных параметров может быть получена из простого преобразования квантильной функции стандартного нормального распределения, известной как функция пробит . К сожалению, эта функция не имеет замкнутого представления с использованием основных алгебраических функций; в результате обычно используются приближенные представления. Тщательные составные рациональные и полиномиальные приближения были даны Вичурой [12] и Акламом. [13] Несоставные рациональные приближения были разработаны Шоу. [14]
Может быть задано нелинейное обыкновенное дифференциальное уравнение для нормального квантиля w ( p ). Оно имеет вид
с центральными (начальными) условиями
Это уравнение может быть решено несколькими методами, включая классический подход степенных рядов . Из этого могут быть разработаны решения произвольно высокой точности (см. Steinbrecher and Shaw, 2008).
Это исторически было одним из наиболее трудноразрешимых случаев, поскольку наличие параметра ν, степени свободы, делает использование рациональных и других приближений неудобным. Простые формулы существуют, когда ν = 1, 2, 4, и проблема может быть сведена к решению полинома, когда ν четное. В других случаях функции квантилей могут быть развиты как степенные ряды. [15] Простые случаи следующие:
где
и
В приведенном выше примере функция «знака» равна +1 для положительных аргументов, −1 для отрицательных аргументов и нулю при нуле. Ее не следует путать с тригонометрической функцией синуса.
Аналогично смесям плотностей , распределения можно определить как квантильные смеси.
где , — квантильные функции, а , — параметры модели. Параметры должны быть выбраны так, чтобы была квантильная функция. Карванен представил две четырехпараметрические квантильные смеси: нормальную полиномиальную квантильную смесь и Коши-полиномиальную квантильную смесь. [16]
Нелинейное обыкновенное дифференциальное уравнение, заданное для нормального распределения , является частным случаем уравнения, доступного для любой функции квантиля, вторая производная которой существует. В общем случае уравнение для квантиля, Q ( p ), может быть задано. Оно
дополненный подходящими граничными условиями, где
и ƒ ( x ) — функция плотности вероятности. Формы этого уравнения и его классический анализ с помощью рядов и асимптотических решений для случаев нормального, Стьюдента, гамма- и бета-распределений были разъяснены Штейнбрехером и Шоу (2008). Такие решения обеспечивают точные ориентиры, а в случае Стьюдента — подходящие ряды для использования в реальном времени методом Монте-Карло.
{{cite web}}
: CS1 maint: архивная копия как заголовок ( ссылка )