stringtranslate.com

Усеченное распространение

В статистике усеченное распределение — это условное распределение , возникающее в результате ограничения области действия некоторого другого распределения вероятностей . Усеченные распределения возникают в практической статистике в тех случаях, когда возможность фиксировать события или даже знать о них ограничивается значениями, которые лежат выше или ниже заданного порога или внутри определенного диапазона. Например, если проверяются даты рождения детей в школе, они, как правило, подлежат усечению по сравнению с датами рождения всех детей в этом районе, учитывая, что в конкретную дату школа принимает только детей определенного возрастного диапазона. Не было бы никакой информации о том, сколько детей в данной местности родились до или после дат закрытия школы, если бы для получения информации использовался только прямой подход к школе.

Если выборка предназначена для сохранения знаний об элементах, выходящих за пределы требуемого диапазона, без регистрации фактических значений, это называется цензурированием , в отличие от усечения , описанного здесь. [1]

Определение

Следующее обсуждение ведется с точки зрения случайной величины, имеющей непрерывное распределение, хотя те же идеи применимы и к дискретным распределениям . Аналогично, в обсуждении предполагается, что усечение производится до полуоткрытого интервала y ∈ ( a,b ], но другие возможности можно реализовать напрямую.

Предположим, у нас есть случайная величина, которая распределена в соответствии с некоторой функцией плотности вероятности с кумулятивной функцией распределения, обе из которых имеют бесконечную поддержку . Предположим, мы хотим узнать плотность вероятности случайной величины после ограничения поддержки между двумя константами, чтобы поддержка . То есть предположим, что мы хотим знать, как распределяется данное .

где для всех и везде. То есть где тут индикаторная функция. Обратите внимание, что знаменатель усеченного распределения постоянен по отношению к .

Обратите внимание, что на самом деле это плотность:

.

В усеченных дистрибутивах не обязательно удалять части сверху и снизу. Усеченное распределение, в котором удалена только нижняя часть распределения, выглядит следующим образом:

где для всех и везде, и – кумулятивная функция распределения .

Усеченное распределение, в котором удалена верхняя часть распределения, выглядит следующим образом:

где для всех и везде, и – кумулятивная функция распределения .

Ожидание усеченной случайной величины

Предположим, мы хотим найти ожидаемое значение случайной величины, распределенной в соответствии с плотностью и кумулятивным распределением при условии, что случайная величина больше некоторого известного значения . Таким образом, математическое ожидание усеченной случайной величины равно:

где снова для всех и везде.

Полагая и соответственно нижним и верхним пределами поддержки исходной функции плотности (которая, как мы предполагаем, является непрерывной), свойства , где – некоторая непрерывная функция с непрерывной производной, включают:

и

При условии, что ограничения существуют, то есть: , и где представляет либо или .

Примеры

Усеченное нормальное распределение является важным примером. [2]

Модель Тобита использует усеченные распределения. Другие примеры включают усеченный бином при x=0 и усеченный пуассон при x=0.

Случайное усечение

Предположим, у нас есть следующая настройка: значение усечения , выбирается случайным образом из плотности , но это значение не наблюдается. Затем значение , выбирается случайным образом из усеченного распределения . Предположим, мы наблюдаем и хотим обновить наше мнение о плотности данного наблюдения.

Во-первых, по определению:

, и

Обратите внимание, что оно должно быть больше , следовательно, когда мы интегрируем по , мы устанавливаем нижнюю границу . Функции и представляют собой безусловную плотность и безусловную кумулятивную функцию распределения соответственно.

По правилу Байеса ,

который расширяется до

Два равномерных распределения (пример)

Предположим, мы знаем, что t равномерно распределено из [0, T ] и x | t распределено равномерно на [0, t ]. Пусть g ( t ) и f ( x | t ) — плотности, которые описывают t и x соответственно. Предположим, мы наблюдаем значение x и хотим знать распределение t при этом значении x .

Смотрите также

Рекомендации

  1. ^ Додж, Ю. (2003) Оксфордский словарь статистических терминов . ОУП. ISBN  0-19-920613-9
  2. ^ Джонсон, Н.Л., Коц, С., Балакришнан, Н. (1994) Непрерывные одномерные распределения, Том 1 , Wiley. ISBN 0-471-58495-9 (раздел 10.1)