stringtranslate.com

Усеченное нормальное распределение

В теории вероятности и статистике усеченное нормальное распределение — это распределение вероятностей, полученное из распределения нормально распределенной случайной величины путем ограничения случайной величины снизу или сверху (или того и другого). Усеченное нормальное распределение имеет широкое применение в статистике и эконометрике .

Определения

Предположим , имеет нормальное распределение со средним значением и дисперсией и лежит в пределах интервала . Тогда условное значение имеет усеченное нормальное распределение.

Его функция плотности вероятности , , для , определяется выражением

и иначе.

Здесь,

нормального распределениякумулятивная функция распределения.

Приведенные выше формулы показывают, что при масштабном параметре усеченного нормального распределения допускается принимать отрицательные значения. Параметр в данном случае мнимый, но функция тем не менее действительная, положительная и нормируемая. Параметр масштаба неусеченного нормального распределения должен быть положительным, поскольку в противном случае распределение не поддавалось бы нормализации. С другой стороны, дважды усеченное нормальное распределение в принципе может иметь отрицательный масштабный параметр (который отличается от дисперсии, см. сводные формулы), поскольку в ограниченной области такие проблемы интегрируемости не возникают. В этом случае распределение, конечно, нельзя интерпретировать как неусеченное нормальное условное выражение на , но все же можно интерпретировать как распределение максимальной энтропии с первым и вторым моментами в качестве ограничений, и оно имеет дополнительную особенность: вместо этого оно представляет два локальных максимума. из одного, расположенного по адресу и .

Характеристики

Усеченное нормальное — это одно из двух возможных распределений вероятностей максимальной энтропии для фиксированного среднего и дисперсии, ограниченной интервалом [a,b], второе — усеченное U. [2] Усеченные нормали с фиксированной опорой образуют экспоненциальное семейство. Нильсен [3] сообщил о формуле закрытой формы для расчета расхождения Кульбака-Лейблера и расстояния Бхаттачарьи между двумя усеченными нормальными распределениями с поддержкой первого распределения, вложенной в поддержку второго распределения.

Моменты

Если случайная величина была усечена только снизу, некоторая вероятностная масса была сдвинута к более высоким значениям, что дало стохастически доминирующее распределение первого порядка и, следовательно, увеличило среднее значение до значения, превышающего среднее значение исходного нормального распределения. Аналогично, если случайная величина была усечена только сверху, усеченное распределение имеет среднее значение меньше, чем

Независимо от того, ограничена ли случайная величина сверху, снизу или и то, и другое, усечение представляет собой сокращение, сохраняющее среднее значение , в сочетании с жестким сдвигом, изменяющим среднее значение, и, следовательно, дисперсия усеченного распределения меньше, чем дисперсия исходного нормального распределения. .

Двустороннее усечение [4]

Пусть и . Затем:

Необходимо соблюдать осторожность при числовом вычислении этих формул, поскольку это может привести к катастрофическому сокращению, если интервал не включает . Есть более эффективные способы их переписать, чтобы избежать этой проблемы. [5]

Одностороннее усечение (нижнего хвоста) [6]

В этом случае тогда

и

где

Одностороннее усечение (верхнего хвоста)

В этом случае тогда

Барр и Шеррилл (1999) дают более простое выражение для дисперсии односторонних сокращений. Их формула выражается в виде CDF хи-квадрат, который реализован в стандартных библиотеках программного обеспечения. Бебу и Мэтью (2009) предоставляют формулы для (обобщенных) доверительных интервалов вокруг усеченных моментов.

Рекурсивная формула

Что касается неусеченного случая, то для усеченных моментов существует рекуррентная формула. [7]

Многомерный

Вычислить моменты многомерной усеченной нормали сложнее.

Генерация значений из усеченного нормального распределения

Случайная величина, определенная как кумулятивная функция распределения и ее обратная функция, равномерное случайное число на , соответствует распределению, усеченному до диапазона . Это просто метод обратного преобразования для моделирования случайных величин. Хотя этот метод является одним из самых простых, он может либо дать сбой при выборке в хвосте нормального распределения [8] , либо оказаться слишком медленным. [9] Таким образом, на практике приходится искать альтернативные методы моделирования.

Один из таких усеченных нормальных генераторов (реализованных в Matlab и R (язык программирования) как trandn.R ) основан на идее отказа от принятия, предложенной Марсальей. [10] Несмотря на несколько неоптимальную скорость принятия Марсальи (1964) по сравнению с Робертом (1995), метод Марсальи обычно быстрее, [9] потому что он не требует дорогостоящей численной оценки экспоненциальной функции.

Подробнее о моделировании усеченного нормального распределения см. Robert (1995), Lynch (2007), Devroye (1986). В пакете MSM в R есть функция rtnorm, которая вычисляет отрисовку на основе усеченной нормали. Пакет truncnorm в R также имеет функции для рисования усеченной нормали.

Шопен (2011) предложил (arXiv) алгоритм, вдохновленный алгоритмом Зиккурата Марсальи и Цанга (1984, 2000), который обычно считается самым быстрым гауссовским сэмплером, а также очень близок к алгоритму Аренса (1995). Реализации можно найти на C, C++, Matlab и Python.

Выборка из многомерного усеченного нормального распределения значительно сложнее. [11] Точное или идеальное моделирование возможно только в случае усечения нормального распределения до многогранной области. [11] [12] В более общих случаях Дэмиен и Уокер (2001) представляют общую методологию выборки усеченных плотностей в рамках системы выборки Гиббса . Их алгоритм вводит одну скрытую переменную и в рамках системы выборки Гиббса он более эффективен в вычислительном отношении, чем алгоритм Роберта (1995).

Смотрите также

Примечания

  1. ^ «Лекция 4: Выбор» (PDF) . web.ist.utl.pt. _ Высший технический институт . 11 ноября 2002 г. с. 1 . Проверено 14 июля 2015 г.
  2. ^ Доусон, Д.; Рэгг, А. (сентябрь 1973 г.). «Распределения максимальной энтропии с заданными первым и вторым моментами (Корресп.)». Транзакции IEEE по теории информации . 19 (5): 689–693. дои : 10.1109/TIT.1973.1055060. ISSN  1557-9654.
  3. ^ Фрэнк Нильсен (2022). «Статистические расхождения между плотностями усеченных экспоненциальных семейств с вложенными носителями: расхождения дуэта Брегмана и дуэта Дженсена». Энтропия . МДПИ. 24 (3): 421. Бибкод : 2022Entrp..24..421N. дои : 10.3390/e24030421 . ПМЦ 8947456 . ПМИД  35327931. 
  4. ^ Джонсон, Норман Ллойд; Коц, Сэмюэл; Балакришнан, Н. (1994). Непрерывные одномерные распределения. Том. 1 (2-е изд.). Нью-Йорк: Уайли. Раздел 10.1. ISBN 0-471-58495-9. ОСЛК  29428092.
  5. ^ Фернандес-де-Коссио-Диас, Хорхе (06 декабря 2017 г.), TruncatedNormal.jl: Вычисление среднего значения и дисперсии одномерного усеченного нормального распределения (работает вдали от пика) , получено 6 декабря 2017 г.
  6. ^ Грин, Уильям Х. (2003). Эконометрический анализ (5-е изд.). Прентис Холл. ISBN 978-0-13-066189-0.
  7. ^ Документ Эрика Орджебина, «https://people.smp.uq.edu.au/YoniNazarathy/teaching_projects/studentWork/EricOrjebin_TruncatedNormalMoments.pdf»
  8. ^ Крозе, ДП ; Таймре, Т.; Ботев, З.И. (2011). Справочник по методам Монте-Карло . Джон Уайли и сыновья.
  9. ^ аб Ботев, З.И.; Л'Экуйер, П. (2017). «Моделирование нормального распределения, усеченного до интервала в хвосте». 10-я Международная конференция EAI по методологиям и инструментам оценки эффективности . 25–28 октября 2016 г. Таормина, Италия: ACM. стр. 23–29. дои : 10.4108/eai.25-10-2016.2266879. ISBN 978-1-63190-141-6.{{cite conference}}: CS1 maint: location (link)
  10. ^ Марсалья, Джордж (1964). «Генерация переменной из хвоста нормального распределения». Технометрика . 6 (1): 101–102. дои : 10.2307/1266749. JSTOR  1266749.
  11. ^ Аб Ботев, З.И. (2016). «Нормальный закон при линейных ограничениях: моделирование и оценка с помощью минимаксного наклона». Журнал Королевского статистического общества, серия B. 79 : 125–148. arXiv : 1603.04166 . дои : 10.1111/rssb.12162. S2CID  88515228.
  12. ^ Ботев, Здравко и Л'Экуйер, Пьер (2018). «Глава 8: Моделирование хвоста одномерного и многомерного нормального распределения». В Пулиафито, Антонио (ред.). Системное моделирование: методологии и инструменты. EAI/Springer Инновации в области связи и вычислений . Спрингер, Чам. стр. 115–132. дои : 10.1007/978-3-319-92378-9_8. ISBN 978-3-319-92377-2. S2CID  125554530.
  13. ^ Сунь, Цзинчао; Конг, Майинг; Пал, Субхадип (22 июня 2021 г.). «Модифицированное полунормальное распределение: свойства и эффективная схема выборки». Коммуникации в статистике - теория и методы . 52 (5): 1591–1613. дои : 10.1080/03610926.2021.1934700. ISSN  0361-0926. S2CID  237919587.

Рекомендации