В байесовской статистике доверительный интервал — это интервал, используемый для характеристики распределения вероятностей . Он определяется таким образом, что ненаблюдаемое значение параметра имеет определенную вероятность попасть в него. Например, в эксперименте, который определяет распределение возможных значений параметра , если вероятность, которая лежит между 35 и 45, равна , то это 95% доверительный интервал.
Достоверные интервалы обычно используются для характеристики апостериорных распределений вероятностей или предсказательных распределений вероятностей. [1] Их обобщение на несвязные или многомерные множества называется достоверной областью .
Достоверные интервалы являются байесовским аналогом доверительных интервалов в частотной статистике . [2] Эти две концепции возникают из разных философий: [3] байесовские интервалы рассматривают свои границы как фиксированные, а оцениваемый параметр как случайную величину, тогда как частотные доверительные интервалы рассматривают свои границы как случайные величины, а параметр как фиксированное значение. Кроме того, байесовские достоверные интервалы используют (и действительно требуют) знания априорного распределения , специфичного для ситуации , тогда как частотные доверительные интервалы этого не делают.
Определения
Достоверные области не являются уникальными; любое заданное распределение вероятностей имеет бесконечное число достоверных областей вероятности . Например, в одномерном случае существует несколько определений для подходящего интервала или области:
Наименьший интервал, иногда называемый интервалом наибольшей плотности (HDI). Этот интервал обязательно будет включать медиану всякий раз, когда . Кроме того, когда распределение унимодальное , этот интервал будет включать моду .
Наименьшая область, иногда называемая областью наивысшей плотности (HDR). Для мультимодального распределения это не обязательно интервал, так как он может быть несвязным. Эта область всегда будет включать моду .
Интервал на основе квантилей (QBI), который вычисляется путем взятия межквантильного интервала для некоторых . Например, медианный интервал вероятности — это интервал, где вероятность оказаться ниже интервала так же вероятна, как и выше него, то есть интервал . Иногда его также называют равнохвостым интервалом , и он всегда будет включать медиану . Можно определить много других QBI, например, самый низкий интервал , или самый высокий интервал . Эти интервалы могут больше подходить для ограниченных переменных.
Можно определить интервал, для которого среднее значение является центральной точкой, предполагая, что среднее значение существует.
Достоверные интервалы также можно оценить с помощью методов моделирования, таких как Монте-Карло с цепями Маркова . [5]
Контрастирует с доверительным интервалом
Частотный 95% доверительный интервал означает, что при большом количестве повторных выборок 95% таких вычисленных доверительных интервалов будут включать истинное значение параметра. В частотных терминах параметр фиксирован ( не может считаться имеющим распределение возможных значений), а доверительный интервал случаен (поскольку он зависит от случайной выборки).
Байесовские доверительные интервалы отличаются от частотных доверительных интервалов двумя основными аспектами:
Достоверные интервалы — это интервалы, значения которых имеют (апостериорную) плотность вероятности, представляющую правдоподобие того, что параметр имеет эти значения, тогда как доверительные интервалы рассматривают параметр популяции как фиксированный и, следовательно, не объект вероятности. В рамках доверительных интервалов уверенность относится к случайности самого доверительного интервала при повторных испытаниях, тогда как достоверные интервалы анализируют неопределенность целевого параметра с учетом имеющихся данных.
Достоверные интервалы и доверительные интервалы рассматривают мешающие параметры совершенно по-разному.
Для случая одного параметра и данных, которые могут быть обобщены в одну достаточную статистику , можно показать, что доверительный интервал и доверительный интервал совпадают, если неизвестный параметр является параметром местоположения (т. е. функция прямой вероятности имеет вид ), с априорным значением, которое является равномерным плоским распределением; [6] а также если неизвестный параметр является параметром масштаба (т. е. функция прямой вероятности имеет вид ), с априорным значением Джеффриса [6] — последнее следует, поскольку взятие логарифма такого параметра масштаба превращает его в параметр местоположения с равномерным распределением. Но это явно особые (хотя и важные) случаи; в общем случае такую эквивалентность сделать нельзя.
Ссылки
^ Эдвардс, Уорд; Линдман, Гарольд; Сэвидж, Леонард Дж. (1963). «Байесовский статистический вывод в психологических исследованиях». Psychological Review . 70 (3): 193–242. doi :10.1037/h0044139.
^ Ли, П. М. (1997) Байесовская статистика: Введение , Арнольд. ISBN 0-340-67785-6
^ ВандерПлас, Джейк. «Частотность и байесианство III: Уверенность, достоверность и почему частотность и наука несовместимы | Питоновские прогулки». jakevdp.github.io .
^ О'Хаган, А. (1994) Кендалл, Продвинутая теория статистики, том 2B, Байесовский вывод , раздел 2.51. Арнольд, ISBN 0-340-52922-9
^ Чэнь, Мин-Хуэй; Шао, Ци-Мэн (1 марта 1999 г.). «Оценка Монте-Карло байесовских достоверных интервалов и интервалов HPD». Журнал вычислительной и графической статистики . 8 (1): 69–92. doi :10.1080/10618600.1999.10474802.
^ ab Jaynes, ET (1976). «Доверительные интервалы против байесовских интервалов», в книге «Основы теории вероятностей, статистический вывод и статистические теории науки» (редакторы WL Harper и CA Hooker), Дордрехт: D. Reidel, стр. 175 и далее
Дальнейшее чтение
Болстад, Уильям М.; Карран, Джеймс М. (2016). «Сравнение байесовских и частотных выводов для среднего». Введение в байесовскую статистику (третье изд.). John Wiley & Sons. стр. 237–253. ISBN 978-1-118-09156-2.