Интервал прогнозирования

В статистическом выводе , в частности в прогнозирующем выводе , интервал прогнозирования — это оценка интервала , в который будущее наблюдение попадет с определенной вероятностью, учитывая то, что уже наблюдалось. Интервалы прогнозирования часто используются в регрессионном анализе .

Простой пример — шестигранная игральная кость с номиналами от 1 до 6. Доверительный интервал для предполагаемого ожидаемого значения номинала составит около 3,5 и станет уже с увеличением размера выборки. Однако интервал прогнозирования для следующего броска будет примерно находиться в диапазоне от 1 до 6, даже при любом количестве просмотренных на данный момент образцов.

Интервалы прогнозирования используются как в частотной статистике , так и в байесовской статистике : интервал прогнозирования имеет такое же отношение к будущему наблюдению, как частотный доверительный интервал или байесовский доверительный интервал имеет отношение к ненаблюдаемому параметру совокупности: интервалы прогнозирования предсказывают распределение отдельных будущих точек, тогда как доверительные интервалы и вероятные интервалы параметров предсказывают распределение оценок истинного среднего значения генеральной совокупности или другой представляющей интерес величины, которую невозможно наблюдать.

Введение

Если сделать параметрическое предположение , что основное распределение является нормальным распределением и имеет набор выборок { X ₁ , ..., X _n }, то доверительные интервалы и вероятные интервалы могут использоваться для оценки среднего значения популяции µ и стандарта совокупности. отклонение σ базовой совокупности, в то время как интервалы прогнозирования могут использоваться для оценки значения следующей выборочной переменной X _{n +1} .

Альтернативно, в терминах Байеса, интервал прогнозирования можно описать как вероятный интервал для самой переменной, а не как параметр ее распределения.

Концепция интервалов прогнозирования не должна ограничиваться выводами об одном будущем значении выборки, но может быть распространена на более сложные случаи. Например, в контексте наводнений рек, где анализ часто основан на годовых значениях крупнейшего стока в течение года, может быть интересно сделать выводы о крупнейшем наводнении, которое может произойти в течение следующих 50 лет.

Поскольку интервалы прогнозирования касаются только прошлых и будущих наблюдений, а не ненаблюдаемых параметров популяции, некоторые статистики, такие как Сеймур Гейссер , пропагандируют их как лучший метод, чем доверительные интервалы, после того ^,^как Бруно де Финетти ^{сосредоточил} внимание на наблюдаемых величинах. . ^[^{нужна цитата}^]

Нормальное распределение

Учитывая выборку из нормального распределения , параметры которой неизвестны, можно задать интервалы прогнозирования в частотном смысле, т. е. интервал [ a , b ] на основе статистики выборки, такой, что при повторных экспериментах X _{n +1} попадает в интервал нужный процент времени; их можно назвать «прогнозирующими доверительными интервалами ». ^[1]

Общий метод частотного прогнозирования интервалов состоит в том, чтобы найти и вычислить основную величину наблюдаемых X ₁ , ..., X _n , X _{n +1} – что означает функцию наблюдаемых и параметров, распределение вероятностей которых не зависит от параметров – которую можно инвертировать, чтобы получить вероятность того, что будущее наблюдение X _{n +1} попадет в некоторый интервал, рассчитанный на основе наблюдаемых значений. Такая основная величина, зависящая только от наблюдаемых, называется вспомогательной статистикой . ^[2] Обычный метод построения основных величин состоит в том, чтобы взять разницу двух переменных, которые зависят от местоположения, так что местоположение сокращается, а затем взять отношение двух переменных, которые зависят от масштаба, чтобы масштаб уравновешивался. Наиболее знакомой ключевой величиной является t-статистика Стьюдента , которую можно получить этим методом и использовать в дальнейшем. $X_{1},\dots,X_{n}.$

Известное среднее, известная дисперсия

Интервал прогнозирования [ ℓ , u ] для будущего наблюдения X в нормальном распределении N ( μ , σ2 ) с известным средним значением и ^{дисперсией может быть}рассчитан из

\gamma =P(\ell <X<u)=P\left({\frac {\ell -\mu }{\sigma }}<{\frac {X-\mu }{\sigma }} <{\frac {u-\mu }{\sigma }}\right)=P\left({\frac {\ell -\mu }{\sigma }}<Z<{\frac {u-\mu } {\ сигма }} \ вправо),

где стандартный балл X распределяется как стандартный нормальный . $Z={\frac {X-\mu }{\sigma }}$

Следовательно

{\frac {\ell -\mu }{\sigma }}=-z,\quad {\frac {u-\mu }{\sigma }}=z,

или

\ell =\mu -z\sigma, \quad u=\mu +z\sigma,

где z - квантиль стандартного нормального распределения, для которого:

\gamma =P(-z<Z<z).

или эквивалентно;

{\tfrac {1}{2}}(1-\gamma)=P(Z>z).

Интервал прогнозирования условно записывается как:

\left[\mu -z\sigma, \ \mu +z\sigma \right].

Например, чтобы вычислить 95%-й интервал прогнозирования для нормального распределения со средним значением ( μ ) 5 и стандартным отклонением ( σ ) равным 1, тогда z равно приблизительно 2. Следовательно, нижний предел интервала прогнозирования составляет приблизительно 5. - (2⋅1) = 3, а верхний предел составляет примерно 5 + (2⋅1) = 7, что дает интервал прогнозирования примерно от 3 до 7.

Оценка параметров

Для распределения с неизвестными параметрами прямой подход к прогнозированию состоит в том, чтобы оценить параметры, а затем использовать соответствующую функцию квантиля – например, можно использовать выборочное среднее в качестве оценки для µ , а выборочную дисперсию s ² в качестве оценки для σ ^2. . Здесь есть два естественных выбора для s ² : деление на дает несмещенную оценку, а деление на n дает оценку максимального правдоподобия , и любой из них может быть использован. Затем с этими оцененными параметрами используется функция квантиля, чтобы получить интервал прогнозирования. ${\overline {X}}$ $(n-1)$ $\Phi _{{\overline {X}},s^{2}}^{-1}$

Этот подход можно использовать, но полученный интервал не будет иметь интерпретации повторной выборки ^[4] – он не является прогнозным доверительным интервалом.

Для дальнейшего используйте выборочное среднее:

{\overline {X}}={\overline {X}}_{n}=(X_{1}+\cdots +X_{n})/n

и (несмещенная) выборочная дисперсия:

s^{2}=s_{n}^{2}={1 \over n-1}\sum _{i=1}^{n}(X_{i}-{\overline {X} }_{n})^{2}

Неизвестное среднее, известная дисперсия

Учитывая ^[5] нормальное распределение с неизвестным средним значением µ , но известной дисперсией 1, выборочное среднее значений наблюдений имеет распределение, в то время как будущее наблюдение имеет распределение. Получение разницы этих значений отменяет µ и дает нормальное распределение дисперсии, таким образом ${\overline {X}}$ $X_{1},\dots,X_{n}$ $N(\mu,1/n),$ $X_{n+1}$ $N(\mu,1).$ $1+(1/n),$

{\frac {X_{n+1}-{\overline {X}}}{\sqrt {1+(1/n)}}}\sim N(0,1).

Решение for дает прогнозируемое распределение , на основе которого можно вычислять интервалы, как и раньше. Это прогнозируемый доверительный интервал в том смысле, что если использовать квантильный диапазон 100 p %, то при повторном применении этого вычисления будущее наблюдение попадет в прогнозируемый интервал в 100 p % времени. $X_{n+1}$ $N({\overline {X}},1+(1/n)),$ $X_{n+1}$

Обратите внимание, что это прогнозируемое распределение более консервативно, чем использование предполагаемого среднего и известной дисперсии 1, поскольку при этом используется дисперсия и , следовательно, получаются более широкие интервалы. Это необходимо для сохранения желаемого свойства доверительного интервала. ${\overline {X}}$ $1+(1/n)$

Известное среднее, неизвестная дисперсия

И наоборот, при нормальном распределении с известным средним значением 0, но неизвестной дисперсией , выборочная дисперсия наблюдений имеет, вплоть до масштаба, распределение ; точнее: $\sigma ^{2}$ $s^{2}$ $X_{1},\dots,X_{n}$ $\scriptstyle \chi _{n-1}^{2}$

{\frac {(n-1)s_{n}^{2}}{\sigma ^{2}}}\sim \chi _{n-1}^{2}.

в то время как будущее наблюдение имеет распределение. Взятие отношения будущего наблюдения и стандартного отклонения выборки ^[^{необходимы пояснения}^] отменяет σ, давая t-распределение Стьюдента с n – 1 степенями свободы : $X_{n+1}$ $N(0,\sigma ^{2}).$

{\frac {X_{n+1}}{s}}\sim T^{n-1}.

Решение for дает прогнозируемое распределение , на основе которого можно вычислять интервалы, как и раньше. $X_{n+1}$ $sT^{n-1},$

Обратите внимание, что это прогнозируемое распределение более консервативно, чем использование нормального распределения с оцененным стандартным отклонением и известным средним значением 0, поскольку оно использует t-распределение вместо нормального распределения и, следовательно, дает более широкие интервалы. Это необходимо для сохранения желаемого свойства доверительного интервала. $s$

Неизвестное среднее, неизвестная дисперсия

Объединение вышеизложенного для нормального распределения с неизвестными µ и σ ² дает следующую вспомогательную статистику: ^[6] $N(\mu,\sigma ^{2})$

{\frac {X_{n+1}-{\overline {X}}_{n}}{s_{n}{\sqrt {1+1/n}}}}\sim T^{n -1}

Эта простая комбинация возможна, поскольку выборочное среднее и выборочная дисперсия нормального распределения являются независимыми статистическими данными; это верно только для нормального распределения и фактически характеризует нормальное распределение.

Решение для получения прогнозируемого распределения $X_{n+1}$

{\overline {X}}_{n}+s_{n}{\sqrt {1+1/n}}\cdot T^{n-1}

Тогда вероятность попадания в заданный интервал равна: $X_{n+1}$

\Pr \left({\overline {X}}_{n}-T_{a}s_{n}{\sqrt {1+(1/n)}}\leq X_{n+1}\leq {\overline {X}}_{n}+T_{a}s_{n}{\sqrt {1+(1/n)}}\,\right)=p

где T _a — 100 ((1 — p )/2) ^-й процентиль t-распределения Стьюдента с n — 1 степенями свободы. Следовательно, числа

{\overline {X}}_{n}\pm T_{a}s_{n}{\sqrt {1+(1/n)}}

являются конечными точками 100(1 - p )% интервала прогнозирования для . $X_{n+1}$

Непараметрические методы

Можно вычислить интервалы прогнозирования без каких-либо предположений о совокупности, то есть непараметрическим способом.

Метод остаточной загрузки можно использовать для построения непараметрических интервалов прогнозирования.

Конформное предсказание

В целом метод конформного прогнозирования является более общим. Давайте рассмотрим частный случай использования минимума и максимума в качестве границ интервала прогнозирования: если имеется выборка идентичных случайных величин { X ₁ , ..., X _n }, то вероятность того, что следующее наблюдение X _{n +1} будет самым большим из 1/( n + 1), поскольку все наблюдения имеют равную вероятность оказаться максимальными. Точно так же вероятность того, что X _{n +1} будет наименьшим, равна 1/( n + 1). Другой ( n - 1)/( n + 1) времени, X _{n +1,} попадает между максимумом выборки и минимумом выборки { X ₁ , ..., X _n }. Таким образом, обозначая максимум и минимум выборки через M и m, это дает ( n - 1)/( n + 1) интервал прогнозирования [ m , M ].

Обратите внимание: хотя это и дает вероятность того, что будущее наблюдение попадет в диапазон, оно не дает никакой оценки относительно того, в какое место в сегменте оно попадет – в частности, если оно выходит за пределы диапазона наблюдаемых значений, оно может оказаться далеко за его пределами. диапазон. Дальнейшее обсуждение см. в теории экстремальных ценностей . Формально это относится не только к выборке из совокупности, но и к любой заменяемой последовательности случайных величин, не обязательно независимых или одинаково распределенных .

Контраст с другими интервалами

Контраст с доверительными интервалами

В формуле для прогнозного доверительного интервала не упоминаются ненаблюдаемые параметры μ и σ среднего значения генеральной совокупности и стандартного отклонения - используются наблюдаемые статистические данные выборки , а также среднее значение выборки и стандартное отклонение, а то, что оценивается, является результатом будущих выборок. . ${\overline {X}}_{n}$ $S_{n}$

При рассмотрении интервалов прогнозирования вместо использования статистики выборки в качестве оценки параметров совокупности и применения доверительных интервалов к этим оценкам «следующая выборка» сама по себе является статистикой и вычисляет ее выборочное распределение . $X_{n+1}$

В доверительных интервалах параметров оцениваются параметры популяции; если кто-то хочет интерпретировать это как прогноз следующей выборки, нужно моделировать «следующую выборку» как выборку из этой оцененной совокупности, используя (оценочное) распределение совокупности . Напротив, в прогнозных доверительных интервалах используется выборочное распределение (статистика) выборки из n или n + 1 наблюдений из такой совокупности, а распределение совокупности не используется напрямую, хотя предположение о ее форме (хотя а не значения его параметров) используется при вычислении выборочного распределения.

В регрессионном анализе

Распространенным применением интервалов прогнозирования является регрессионный анализ .

Предположим, что данные моделируются с помощью прямой регрессии:

y_{i}=\alpha +\beta x_{i}+\varepsilon _{i}\,

где – переменная отклика , – объясняющая переменная , ε _i – случайная ошибка, и – параметры. $y_{i}$ $x_{i}$ $\alpha$ $\beta$

Учитывая оценки и параметры, например, полученные из простой линейной регрессии , прогнозируемое значение ответа y _d для данного объясняющего значения x _d равно ${\hat {\alpha }}$ ${\hat {\beta }}$

{\hat {y}}_{d}={\hat {\alpha }}+{\hat {\beta }}x_{d},

(точка на линии регрессии), в то время как фактический ответ будет

y_{d}=\alpha +\beta x_{d}+\varepsilon _{d}.\,

Точечная оценка называется средним откликом и представляет собой оценку ожидаемого значения y _d , ${\hat {y}}_{d}$ $E(y\mid x_{d}).$

Вместо этого интервал прогнозирования дает интервал, в котором ожидается падение y _d ; в этом нет необходимости, если известны фактические параметры α и β (вместе с ошибкой ε _i ), но если оценка производится по выборке , то можно использовать стандартную ошибку оценок для точки пересечения и наклона ( и ) , а также их корреляцию для вычисления интервала прогнозирования. ${\hat {\alpha }}$ ${\hat {\beta }}$

В регрессии Фарауэй (2002, стр. 39) проводит различие между интервалами для прогнозирования средней реакции и для прогнозирования наблюдаемой реакции, что существенно влияет на включение или отсутствие члена единицы в квадратный корень в приведенных выше коэффициентах расширения; подробнее см. Faraway (2002).

Байесовская статистика

Сеймур Гейссер , сторонник прогнозирующего вывода, дает прогнозные применения байесовской статистики . ^[7]

В байесовской статистике можно вычислить (байесовские) интервалы прогнозирования на основе апостериорной вероятности случайной величины как доверительного интервала . В теоретической работе достоверные интервалы часто рассчитываются не для предсказания будущих событий, а для вывода параметров – т.е. достоверные интервалы параметра, а не для результатов самой переменной. Однако, особенно когда приложения связаны с возможными экстремальными значениями еще не наблюдавшихся случаев, достоверные интервалы для таких значений могут иметь практическое значение.

Приложения

Интервалы прогнозирования обычно используются в качестве определения референтных диапазонов , например референтных диапазонов для анализов крови, чтобы дать представление о том, является ли анализ крови нормальным или нет. Для этой цели наиболее часто используемым интервалом прогнозирования является 95%-ный интервал прогнозирования, а основанный на нем эталонный диапазон можно назвать стандартным эталонным диапазоном .

Смотрите также

Примечания

^ Гейссер (1993, стр. 6): Глава 2: Небайесовские прогнозные подходы
^ Гейссер (1993, стр. 7)
^ abcd Таблица A2 в Sterne & Kirkwood (2003, стр. 472)
^ Гейссер (1993, стр. 8–9)
^ Гейссер (1993, стр. 7–)
^ Гейссер (1993, пример 2.2, стр. 9–10)
^ Гейссер (1993)

дальнейшее чтение

Чатфилд, К. (1993). «Расчет интервальных прогнозов». Журнал деловой и экономической статистики . 11 (2): 121–135. дои : 10.2307/1391361. JSTOR 1391361.
Лоулесс, Дж. Ф.; Фредетт, М. (2005). «Интервалы частотного прогнозирования и прогнозируемые распределения». Биометрика . 92 (3): 529–542. дои : 10.1093/biomet/92.3.529 .
Мид, Н.; Ислам, Т. (1995). «Интервалы прогнозирования для прогнозов кривой роста». Журнал прогнозирования . 14 (5): 413–430. дои : 10.1002/for.3980140502.
Стандарт ISO 16269-8 «Интерпретация данных», Часть 8, Определение интервалов прогнозирования