В статистическом выводе , в частности, предиктивном выводе , интервал прогнозирования — это оценка интервала , в который попадет будущее наблюдение с определенной вероятностью, учитывая то, что уже наблюдалось. Интервалы прогнозирования часто используются в регрессионном анализе .
Простой пример — шестигранная игральная кость с номиналами от 1 до 6. Доверительный интервал для предполагаемого ожидаемого значения номинала составит около 3,5 и станет уже с увеличением размера выборки. Однако интервал прогнозирования для следующего броска будет примерно в диапазоне от 1 до 6, даже при любом количестве просмотренных образцов.
Интервалы прогнозирования используются как в частотной, так и в байесовской статистике : интервал прогнозирования имеет такое же отношение к будущему наблюдению, как частотный доверительный интервал или байесовский правдоподобный интервал к ненаблюдаемому параметру популяции: интервалы прогнозирования предсказывают распределение отдельных будущих точек, тогда как доверительные интервалы и правдоподобные интервалы параметров предсказывают распределение оценок истинного среднего значения популяции или другой интересующей величины, которую невозможно наблюдать.
Если сделать параметрическое предположение о том, что базовое распределение является нормальным распределением и имеет выборочный набор { X 1 , ..., X n }, то доверительные интервалы и правдоподобные интервалы могут быть использованы для оценки среднего значения совокупности μ и стандартного отклонения совокупности σ базовой совокупности, в то время как интервалы прогнозирования могут быть использованы для оценки значения следующей выборочной переменной X n +1 .
Альтернативно, в байесовских терминах, интервал прогнозирования можно описать как достоверный интервал для самой переменной, а не для параметра ее распределения.
Концепция интервалов прогнозирования не должна ограничиваться выводом об одном будущем значении выборки, но может быть распространена на более сложные случаи. Например, в контексте речных наводнений, где анализы часто основаны на годовых значениях самого большого потока в течение года, может быть интересно сделать выводы о самом большом наводнении, которое, вероятно, произойдет в течение следующих 50 лет.
Поскольку интервалы прогнозирования касаются только прошлых и будущих наблюдений, а не ненаблюдаемых параметров популяции, некоторые статистики, такие как Сеймур Гейссер , [ требуется ссылка ] считают их лучшим методом, чем доверительные интервалы, следуя акценту на наблюдаемых величинах, предложенному Бруно де Финетти . [ требуется ссылка ]
При наличии выборки из нормального распределения , параметры которой неизвестны, можно задать интервалы прогнозирования в частотном смысле, т. е. интервал [ a , b ], основанный на статистике выборки, такой, что при повторных экспериментах X n +1 попадает в интервал желаемый процент времени; их можно назвать « интервалами прогнозирования доверия ». [1]
Общая техника частотных интервалов прогнозирования заключается в поиске и вычислении основной величины наблюдаемых X 1 , ..., X n , X n +1 – то есть функции наблюдаемых и параметров, распределение вероятностей которых не зависит от параметров – которую можно инвертировать, чтобы получить вероятность того, что будущее наблюдение X n +1 попадет в некоторый интервал, вычисленный в терминах наблюдаемых значений до сих пор. Такая основная величина, зависящая только от наблюдаемых, называется вспомогательной статистикой . [2] Обычный метод построения основных величин заключается в том, чтобы взять разность двух переменных, зависящих от местоположения, так что местоположение сокращается, а затем взять отношение двух переменных, зависящих от масштаба, так что масштаб сокращается. Наиболее известной основной величиной является t-статистика Стьюдента , которая может быть выведена этим методом и используется в дальнейшем.
Интервал прогнозирования [ ℓ , u ] для будущего наблюдения X в нормальном распределении N ( μ , σ2 ) с известным средним значением и дисперсией может быть рассчитан из
где , стандартная оценка X , распределена как стандартное нормальное.
Следовательно
или
где z — квантиль в стандартном нормальном распределении, для которого:
или эквивалентно;
Интервал прогнозирования условно записывается как:
Например, чтобы вычислить 95% интервал прогнозирования для нормального распределения со средним значением ( μ ), равным 5, и стандартным отклонением ( σ ), равным 1, z приблизительно равно 2. Таким образом, нижний предел интервала прогнозирования приблизительно равен 5 ‒ (2⋅1) = 3, а верхний предел приблизительно равен 5 + (2⋅1) = 7, что дает интервал прогнозирования приблизительно от 3 до 7.
Для распределения с неизвестными параметрами прямой подход к прогнозированию заключается в оценке параметров и последующем использовании связанной функции квантиля — например, можно использовать выборочное среднее в качестве оценки для μ и выборочную дисперсию s 2 в качестве оценки для σ 2 . Здесь есть два естественных выбора для s 2 — деление на дает несмещенную оценку, в то время как деление на n дает оценку максимального правдоподобия , и можно использовать любой из них. Затем можно использовать функцию квантиля с этими оцененными параметрами, чтобы получить интервал прогнозирования.
Этот подход пригоден для использования, но полученный интервал не будет иметь интерпретации повторной выборки [4] – это не прогнозируемый доверительный интервал.
Для дальнейшего используйте выборочное среднее:
и (несмещенная) выборочная дисперсия:
При условии [5] нормального распределения с неизвестным средним значением μ, но известной дисперсией 1, выборочное среднее значение наблюдений имеет распределение , в то время как будущее наблюдение имеет распределение. Взяв разницу между ними, мы сокращаем μ и получаем нормальное распределение дисперсии, таким образом
Решение для дает распределение предсказания, из которого можно вычислить интервалы, как и раньше. Это интервал предсказания доверия в том смысле, что если использовать квантильный диапазон 100 p %, то при повторных применениях этого вычисления будущее наблюдение будет попадать в предсказанный интервал 100 p % времени.
Обратите внимание, что это распределение прогноза более консервативно, чем использование оценочного среднего и известной дисперсии 1, поскольку оно использует дисперсию , следовательно, дает более широкие интервалы. Это необходимо для сохранения желаемого свойства доверительного интервала.
Наоборот, если задано нормальное распределение с известным средним значением 0, но неизвестной дисперсией , то выборочная дисперсия наблюдений имеет, с точностью до масштаба, распределение ; точнее:
в то время как будущее наблюдение имеет распределение. Взяв отношение будущего наблюдения и выборочного стандартного отклонения [ необходимо разъяснение ] , мы сокращаем σ, получая распределение Стьюдента с n – 1 степенями свободы :
Решение дает прогнозируемое распределение , из которого можно вычислить интервалы, как и раньше.
Обратите внимание, что это распределение прогноза более консервативно, чем использование нормального распределения с оценкой стандартного отклонения и известным средним значением 0, поскольку оно использует t-распределение вместо нормального распределения, следовательно, дает более широкие интервалы. Это необходимо для сохранения желаемого свойства доверительного интервала.
Объединяя вышеизложенное для нормального распределения с неизвестными μ и σ 2 , получаем следующую вспомогательную статистику: [6]
Эта простая комбинация возможна, поскольку выборочное среднее значение и выборочная дисперсия нормального распределения являются независимыми статистиками; это справедливо только для нормального распределения и фактически характеризует нормальное распределение.
Решение дает прогнозируемое распределение
Вероятность попадания в заданный интервал тогда равна:
где T a — 100((1 − p )/2) -й процентиль распределения Стьюдента с n − 1 степенями свободы. Следовательно, числа
являются конечными точками 100(1 − p )% интервала прогнозирования для .
Можно вычислить интервалы прогнозирования без каких-либо предположений относительно популяции, т.е. непараметрическим способом .
Метод остаточного бутстрапа можно использовать для построения непараметрических интервалов прогнозирования.
В целом, метод конформного прогнозирования более общий. Давайте рассмотрим частный случай использования минимума и максимума в качестве границ для интервала прогнозирования: если у нас есть выборка идентичных случайных величин { X 1 , ..., X n }, то вероятность того, что следующее наблюдение X n +1 будет наибольшим, равна 1/( n + 1), поскольку все наблюдения имеют одинаковую вероятность быть максимальным. Точно так же вероятность того, что X n +1 будет наименьшим, равна 1/( n + 1). В остальное ( n − 1)/( n + 1) время X n +1 попадает между максимумом и минимумом выборки { X 1 , ..., X n }. Таким образом, обозначая максимум и минимум выборки через M и m, мы получаем ( n − 1)/( n + 1) интервал прогнозирования [ m , M ].
Обратите внимание, что хотя это дает вероятность того, что будущее наблюдение попадет в диапазон, это не дает никакой оценки того, где в сегменте оно попадет – в частности, если оно выходит за пределы диапазона наблюдаемых значений, оно может быть далеко за пределами диапазона. См. теорию экстремальных значений для дальнейшего обсуждения. Формально это применимо не только к выборке из популяции, но и к любой заменяемой последовательности случайных величин, не обязательно независимых или одинаково распределенных .
В формуле для прогнозного доверительного интервала не упоминаются ненаблюдаемые параметры μ и σ среднего значения совокупности и стандартного отклонения — используются наблюдаемые выборочные статистики , а также выборочное среднее значение и стандартное отклонение, а оценивается результат будущих выборок.
При рассмотрении интервалов прогнозирования вместо использования выборочной статистики в качестве оценщиков параметров популяции и применения доверительных интервалов к этим оценкам рассматривается «следующая выборка» как сама по себе статистика и вычисляется ее выборочное распределение .
В доверительных интервалах параметров оцениваются параметры популяции; если кто-то хочет интерпретировать это как прогнозирование следующей выборки, он моделирует «следующую выборку» как выборку из этой оценочной популяции, используя (оцененное) распределение популяции . Напротив, в доверительных интервалах прогнозирования используется выборочное распределение (статистика) выборки из n или n + 1 наблюдений из такой популяции, и распределение популяции напрямую не используется, хотя предположение о его форме (но не значения его параметров) используется при вычислении выборочного распределения.
Распространенным применением интервалов прогнозирования является регрессионный анализ .
Предположим, что данные моделируются с помощью прямой линейной регрессии:
где — переменная отклика , — объясняющая переменная , ε i — случайная ошибка, а и — параметры.
При заданных оценках и параметрах, например, из простой линейной регрессии , прогнозируемое значение отклика y d для заданного объясняющего значения x d равно
(точка на линии регрессии), тогда как фактический ответ будет
Точечная оценка называется средним откликом и представляет собой оценку ожидаемого значения y d ,
Вместо этого интервал прогнозирования дает интервал, в котором ожидается падение y d ; это не обязательно, если известны фактические параметры α и β (вместе с ошибкой ε i ), но если оценка выполняется на основе выборки , то можно использовать стандартную ошибку оценок для отсекаемого значения и наклона ( и ), а также их корреляцию, чтобы вычислить интервал прогнозирования.
В регрессии Фаравей (2002, стр. 39) проводит различие между интервалами для прогнозов среднего отклика и для прогнозов наблюдаемого отклика, что по существу влияет на включение или невключение единичного члена в квадратный корень в коэффициентах расширения выше; подробности см. в Фаравее (2002).
Сеймур Гейссер , сторонник предсказательного вывода, предлагает предсказательное применение байесовской статистики . [7]
В байесовской статистике можно вычислить (байесовские) интервалы предсказания из апостериорной вероятности случайной величины, как достоверный интервал . В теоретической работе достоверные интервалы часто вычисляются не для предсказания будущих событий, а для вывода параметров – т. е. достоверные интервалы параметра, а не для результатов самой переменной. Однако, особенно там, где приложения связаны с возможными экстремальными значениями еще не наблюдавшихся случаев, достоверные интервалы для таких значений могут иметь практическое значение.
Интервалы прогнозирования обычно используются в качестве определений референтных диапазонов , таких как референтные диапазоны для анализов крови, чтобы дать представление о том, является ли анализ крови нормальным или нет. Для этой цели наиболее часто используемым интервалом прогнозирования является 95%-ный интервал прогнозирования, а референтный диапазон, основанный на нем, можно назвать стандартным референтным диапазоном .