stringtranslate.com

Неоднородная гауссовская регрессия

Неоднородная гауссовская регрессия ( NGR ) [1] [2] — это тип статистического регрессионного анализа, используемый в атмосферных науках как способ преобразования ансамблевых прогнозов в вероятностные прогнозы . [3] По сравнению с простой линейной регрессией , NGR использует ансамблевый разброс в качестве дополнительного предиктора, который используется для улучшения прогнозирования неопределенности и позволяет прогнозируемой неопределенности варьироваться от случая к случаю. Прогнозирование неопределенности в NGR выводится как из статистики прошлых ошибок прогноза, так и ансамблевого разброса. NGR изначально был разработан для среднесрочного прогнозирования температуры на определенном участке [1] , но с тех пор также применялся к среднесрочному прогнозированию ветра на определенном участке [4] и к сезонным прогнозам [5] и был адаптирован для прогнозирования осадков. [6] Введение NGR было первой демонстрацией того, что вероятностные прогнозы, учитывающие изменяющийся ансамблевый разброс, могут достигать лучших оценок точности, чем прогнозы, основанные на подходах к стандартной выходной статистике модели, применяемых к среднему ансамблю.

Интуиция

Прогнозы погоды, генерируемые компьютерным моделированием атмосферы и океана, обычно состоят из ансамбля индивидуальных прогнозов. Ансамбли используются как способ попытаться зафиксировать и количественно оценить неопределенности в процессе прогнозирования погоды, такие как неопределенность начальных условий и неопределенность параметризации в модели . Для точечных прогнозов нормально распределенных переменных можно суммировать ансамблевый прогноз со средним значением и стандартным отклонением ансамбля. Среднее значение ансамбля часто является лучшим прогнозом, чем любой из индивидуальных прогнозов, а стандартное отклонение ансамбля может дать представление о неопределенности в прогнозе.

Однако прямой вывод из компьютерного моделирования атмосферы нуждается в калибровке, прежде чем его можно будет осмысленно сравнить с наблюдениями за погодными переменными. Этот процесс калибровки часто называют статистикой выходных данных модели (MOS). Простейшей формой такой калибровки является исправление смещений с использованием коррекции смещения, рассчитанной на основе прошлых ошибок прогноза. Коррекция смещения может применяться как к отдельным членам ансамбля, так и к среднему значению ансамбля. Более сложной формой калибровки является использование прошлых прогнозов и прошлых наблюдений для обучения простой модели линейной регрессии, которая сопоставляет среднее значение ансамбля с наблюдениями. В такой модели неопределенность в прогнозе выводится исключительно из статистических свойств прошлых ошибок прогноза. Однако ансамблевые прогнозы строятся с надеждой на то, что разброс ансамбля может содержать дополнительную информацию о неопределенности, помимо информации, которая может быть получена из анализа прошлых результатов прогноза. В частности, поскольку разброс ансамбля обычно отличается для каждого последующего прогноза, было высказано предположение, что разброс ансамбля может дать основу для прогнозирования различных уровней неопределенности в разных прогнозах, что трудно сделать из прошлых оценок неопределенности, основанных на результатах. Содержит ли ансамблевый спред информацию о неопределенности прогноза и сколько именно информации он содержит, зависит от многих факторов, таких как система прогнозирования, переменная прогноза, разрешение и время выполнения прогноза.

NGR — это способ включить информацию из ансамбля спреда в калибровку прогноза, предсказывая будущую неопределенность как взвешенную комбинацию неопределенности, оцененной с использованием прошлых ошибок прогноза, как в MOS, и неопределенности, оцененной с использованием ансамбля спреда. Веса двух источников информации о неопределенности калибруются с использованием прошлых прогнозов и прошлых наблюдений в попытке получить оптимальное взвешивание.

Обзор

Рассмотрим ряд прошлых наблюдений за погодой за период в несколько дней (или другой временной интервал):

и соответствующий ряд прошлых ансамблевых прогнозов, характеризующийся выборочным средним и стандартным отклонением ансамбля:

.

Также рассмотрим новый ансамблевый прогноз из той же системы со средним ансамблем и стандартным отклонением ансамбля , предназначенный в качестве прогноза для неизвестного будущего наблюдения за погодой .

Простой способ калибровки выходных параметров нового ансамблевого прогноза и создания калиброванного прогноза для заключается в использовании простой линейной регрессионной модели, основанной на среднем значении ансамбля , обученной с использованием прошлых наблюдений за погодой и прошлых прогнозов:

Эта модель имеет эффект смещения, корректирующего среднее ансамбля и регулирующего уровень изменчивости прогноза. Она может быть применена к новому ансамблевому прогнозу для создания точечного прогноза для использования

или получить вероятностный прогноз распределения возможных значений на основе нормального распределения со средним значением и дисперсией :

Использование регрессии для калибровки прогнозов погоды таким образом является примером выходной статистики модели .

Однако эта простая линейная регрессионная модель не использует стандартное отклонение ансамбля и, следовательно, пропускает любую информацию, которую может содержать стандартное отклонение ансамбля о неопределенности прогноза. Модель NGR была введена как способ потенциального улучшения предсказания неопределенности в прогнозе путем включения информации, извлеченной из стандартного отклонения ансамбля. Это достигается путем обобщения простой линейной регрессионной модели до:

[1]

или

[1] [2]

Затем это можно использовать для калибровки новых параметров ансамблевого прогноза с использованием либо

или

соответственно. Неопределенность прогноза теперь задается двумя членами: член постоянен во времени, тогда как член изменяется по мере изменения разброса ансамбля.

Оценка параметров

В научной литературе четыре параметра NGR оценивались либо по максимальному правдоподобию [1] , либо по максимальной непрерывной ранжированной оценке вероятности (CRPS). [2] Также обсуждались плюсы и минусы этих двух подходов. [7]

История

Первоначально метод NGR был разработан в частном секторе учеными из Risk Management Solutions Ltd с целью использования информации в ансамблевом спреде для оценки производных от погоды . [1]

Терминология

Первоначально NGR назывался «регрессией распространения», а не NGR. [1] Однако последующие авторы сначала ввели альтернативные названия: статистика выходных данных ансамблевой модели (EMOS) [2], а затем NGR. [8] Первоначальное название «регрессия распространения» теперь вышло из употребления, EMOS используется для обозначения любого метода, используемого для калибровки ансамблей, а NGR обычно используется для обозначения метода, описанного в этой статье. [4] [7]

Ссылки

  1. ^ abcdefg Jewishon, S.; Brix, A.; Ziehmann, C. (2004). «Новая параметрическая модель для оценки и калибровки среднесрочных ансамблевых прогнозов температуры». Atmospheric Science Letters . 5 (5): 96–102. arXiv : physics/0308057 . doi : 10.1002/asl.69 .
  2. ^ abcd Gneiting, T.; Raftery, A.; Westveld, A.; Goldman, T. (2005). "Калиброванное вероятностное прогнозирование с использованием выходных статистик ансамблевой модели и минимальной оценки CRPS". Monthly Weather Review . 133 (5): 1098. doi : 10.1175/MWR2904.1 .
  3. ^ "Калибровка и объединение ансамблевых прогнозов" (PDF) . Лаборатория исследований системы Земли NOAA . США: Национальное управление океанических и атмосферных исследований .
  4. ^ ab Thorarinsdottir, T.; Johnson, M. (2012). «Вероятностное прогнозирование порывов ветра с использованием неоднородной гауссовой регрессии». Monthly Weather Review . 140 (3): 889–897. doi : 10.1175/MWR-D-11-00075.1 .
  5. ^ Лалич, Б.; Фирани Сремац, А.; Декич, Л.; Эйцингер, Дж. (2017). «Сезонный прогноз компонентов зеленой воды и урожайности озимой пшеницы в Сербии и Австрии». Журнал сельскохозяйственной науки . 156 (5): 645–657. doi : 10.1017/S0021859617000788 . PMC 6199547. PMID  30369628 . 
  6. ^ Шойерер, М. (2013). «Вероятностное количественное прогнозирование осадков с использованием выходных статистических данных ансамблевой модели». Ежеквартальный журнал Королевского метеорологического общества . 140 (680): 1086–1096. arXiv : 1302.0893 . doi : 10.1002/qj.2183. S2CID  88512854.
  7. ^ ab Gebetsberger, M.; Messner, J.; Mayr, G.; Zeileis, A. (2018). «Методы оценки для неоднородных регрессионных моделей: минимальная непрерывная ранжированная оценка вероятности против максимального правдоподобия». Monthly Weather Review . 146 (12): 4323–4338. doi : 10.1175/MWR-D-17-0364.1 .
  8. ^ Уилкс, Д.С. (2006-08-22). "Сравнение методов ансамбля-MOS в условиях Лоренца '96". Meteorological Applications . 13 (3): 243. doi : 10.1017/s1350482706002192 . ISSN  1350-4827.