Неоднородная гауссовская регрессия ( NGR ) [1] [2] — это тип статистического регрессионного анализа, используемый в атмосферных науках как способ преобразования ансамблевых прогнозов в вероятностные прогнозы . [3] По сравнению с простой линейной регрессией , NGR использует ансамблевый разброс в качестве дополнительного предиктора, который используется для улучшения прогнозирования неопределенности и позволяет прогнозируемой неопределенности варьироваться от случая к случаю. Прогнозирование неопределенности в NGR выводится как из статистики прошлых ошибок прогноза, так и ансамблевого разброса. NGR изначально был разработан для среднесрочного прогнозирования температуры на определенном участке [1] , но с тех пор также применялся к среднесрочному прогнозированию ветра на определенном участке [4] и к сезонным прогнозам [5] и был адаптирован для прогнозирования осадков. [6] Введение NGR было первой демонстрацией того, что вероятностные прогнозы, учитывающие изменяющийся ансамблевый разброс, могут достигать лучших оценок точности, чем прогнозы, основанные на подходах к стандартной выходной статистике модели, применяемых к среднему ансамблю.
Прогнозы погоды, генерируемые компьютерным моделированием атмосферы и океана, обычно состоят из ансамбля индивидуальных прогнозов. Ансамбли используются как способ попытаться зафиксировать и количественно оценить неопределенности в процессе прогнозирования погоды, такие как неопределенность начальных условий и неопределенность параметризации в модели . Для точечных прогнозов нормально распределенных переменных можно суммировать ансамблевый прогноз со средним значением и стандартным отклонением ансамбля. Среднее значение ансамбля часто является лучшим прогнозом, чем любой из индивидуальных прогнозов, а стандартное отклонение ансамбля может дать представление о неопределенности в прогнозе.
Однако прямой вывод из компьютерного моделирования атмосферы нуждается в калибровке, прежде чем его можно будет осмысленно сравнить с наблюдениями за погодными переменными. Этот процесс калибровки часто называют статистикой выходных данных модели (MOS). Простейшей формой такой калибровки является исправление смещений с использованием коррекции смещения, рассчитанной на основе прошлых ошибок прогноза. Коррекция смещения может применяться как к отдельным членам ансамбля, так и к среднему значению ансамбля. Более сложной формой калибровки является использование прошлых прогнозов и прошлых наблюдений для обучения простой модели линейной регрессии, которая сопоставляет среднее значение ансамбля с наблюдениями. В такой модели неопределенность в прогнозе выводится исключительно из статистических свойств прошлых ошибок прогноза. Однако ансамблевые прогнозы строятся с надеждой на то, что разброс ансамбля может содержать дополнительную информацию о неопределенности, помимо информации, которая может быть получена из анализа прошлых результатов прогноза. В частности, поскольку разброс ансамбля обычно отличается для каждого последующего прогноза, было высказано предположение, что разброс ансамбля может дать основу для прогнозирования различных уровней неопределенности в разных прогнозах, что трудно сделать из прошлых оценок неопределенности, основанных на результатах. Содержит ли ансамблевый спред информацию о неопределенности прогноза и сколько именно информации он содержит, зависит от многих факторов, таких как система прогнозирования, переменная прогноза, разрешение и время выполнения прогноза.
NGR — это способ включить информацию из ансамбля спреда в калибровку прогноза, предсказывая будущую неопределенность как взвешенную комбинацию неопределенности, оцененной с использованием прошлых ошибок прогноза, как в MOS, и неопределенности, оцененной с использованием ансамбля спреда. Веса двух источников информации о неопределенности калибруются с использованием прошлых прогнозов и прошлых наблюдений в попытке получить оптимальное взвешивание.
Рассмотрим ряд прошлых наблюдений за погодой за период в несколько дней (или другой временной интервал):
и соответствующий ряд прошлых ансамблевых прогнозов, характеризующийся выборочным средним и стандартным отклонением ансамбля:
Также рассмотрим новый ансамблевый прогноз из той же системы со средним ансамблем и стандартным отклонением ансамбля , предназначенный в качестве прогноза для неизвестного будущего наблюдения за погодой .
Простой способ калибровки выходных параметров нового ансамблевого прогноза и создания калиброванного прогноза для заключается в использовании простой линейной регрессионной модели, основанной на среднем значении ансамбля , обученной с использованием прошлых наблюдений за погодой и прошлых прогнозов:
Эта модель имеет эффект смещения, корректирующего среднее ансамбля и регулирующего уровень изменчивости прогноза. Она может быть применена к новому ансамблевому прогнозу для создания точечного прогноза для использования
или получить вероятностный прогноз распределения возможных значений на основе нормального распределения со средним значением и дисперсией :
Использование регрессии для калибровки прогнозов погоды таким образом является примером выходной статистики модели .
Однако эта простая линейная регрессионная модель не использует стандартное отклонение ансамбля и, следовательно, пропускает любую информацию, которую может содержать стандартное отклонение ансамбля о неопределенности прогноза. Модель NGR была введена как способ потенциального улучшения предсказания неопределенности в прогнозе путем включения информации, извлеченной из стандартного отклонения ансамбля. Это достигается путем обобщения простой линейной регрессионной модели до:
или
Затем это можно использовать для калибровки новых параметров ансамблевого прогноза с использованием либо
или
соответственно. Неопределенность прогноза теперь задается двумя членами: член постоянен во времени, тогда как член изменяется по мере изменения разброса ансамбля.
В научной литературе четыре параметра NGR оценивались либо по максимальному правдоподобию [1] , либо по максимальной непрерывной ранжированной оценке вероятности (CRPS). [2] Также обсуждались плюсы и минусы этих двух подходов. [7]
Первоначально метод NGR был разработан в частном секторе учеными из Risk Management Solutions Ltd с целью использования информации в ансамблевом спреде для оценки производных от погоды . [1]
Первоначально NGR назывался «регрессией распространения», а не NGR. [1] Однако последующие авторы сначала ввели альтернативные названия: статистика выходных данных ансамблевой модели (EMOS) [2], а затем NGR. [8] Первоначальное название «регрессия распространения» теперь вышло из употребления, EMOS используется для обозначения любого метода, используемого для калибровки ансамблей, а NGR обычно используется для обозначения метода, описанного в этой статье. [4] [7]