Статистическая мера
Среднеквадратичное отклонение ( RMSD ) или среднеквадратическая ошибка ( RMSE ) — это либо одна из двух тесно связанных и часто используемых мер различий между истинными или прогнозируемыми значениями, с одной стороны, и наблюдаемыми значениями, либо оценщик с другой стороны . другой.
СКО выборки
СКО выборки представляет собой среднее квадратическое разностей между наблюдаемыми значениями и прогнозируемыми. Эти отклонения называются остатками , когда вычисления выполняются над выборкой данных, которая использовалась для оценки (и, следовательно, всегда относятся к оценке), и называются ошибками (или ошибками прогнозирования), когда вычисляются вне выборки (т. полный набор, ссылаясь на истинное значение, а не на оценку). RMSD служит для агрегирования величин ошибок прогнозов для различных точек данных в единую меру прогнозирующей способности. RMSD — это мера точности , позволяющая сравнивать ошибки прогнозирования различных моделей для конкретного набора данных, а не между наборами данных, поскольку она зависит от масштаба. [1]
СКО всегда неотрицательно, а значение 0 (практически никогда не достигаемое на практике) будет указывать на идеальное соответствие данным. В общем, более низкое RMSD лучше, чем более высокое. Однако сравнения различных типов данных будут недействительными, поскольку мера зависит от масштаба используемых чисел.
RMSD — это квадратный корень из среднего квадрата ошибок. Влияние каждой ошибки на RMSD пропорционально размеру квадрата ошибки; таким образом, более крупные ошибки оказывают непропорционально большое влияние на RMSD. Следовательно, RMSD чувствителен к выбросам . [2] [3]
Формулы
Оценщик
СКО оценщика относительно оцениваемого параметра определяется как квадратный корень из среднеквадратической ошибки :![{\displaystyle {\hat {\theta }}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ displaystyle \ theta }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {RMSD} ({\hat {\theta }}) = {\sqrt {\operatorname {MSE} ({\hat {\theta }})}} = {\sqrt {\operatorname {E} (({\hat {\theta }}-\theta )^{2})}}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Для несмещенной оценки среднеквадратичное отклонение представляет собой квадратный корень дисперсии , известной как стандартное отклонение .
Образцы
Если X 1 , ..., X n является выборкой совокупности с истинным средним значением , то СКО выборки равно![{\displaystyle x_{0}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
.
СКО прогнозируемых значений для времен t зависимой переменной регрессии с переменными, наблюдаемыми в течение T раз, вычисляется для T различных прогнозов как квадратный корень из среднего значения квадратов отклонений:
![{\displaystyle y_{t},}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {RMSD} = {\sqrt {\frac {\sum _{t=1}^{T}(y_{t}-{\hat {y}}_{t})^{2} }{Т}}}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
(Для регрессий по данным поперечного сечения индекс t заменяется на i , а T заменяется на n .)
В некоторых дисциплинах RMSD используется для сравнения различий между двумя вещами, которые могут различаться, ни одна из которых не принимается в качестве «стандарта». Например, при измерении средней разницы между двумя временными рядами и формула принимает вид![{\displaystyle x_{1,t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle x_{2,t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \operatorname {RMSD} ={\sqrt {\frac {\sum _{t=1}^{T}(x_{1,t}-x_{2,t})^{2}}{T }}}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Нормализация
Нормализация RMSD облегчает сравнение наборов данных или моделей разных масштабов. Хотя в литературе нет последовательных способов нормализации, обычно выбирают среднее значение или диапазон (определяемый как максимальное значение минус минимальное значение) измеренных данных: [4]
или .![{\displaystyle \mathrm {NRMSD} = {\frac {\mathrm {RMSD} {\bar {y}}}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Это значение обычно называют нормализованным среднеквадратичным отклонением или ошибкой (NRMSD или NRMSE) и часто выражают в процентах, где более низкие значения указывают на меньшую остаточную дисперсию. Это также называется коэффициентом вариации или процентом RMS . Во многих случаях, особенно для небольших выборок, диапазон выборки, вероятно, будет зависеть от размера выборки, что затруднит сравнения.
Другой возможный способ сделать СКО более полезным показателем сравнения — разделить СКО на межквартильный размах . При делении RMSD на IQR нормализованное значение становится менее чувствительным к экстремальным значениям целевой переменной.
где![{\displaystyle IQR=Q_{3}-Q_{1}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
где и где CDF −1 — функция квантиля .![{\displaystyle Q_{1}={\text{CDF}}^{-1}(0,25)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle Q_{3}={\text{CDF}}^{-1}(0,75),}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
При нормализации по среднему значению измерений во избежание двусмысленности можно использовать термин коэффициент вариации СКО, CV(RMSD) . [5] Это аналогично коэффициенту вариации , где среднеквадратическое отклонение заменяет стандартное отклонение .
![{\displaystyle \mathrm {CV(RMSD)} = {\frac {\mathrm {RMSD} {\bar {y}}}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Средняя абсолютная ошибка
Некоторые исследователи [ кто? ] рекомендовали [ где? ] использование средней абсолютной ошибки (MAE) вместо среднеквадратического отклонения. MAE обладает преимуществами в интерпретируемости по сравнению с RMSD. MAE – среднее абсолютных значений ошибок. MAE принципиально легче понять, чем квадратный корень из среднего квадрата ошибок. Более того, каждая ошибка влияет на MAE прямо пропорционально абсолютному значению ошибки, чего нельзя сказать о RMSD. [2]
Приложения
- В метеорологии — чтобы увидеть, насколько эффективно математическая модель предсказывает поведение атмосферы .
- В биоинформатике среднеквадратичное отклонение положений атомов является мерой среднего расстояния между атомами наложенных друг на друга белков .
- При разработке лекарств на основе структуры RMSD является мерой разницы между кристаллической конформацией конформации лиганда и предсказанием стыковки .
- В экономике RMSD используется для определения того, соответствует ли экономическая модель экономическим показателям . Некоторые эксперты утверждают, что RMSD менее надежен, чем относительная абсолютная ошибка. [6]
- В экспериментальной психологии RMSD используется для оценки того, насколько хорошо математические или вычислительные модели поведения объясняют эмпирически наблюдаемое поведение.
- В ГИС RMSD является одной из мер, используемых для оценки точности пространственного анализа и дистанционного зондирования.
- В гидрогеологии RMSD и NRMSD используются для оценки калибровки модели подземных вод. [7]
- В области визуализации RMSD является частью пикового отношения сигнал/шум , меры, используемой для оценки того, насколько хорошо работает метод восстановления изображения по сравнению с исходным изображением.
- В вычислительной нейробиологии RMSD используется для оценки того, насколько хорошо система изучает данную модель. [8]
- В спектроскопии ядерного магнитного резонанса белков RMSD используется как мера оценки качества полученного пучка структур.
- Заявки на премию Netflix оценивались с использованием RMSD на основе нераскрытых «истинных» значений набора тестовых данных.
- При моделировании энергопотребления зданий RMSE и CV(RMSE) используются для калибровки моделей для измерения характеристик зданий . [9]
- В рентгеновской кристаллографии RMSD (и RMSZ) используется для измерения отклонения внутренних координат молекул от значений библиотеки ограничений.
- В теории управления RMSE используется как мера качества для оценки эффективности работы государственного наблюдателя . [10]
- В гидродинамике нормализованное среднеквадратичное отклонение (NRMSD), коэффициент вариации (CV) и процентное среднеквадратичное значение используются для количественной оценки однородности поведения потока, такой как профиль скорости, распределение температуры или концентрация газовых частиц. Значение сравнивается с отраслевыми стандартами для оптимизации конструкции потокового и термического оборудования и процессов.
Смотрите также
Рекомендации
- ^ Гайндман, Роб Дж.; Келер, Энн Б. (2006). «Еще один взгляд на показатели точности прогнозов». Международный журнал прогнозирования . 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi :10.1016/j.ijforecast.2006.03.001. S2CID 15947215.
- ^ аб Понтий, Роберт; Тонттех, Олуфунмилайо; Чен, Хао (2008). «Компоненты информации для сравнения нескольких разрешений между картами, имеющими общую реальную переменную» (PDF) . Экологическая статистика . 15 (2): 111–142. Бибкод : 2008EnvES..15..111P. дои : 10.1007/s10651-007-0043-y. S2CID 21427573.
- ^ Уиллмотт, Корт; Мацуура, Кендзи (2006). «Об использовании размерных мер погрешности для оценки эффективности пространственных интерполяторов». Международный журнал географической информатики . 20 (1): 89–102. Бибкод : 2006IJGIS..20...89W. дои : 10.1080/13658810500286976. S2CID 15407960.
- ^ «Программа исследования прибрежных заливов (CIRP) Wiki — Статистика» . Проверено 4 февраля 2015 г.
- ^ «Часто задаваемые вопросы: Что такое коэффициент вариации?» . Проверено 19 февраля 2019 г.
- ^ Армстронг, Дж. Скотт; Коллопи, Фред (1992). «Меры ошибок для обобщения методов прогнозирования: эмпирические сравнения» (PDF) . Международный журнал прогнозирования . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . дои : 10.1016/0169-2070(92)90008-w. S2CID 11034360.
- ^ Андерсон, член парламента; Весснер, WW (1992). Прикладное моделирование подземных вод: моделирование потока и адвективного переноса (2-е изд.). Академическая пресса.
- ^ Ансамблевая модель нейронной сети
- ^ ANSI / BPI-2400-S-2012: Стандартная практика стандартизированной квалификации прогнозов энергосбережения во всем доме путем калибровки по истории использования энергии
- ^ https://kalman-filter.com/root-mean-square-error