Статистическая мера
Среднеквадратичное отклонение ( RMSD ) или среднеквадратическая ошибка ( RMSE ) — это либо одна из двух тесно связанных и часто используемых мер различий между истинными или предсказанными значениями, с одной стороны, и наблюдаемыми значениями или оценкой , с другой. Отклонение обычно представляет собой просто разницу скаляров ; его также можно обобщить до векторных длин смещения , как в концепции биоинформатики среднеквадратичного отклонения атомных позиций .
СКО образца
RMSD выборки — это квадратичное среднее разностей между наблюдаемыми и прогнозируемыми значениями. Эти отклонения называются остатками , когда вычисления выполняются по выборке данных, которая использовалась для оценки (и поэтому всегда относятся к оценке), и называются ошибками (или ошибками прогнозирования), когда вычисляются вне выборки (т. е. на полном наборе, ссылаясь на истинное значение, а не на оценку). RMSD служит для объединения величин ошибок в прогнозах для различных точек данных в единую меру предсказательной силы. RMSD — это мера точности , для сравнения ошибок прогнозирования различных моделей для конкретного набора данных, а не между наборами данных, поскольку она зависит от масштаба. [1]
RMSD всегда неотрицательно, и значение 0 (которое почти никогда не достигается на практике) будет указывать на идеальное соответствие данным. В общем случае, меньшее RMSD лучше, чем большее. Однако сравнения между различными типами данных будут недействительными, поскольку мера зависит от масштаба используемых чисел.
RMSD — это квадратный корень из среднего квадрата ошибок. Влияние каждой ошибки на RMSD пропорционально размеру квадрата ошибки; таким образом, большие ошибки оказывают непропорционально большое влияние на RMSD. Следовательно, RMSD чувствителен к выбросам . [2] [3]
Формулы
Оценщик
Среднеквадратическое отклонение оценки по отношению к оцениваемому параметру определяется как квадратный корень из среднеквадратической ошибки :
Для несмещенной оценки СКО представляет собой квадратный корень дисперсии , известный как стандартное отклонение .
Образцы
Если X 1 , ..., X n — выборка из популяции с истинным средним значением , то среднеквадратичное отклонение выборки равно
- .
Среднеквадратическое отклонение предсказанных значений для времен t зависимой переменной регрессии с переменными, наблюдаемыми в течение T времен, вычисляется для T различных предсказаний как квадратный корень из среднего значения квадратов отклонений:
(Для регрессий на основе перекрестных данных нижний индекс t заменяется на i , а T заменяется на n .)
В некоторых дисциплинах RMSD используется для сравнения различий между двумя вещами, которые могут меняться, ни одна из которых не принимается в качестве «стандарта». Например, при измерении средней разницы между двумя временными рядами и формула становится
Нормализация
Нормализация RMSD облегчает сравнение наборов данных или моделей с различными масштабами. Хотя в литературе нет последовательных методов нормализации, распространенным выбором является среднее значение или диапазон (определяемый как максимальное значение минус минимальное значение) измеренных данных: [4]
- или .
Это значение обычно называют нормализованным средним квадратичным отклонением или ошибкой (NRMSD или NRMSE) и часто выражается в процентах, где более низкие значения указывают на меньшую остаточную дисперсию. Это также называется коэффициентом вариации или процентом RMS . Во многих случаях, особенно для небольших выборок, диапазон выборки, вероятно, будет зависеть от размера выборки, что затруднит сравнение.
Другой возможный метод сделать RMSD более полезной мерой сравнения — это разделить RMSD на межквартильный размах (IQR). При делении RMSD на IQR нормализованное значение становится менее чувствительным к экстремальным значениям в целевой переменной.
- где
с и где CDF −1 — функция квантиля .
При нормализации по среднему значению измерений можно использовать термин коэффициент вариации СКО, CV(СКО), чтобы избежать двусмысленности. [5] Это аналогично коэффициенту вариации , где СКО занимает место стандартного отклонения .
Средняя абсолютная ошибка
Некоторые исследователи [ кто? ] рекомендовали [ где? ] использовать среднюю абсолютную ошибку (MAE) вместо среднеквадратического отклонения. MAE обладает преимуществами в интерпретируемости по сравнению с RMSD. MAE — это среднее значение абсолютных значений ошибок. MAE принципиально проще для понимания, чем квадратный корень из среднего значения квадратов ошибок. Более того, каждая ошибка влияет на MAE прямо пропорционально абсолютному значению ошибки, что не относится к RMSD. [2]
Приложения
- В метеорологии — чтобы увидеть, насколько эффективно математическая модель предсказывает поведение атмосферы .
- В биоинформатике среднеквадратичное отклонение положений атомов является мерой среднего расстояния между атомами наложенных друг на друга белков .
- В структурно-ориентированном проектировании лекарственных препаратов среднеквадратичное отклонение (RMSD) является мерой разницы между кристаллической конформацией лиганда и прогнозом стыковки .
- В экономике RMSD используется для определения того, соответствует ли экономическая модель экономическим показателям . Некоторые эксперты утверждают, что RMSD менее надежен, чем относительная абсолютная ошибка. [6]
- В экспериментальной психологии RMSD используется для оценки того, насколько хорошо математические или вычислительные модели поведения объясняют эмпирически наблюдаемое поведение.
- В ГИС СКО является одним из показателей, используемых для оценки точности пространственного анализа и дистанционного зондирования.
- В гидрогеологии RMSD и NRMSD используются для оценки калибровки модели подземных вод. [7]
- В науке о визуализации среднеквадратическое отклонение (RMSD) является частью пикового отношения сигнал/шум — показателя, используемого для оценки того, насколько хорошо метод реконструкции изображения работает по сравнению с исходным изображением.
- В вычислительной нейронауке RMSD используется для оценки того, насколько хорошо система усваивает заданную модель. [8]
- В спектроскопии ядерного магнитного резонанса белков RMSD используется в качестве меры для оценки качества полученного пучка структур.
- Заявки на премию Netflix оценивались с использованием среднеквадратического отклонения (RMSD) на основе нераскрытых «истинных» значений тестового набора данных.
- При моделировании энергопотребления зданий RMSE и CV(RMSE) используются для калибровки моделей в соответствии с измеренными эксплуатационными характеристиками здания . [9]
- В рентгеновской кристаллографии RMSD (и RMSZ) используется для измерения отклонения внутренних координат молекулы от значений библиотеки ограничений.
- В теории управления среднеквадратическая ошибка используется как мера качества для оценки эффективности наблюдателя состояния . [10]
- В динамике жидкости нормализованное среднеквадратичное отклонение (NRMSD), коэффициент вариации (CV) и процент RMS используются для количественной оценки однородности поведения потока, например, профиля скорости, распределения температуры или концентрации газовых видов. Значение сравнивается с отраслевыми стандартами для оптимизации конструкции потока и термического оборудования и процессов.
Смотрите также
Ссылки
- ^ Хайндман, Роб Дж.; Келер, Энн Б. (2006). «Еще один взгляд на меры точности прогнозов». Международный журнал прогнозирования . 22 (4): 679–688. CiteSeerX 10.1.1.154.9771 . doi :10.1016/j.ijforecast.2006.03.001. S2CID 15947215.
- ^ ab Pontius, Robert; Thontteh, Olufunmilayo; Chen, Hao (2008). "Компоненты информации для сравнения нескольких разрешений между картами, которые совместно используют действительную переменную" (PDF) . Environmental Ecological Statistics . 15 (2): 111–142. Bibcode :2008EnvES..15..111P. doi :10.1007/s10651-007-0043-y. S2CID 21427573.
- ^ Уиллмотт, Корт; Мацуура, Кэндзи (2006). «Об использовании размерных мер погрешности для оценки производительности пространственных интерполяторов». Международный журнал географической информационной науки . 20 (1): 89–102. Bibcode : 2006IJGIS..20...89W. doi : 10.1080/13658810500286976. S2CID 15407960.
- ^ "Coastal Inlet Research Program (CIRP) Wiki - Статистика" . Получено 4 февраля 2015 г. .
- ^ "FAQ: Что такое коэффициент вариации?" . Получено 19 февраля 2019 г. .
- ^ Армстронг, Дж. Скотт; Коллопи, Фред (1992). "Измерения ошибок для обобщения методов прогнозирования: эмпирические сравнения" (PDF) . Международный журнал прогнозирования . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . doi :10.1016/0169-2070(92)90008-w. S2CID 11034360.
- ^ Андерсон, MP; Восснер, WW (1992). Прикладное моделирование грунтовых вод: Моделирование потока и адвективного переноса (2-е изд.). Academic Press.
- ^ Модель ансамбля нейронных сетей
- ^ ANSI/BPI-2400-S-2012: Стандартная практика для стандартизированной квалификации прогнозов экономии энергии в целом по дому путем калибровки по истории использования энергии
- ^ https://kalman-filter.com/root-mean-square-error