stringtranslate.com

Среднеквадратичное отклонение

Среднеквадратичное отклонение ( RMSD ) или среднеквадратическая ошибка ( RMSE ) — это либо одна из двух тесно связанных и часто используемых мер различий между истинными или прогнозируемыми значениями, с одной стороны, и наблюдаемыми значениями, либо оценщик с другой стороны . другой.

СКО выборки

СКО выборки представляет собой среднее квадратическое разностей между наблюдаемыми значениями и прогнозируемыми. Эти отклонения называются остатками , когда вычисления выполняются над выборкой данных, которая использовалась для оценки (и, следовательно, всегда относятся к оценке), и называются ошибками (или ошибками прогнозирования), когда вычисляются вне выборки (т. полный набор, ссылаясь на истинное значение, а не на оценку). RMSD служит для агрегирования величин ошибок прогнозов для различных точек данных в единую меру прогнозирующей способности. RMSD — это мера точности , позволяющая сравнивать ошибки прогнозирования различных моделей для конкретного набора данных, а не между наборами данных, поскольку она зависит от масштаба. [1]

СКО всегда неотрицательно, а значение 0 (практически никогда не достигаемое на практике) будет указывать на идеальное соответствие данным. В общем, более низкое RMSD лучше, чем более высокое. Однако сравнения различных типов данных будут недействительными, поскольку мера зависит от масштаба используемых чисел.

RMSD — это квадратный корень из среднего квадрата ошибок. Влияние каждой ошибки на RMSD пропорционально размеру квадрата ошибки; таким образом, более крупные ошибки оказывают непропорционально большое влияние на RMSD. Следовательно, RMSD чувствителен к выбросам . [2] [3]

Формулы

Оценщик

СКО оценщика относительно оцениваемого параметра определяется как квадратный корень из среднеквадратической ошибки :

Для несмещенной оценки среднеквадратичное отклонение представляет собой квадратный корень дисперсии , известной как стандартное отклонение .

Образцы

Если X 1 , ..., X n является выборкой совокупности с истинным средним значением , то СКО выборки равно

.

СКО прогнозируемых значений для времен t зависимой переменной регрессии с переменными, наблюдаемыми в течение T раз, вычисляется для T различных прогнозов как квадратный корень из среднего значения квадратов отклонений:

(Для регрессий по данным поперечного сечения индекс t заменяется на i , а T заменяется на n .)

В некоторых дисциплинах RMSD используется для сравнения различий между двумя вещами, которые могут различаться, ни одна из которых не принимается в качестве «стандарта». Например, при измерении средней разницы между двумя временными рядами и формула принимает вид

Нормализация

Нормализация RMSD облегчает сравнение наборов данных или моделей разных масштабов. Хотя в литературе нет последовательных способов нормализации, обычно выбирают среднее значение или диапазон (определяемый как максимальное значение минус минимальное значение) измеренных данных: [4]

или .

Это значение обычно называют нормализованным среднеквадратичным отклонением или ошибкой (NRMSD или NRMSE) и часто выражают в процентах, где более низкие значения указывают на меньшую остаточную дисперсию. Это также называется коэффициентом вариации или процентом RMS . Во многих случаях, особенно для небольших выборок, диапазон выборки, вероятно, будет зависеть от размера выборки, что затруднит сравнения.

Другой возможный способ сделать СКО более полезным показателем сравнения — разделить СКО на межквартильный размах . При делении RMSD на IQR нормализованное значение становится менее чувствительным к экстремальным значениям целевой переменной.

где

где и где CDF −1функция квантиля .

При нормализации по среднему значению измерений во избежание двусмысленности можно использовать термин коэффициент вариации СКО, CV(RMSD) . [5] Это аналогично коэффициенту вариации , где среднеквадратическое отклонение заменяет стандартное отклонение .

Средняя абсолютная ошибка

Некоторые исследователи [ кто? ] рекомендовали [ где? ] использование средней абсолютной ошибки (MAE) вместо среднеквадратического отклонения. MAE обладает преимуществами в интерпретируемости по сравнению с RMSD. MAE – среднее абсолютных значений ошибок. MAE принципиально легче понять, чем квадратный корень из среднего квадрата ошибок. Более того, каждая ошибка влияет на MAE прямо пропорционально абсолютному значению ошибки, чего нельзя сказать о RMSD. [2]

Приложения

Смотрите также

Рекомендации

  1. ^ Гайндман, Роб Дж.; Келер, Энн Б. (2006). «Еще один взгляд на показатели точности прогнозов». Международный журнал прогнозирования . 22 (4): 679–688. CiteSeerX  10.1.1.154.9771 . doi :10.1016/j.ijforecast.2006.03.001. S2CID  15947215.
  2. ^ аб Понтий, Роберт; Тонттех, Олуфунмилайо; Чен, Хао (2008). «Компоненты информации для сравнения нескольких разрешений между картами, имеющими общую реальную переменную» (PDF) . Экологическая статистика . 15 (2): 111–142. Бибкод : 2008EnvES..15..111P. дои : 10.1007/s10651-007-0043-y. S2CID  21427573.
  3. ^ Уиллмотт, Корт; Мацуура, Кендзи (2006). «Об использовании размерных мер погрешности для оценки эффективности пространственных интерполяторов». Международный журнал географической информатики . 20 (1): 89–102. Бибкод : 2006IJGIS..20...89W. дои : 10.1080/13658810500286976. S2CID  15407960.
  4. ^ «Программа исследования прибрежных заливов (CIRP) Wiki — Статистика» . Проверено 4 февраля 2015 г.
  5. ^ «Часто задаваемые вопросы: Что такое коэффициент вариации?» . Проверено 19 февраля 2019 г.
  6. ^ Армстронг, Дж. Скотт; Коллопи, Фред (1992). «Меры ошибок для обобщения методов прогнозирования: эмпирические сравнения» (PDF) . Международный журнал прогнозирования . 8 (1): 69–80. CiteSeerX 10.1.1.423.508 . дои : 10.1016/0169-2070(92)90008-w. S2CID  11034360. 
  7. ^ Андерсон, член парламента; Весснер, WW (1992). Прикладное моделирование подземных вод: моделирование потока и адвективного переноса (2-е изд.). Академическая пресса.
  8. ^ Ансамблевая модель нейронной сети
  9. ^ ANSI / BPI-2400-S-2012: Стандартная практика стандартизированной квалификации прогнозов энергосбережения во всем доме путем калибровки по истории использования энергии
  10. ^ https://kalman-filter.com/root-mean-square-error