stringtranslate.com

Средняя абсолютная процентная ошибка

Средняя абсолютная процентная ошибка ( MAPE ), также известная как среднее абсолютное процентное отклонение ( MAPD ), является мерой точности прогнозирования метода прогнозирования в статистике . Обычно она выражает точность как отношение, определяемое формулой:

где A t — фактическое значение, а F t — прогнозируемое значение. Их разность делится на фактическое значение A t . Абсолютное значение этого отношения суммируется для каждого прогнозируемого момента времени и делится на количество подобранных точек  n .

MAPE в задачах регрессии

Средняя абсолютная процентная ошибка обычно используется в качестве функции потерь для задач регрессии и при оценке моделей из-за ее интуитивно понятной интерпретации с точки зрения относительной ошибки.

Определение

Рассмотрим стандартную настройку регрессии, в которой данные полностью описываются случайной парой со значениями в и n iid копиями . Целью регрессионных моделей является поиск хорошей модели для пары, то есть измеримой функции g от до такой, что она близка к Y .

В классической регрессии близость к Y измеряется через риск L 2 , также называемый средней квадратичной ошибкой (MSE). В контексте регрессии MAPE [1] близость к Y измеряется через MAPE, и целью регрессий MAPE является поиск модели, такой что:

где - класс рассматриваемых моделей (например, линейные модели).

На практике

На практике можно оценить с помощью эмпирической стратегии минимизации риска , что приводит к

С практической точки зрения использование MAPE в качестве функции качества для регрессионной модели эквивалентно выполнению регрессии взвешенной средней абсолютной ошибки (MAE), также известной как квантильная регрессия . Это свойство тривиально, поскольку

В результате использование MAPE на практике становится очень простым, например, с использованием существующих библиотек для квантильной регрессии, допускающих весовые коэффициенты.

Последовательность

Использование MAPE в качестве функции потерь для регрессионного анализа возможно как с практической, так и с теоретической точки зрения, поскольку можно доказать существование оптимальной модели и состоятельность минимизации эмпирического риска. [1]

WMAPE

WMAPE (иногда пишется как wMAPE ) означает средневзвешенную абсолютную процентную ошибку. [2] Это мера, используемая для оценки производительности регрессионных или прогнозных моделей. Это вариант MAPE, в котором среднее абсолютное процентное отклонение рассматривается как среднее арифметическое взвешенное. Чаще всего абсолютные процентные отклонение взвешиваются фактическими значениями (например, в случае прогнозирования продаж ошибки взвешиваются объемом продаж). [3] По сути, это решает проблему «бесконечной ошибки». [4] Ее формула такова: [4]

Где — вес, — вектор фактических данных, — прогноз или предсказание. Однако это фактически упрощается до гораздо более простой формулы:

Сбивает с толку, но иногда, когда люди ссылаются на wMAPE, они говорят о другой модели, в которой числитель и знаменатель формулы wMAPE выше снова взвешиваются другим набором пользовательских весов . Возможно, было бы точнее назвать это MAPE с двойным весом (wwMAPE). Его формула:

Проблемы

Хотя концепция MAPE звучит очень просто и убедительно, она имеет серьезные недостатки в практическом применении, [5] и существует множество исследований, посвященных недостаткам и вводящим в заблуждение результатам MAPE. [6] [7]

Для решения этих проблем с MAPE в литературе предлагаются и другие меры:

Смотрите также

Внешние ссылки

Ссылки

  1. ^ ab de Myttenaere, B Golden, B Le Grand, F Rossi (2015). "Средняя абсолютная процентная ошибка для регрессионных моделей", Neurocomputing 2016 arXiv :1605.02541
  2. ^ «Понимание точности прогнозов: MAPE, WAPE, WMAPE».
  3. ^ «WMAPE: Взвешенная средняя абсолютная процентная ошибка».
  4. ^ ab «Статистические ошибки прогноза».
  5. ^ ab Tofallis (2015). «Лучшая мера относительной точности прогнозирования для выбора и оценки модели», Журнал общества операционных исследований , 66(8):1352-1362. архивный препринт
  6. ^ Хайндман, Роб Дж. и Энн Б. Келер (2006). «Еще один взгляд на меры точности прогнозов». Международный журнал прогнозирования , 22(4):679-688 doi:10.1016/j.ijforecast.2006.03.001.
  7. ^ ab Kim, Sungil и Heeyoung Kim (2016). «Новая метрика абсолютной процентной ошибки для прогнозов прерывистого спроса». Международный журнал прогнозирования , 32(3):669-679 doi:10.1016/j.ijforecast.2015.12.003.
  8. ^ Ким, Сунгил; Ким, Хиён (1 июля 2016 г.). «Новая метрика абсолютной процентной ошибки для прогнозов прерывистого спроса». Международный журнал прогнозирования . 32 (3): 669–679. doi : 10.1016/j.ijforecast.2015.12.003 .
  9. ^ Макридакис, Спирос (1993) «Меры точности: теоретические и практические проблемы». Международный журнал прогнозирования , 9(4):527-529 doi:10.1016/0169-2070(93)90079-3