Экспоненциальное сглаживание

Экспоненциальное сглаживание или экспоненциальное скользящее среднее (EMA) — это эмпирический метод сглаживания данных временных рядов с использованием экспоненциальной оконной функции . В то время как в простом скользящем среднем прошлые наблюдения имеют одинаковый вес, экспоненциальные функции используются для присвоения экспоненциально уменьшающихся весов с течением времени. Это легко освоить и легко применить процедуру принятия некоторых решений на основе предварительных предположений пользователя, таких как сезонность. Экспоненциальное сглаживание часто используется для анализа данных временных рядов.

Экспоненциальное сглаживание — одна из многих оконных функций , обычно применяемых для сглаживания данных при обработке сигналов , действующая как фильтры нижних частот для удаления высокочастотного шума . Этому методу предшествует использование Пуассоном рекурсивных экспоненциальных оконных функций в свертках из 19 века, а также использование Колмогоровым и Зурбенко рекурсивных скользящих средних из их исследований турбулентности в 1940-х годах.

Последовательность необработанных данных часто обозначается как начало в момент времени , а выходные данные алгоритма экспоненциального сглаживания обычно записываются как , что можно рассматривать как наилучшую оценку того, каким будет следующее значение. Когда последовательность наблюдений начинается в момент времени , простейшая форма экспоненциального сглаживания задается формулами: ^[1] $\{x_{t}\}$ $т=0$ $\{s_{t}\}$ $х$ $т=0$

{\begin{aligned}s_{0}&=x_{0}\\s_{t}&=\alpha x_{t}+(1-\alpha)s_{t-1},\quad t >0\end{выровнено}}

где коэффициент сглаживания , и . $\альфа$ $0<\alpha <1$

Базовое (простое) экспоненциальное сглаживание

Использование экспоненциальной оконной функции впервые приписывают Пуассону ^[2] как расширение метода численного анализа 17-го века, а затем было принято сообществом по обработке сигналов в 1940-х годах. Здесь экспоненциальное сглаживание — это применение экспоненциальной, или пуассоновской, оконной функции . Экспоненциальное сглаживание было впервые предложено в статистической литературе без ссылки на предыдущую работу Роберта Гуделла Брауна в 1956 году ^[3] , а затем расширено Чарльзом К. Холтом в 1957 году . ^[4] Обычно используемая ниже формула: приписано Брауну и известно как «простое экспоненциальное сглаживание Брауна». ^[5] Все методы Холта, Уинтерса и Брауна можно рассматривать как простое применение рекурсивной фильтрации, впервые обнаруженной в 1940-х годах ^[2] для преобразования фильтров с конечной импульсной характеристикой (FIR) в фильтры с бесконечной импульсной характеристикой .

Простейший вид экспоненциального сглаживания задается формулой:

s_{t}=\alpha x_{t}+(1-\alpha)s_{t-1}=s_{t-1}+\alpha (x_{t}-s_{t-1}) .

где коэффициент сглаживания , и . Другими словами, сглаженная статистика представляет собой простое средневзвешенное значение текущего наблюдения и предыдущей сглаженной статистики . Простое экспоненциальное сглаживание легко применяется и дает сглаженную статистику, как только становятся доступны два наблюдения. Используемый здесь термин « коэффициент сглаживания» является своего рода неправильным употреблением, поскольку более высокие значения фактически уменьшают уровень сглаживания, а в предельном случае с = 1 выходной ряд представляет собой просто текущее наблюдение. Значения, близкие к единице, имеют меньший эффект сглаживания и придают больший вес недавним изменениям в данных, тогда как значения, близкие к нулю, имеют больший эффект сглаживания и менее чувствительны к недавним изменениям. $\альфа$ $0\leq \alpha \leq 1$ $s_{t}$ $x_{t}$ $s_{t-1}$ $\альфа$ $\альфа$ $\альфа$ $\альфа$ $\альфа$

Формально корректной процедуры выбора не существует . Иногда для выбора подходящего фактора используется суждение статистика. В качестве альтернативы можно использовать статистический метод для оптимизации значения . Например, метод наименьших квадратов можно использовать для определения значения, при котором сумма величин минимизируется. ^[6] $\альфа$ $\альфа$ $\альфа$ $(s_{t}-x_{t+1})^{2}$

В отличие от некоторых других методов сглаживания, таких как простое скользящее среднее, этот метод не требует выполнения минимального количества наблюдений, прежде чем он начнет давать результаты. Однако на практике «хорошее среднее значение» не будет достигнуто до тех пор, пока не будут усреднены несколько образцов; например, постоянному сигналу потребуется примерно несколько этапов, чтобы достичь 95% фактического значения. Чтобы точно восстановить исходный сигнал без потери информации, также должны быть доступны все этапы экспоненциального скользящего среднего, поскольку вес более старых выборок уменьшается экспоненциально. В этом отличие от простого скользящего среднего, в котором некоторые выборки можно пропустить без особой потери информации из-за постоянного взвешивания выборок в пределах среднего. Если известное количество выборок будет пропущено, можно также скорректировать средневзвешенное значение, придав равный вес новой выборке и всем тем, которые следует пропустить. $3/\альфа$

Эта простая форма экспоненциального сглаживания также известна как экспоненциально взвешенное скользящее среднее (EWMA). Технически ее также можно классифицировать как модель авторегрессионного интегрированного скользящего среднего (ARIMA) (0,1,1) без постоянного члена. ^[7]

Постоянная времени

Постоянная времени экспоненциального скользящего среднего — это количество времени, за которое сглаженная реакция единичной ступенчатой функции достигает исходного сигнала. Связь между этой постоянной времени и коэффициентом сглаживания определяется формулой: $1-1/e\около 63,2\,\%$ $\тау$ $\альфа$

\alpha =1-e^{-\Delta T/\tau }

, таким образом

\tau =- {\frac {\Delta T}{\ln(1-\alpha)}}

где – интервал времени дискретизации реализации дискретного времени. Если время выборки меньше, чем постоянная времени ( ), тогда $\Delta T$ $\Delta T\ll \tau$

\alpha \approx {\frac {\Delta T}{\tau }}

Выбор начального сглаженного значения

Обратите внимание, что в приведенном выше определении инициализируется значением . Поскольку экспоненциальное сглаживание требует, чтобы на каждом этапе у нас был предыдущий прогноз, неясно, как запустить этот метод. Мы могли бы предположить, что первоначальный прогноз равен начальному значению спроса; однако этот подход имеет серьезный недостаток. Экспоненциальное сглаживание придает существенный вес прошлым наблюдениям, поэтому начальное значение спроса будет иметь неоправданно большое влияние на ранние прогнозы. Эту проблему можно решить, позволив процессу развиваться в течение разумного количества периодов (10 или более) и используя среднее значение спроса в течение этих периодов в качестве первоначального прогноза. Существует множество других способов установки этого начального значения, но важно отметить, что чем меньше значение , тем более чувствительным будет ваш прогноз к выбору этого начального более сглаженного значения . ^[8]^[9] $s_{0}$ $x_{0}$ $\альфа$ $s_{0}$

Оптимизация

Для каждого метода экспоненциального сглаживания нам также необходимо выбрать значение параметров сглаживания. Для простого экспоненциального сглаживания существует только один параметр сглаживания ( α ), но для последующих методов обычно имеется более одного параметра сглаживания.

Бывают случаи, когда параметры сглаживания могут выбираться субъективно – прогнозист указывает значение параметров сглаживания на основе предыдущего опыта. Однако более надежный и объективный способ получить значения неизвестных параметров, включенных в любой метод экспоненциального сглаживания, — это оценить их на основе наблюдаемых данных.

Неизвестные параметры и начальные значения для любого метода экспоненциального сглаживания можно оценить путем минимизации суммы квадратов ошибок (SSE). Ошибки указаны как для (ошибки прогноза в пределах выборки на один шаг вперед). Отсюда находим значения неизвестных параметров и начальные значения, минимизирующие $e_{t}=y_{t}-{\hat {y}}_{t\mid t-1}$ ${\ displaystyle t = 1, \ ldots, T}$

{\text{SSE}}=\sum _{t=1}^{T}(y_{t}-{\hat {y}}_{t\mid t-1})^{2} =\sum _{t=1}^{T}e_{t}^{2}

^[10]

В отличие от случая регрессии (где у нас есть формулы для непосредственного расчета коэффициентов регрессии, минимизирующих SSE), здесь возникает задача нелинейной минимизации, и для ее выполнения нам необходимо использовать инструмент оптимизации .

«Экспоненциальное» именование

Название «экспоненциальное сглаживание» связано с использованием экспоненциальной оконной функции во время свертки. Его больше не приписывают Холту, Уинтерсу и Брауну.

Непосредственной заменой определяющего уравнения простого экспоненциального сглаживания обратно в себя мы находим, что

{\begin{aligned}s_{t}&=\alpha x_{t}+(1-\alpha )s_{t-1}\\[3pt]&=\alpha x_{t}+\alpha (1-\alpha )x_{t-1}+(1-\alpha )^{2}s_{t-2}\\[3pt]&=\alpha \left[x_{t}+(1-\ альфа )x_{t-1}+(1-\alpha )^{2}x_{t-2}+(1-\alpha )^{3}x_{t-3}+\cdots +(1-\ альфа )^{t-1}x_{1}\right]+(1-\alpha )^{t}x_{0}.\end{aligned}}

Другими словами, с течением времени сглаженная статистика становится средневзвешенным значением все большего и большего числа прошлых наблюдений , а веса, присвоенные предыдущим наблюдениям, пропорциональны членам геометрической прогрессии. $s_{t}$ $s_{t-1},\ldots,s_{tn},\ldots$

1,(1-\alpha),(1-\alpha)^{2},\ldots,(1-\alpha)^{n},\ldots

Геометрическая прогрессия — это дискретная версия экспоненциальной функции , поэтому, согласно знаниям статистики , отсюда и произошло название этого метода сглаживания .

Сравнение со скользящей средней

Экспоненциальное сглаживание и скользящее среднее имеют схожие недостатки, заключающиеся в внесении задержки относительно входных данных. Хотя это можно исправить, сдвинув результат на половину длины окна для симметричного ядра, такого как скользящее среднее или гауссово, неясно, насколько это подходит для экспоненциального сглаживания. Оба они также имеют примерно одинаковое распределение ошибки прогноза при α = 2/( k + 1). Они отличаются тем, что экспоненциальное сглаживание учитывает все прошлые данные, тогда как скользящее среднее учитывает только k точек прошлых данных. С вычислительной точки зрения они также отличаются тем, что скользящее среднее требует сохранения k прошлых точек данных или точки данных с задержкой k + 1 плюс самое последнее прогнозируемое значение, тогда как для экспоненциального сглаживания требуется только самое последнее прогнозируемое значение. сохранился. ^[11]

В литературе по обработке сигналов использование непричинных (симметричных) фильтров является обычным явлением, и экспоненциальная оконная функция широко используется таким образом, но используется другая терминология: экспоненциальное сглаживание эквивалентно бесконечно-импульсному первому порядку. фильтр отклика (БИХ) и скользящее среднее эквивалентны фильтру с конечной импульсной характеристикой с равными весовыми коэффициентами.

Двойное экспоненциальное сглаживание (линейное по Холту)

Простое экспоненциальное сглаживание неэффективно, когда в данных наблюдается тенденция . ^[1] В таких ситуациях было разработано несколько методов под названием «двойное экспоненциальное сглаживание» или «экспоненциальное сглаживание второго порядка», которое представляет собой рекурсивное применение экспоненциального фильтра дважды, поэтому его называют «двойным экспоненциальным сглаживанием». Эта номенклатура аналогична четырехкратному экспоненциальному сглаживанию, которое также указывает на глубину рекурсии. ^[12] Основная идея двойного экспоненциального сглаживания заключается во введении термина, учитывающего возможность того, что ряд демонстрирует некоторую форму тренда. Этот компонент наклона сам обновляется посредством экспоненциального сглаживания.

Один метод работает следующим образом: ^[13]

Опять же, последовательность необработанных данных наблюдений представлена как , начиная с момента времени . Мы используем для представления сглаженного значения времени и являемся нашей лучшей оценкой тренда во времени . Выходные данные алгоритма теперь записываются как оценка значения at time на основе необработанных данных до момента времени . Двойное экспоненциальное сглаживание задается формулами $x_{t}$ $т=0$ $s_{t}$ $т$ $b_{t}$ $т$ $F_{t+m}$ $x_{t+m}$ $m>0$ $t$

{\begin{aligned}s_{0}&=x_{0}\\b_{0}&=x_{1}-x_{0}\\\end{aligned}}

И для $t>0$

{\begin{aligned}s_{t}&=\alpha x_{t}+(1-\alpha )(s_{t-1}+b_{t-1})\\b_{t}&=\beta (s_{t}-s_{t-1})+(1-\beta )b_{t-1}\\\end{aligned}}

где ( ) – коэффициент сглаживания данных , а ( ) – коэффициент сглаживания тренда . $\alpha$ $0\leq \alpha \leq 1$ $\beta$ $0\leq \beta \leq 1$

Прогноз за пределами дается приближением: $x_{t}$

F_{t+m}=s_{t}+m\cdot b_{t}

Установка начального значения является вопросом предпочтений. Вариант, отличный от перечисленного выше, подходит для некоторых . $b$ ${\textstyle {\frac {x_{n}-x_{0}}{n}}}$ $n$

Обратите внимание, что F ₀ не определено (нет оценки для времени 0), и согласно определению F ₁ = s ₀ + b ₀ , которое четко определено, таким образом, можно оценить дальнейшие значения.

Второй метод, называемый либо линейным экспоненциальным сглаживанием Брауна (LES), либо двойным экспоненциальным сглаживанием Брауна, работает следующим образом. ^[14]

{\begin{aligned}s'_{0}&=x_{0}\\s''_{0}&=x_{0}\\s'_{t}&=\alpha x_{t}+(1-\alpha )s'_{t-1}\\s''_{t}&=\alpha s'_{t}+(1-\alpha )s''_{t-1}\\F_{t+m}&=a_{t}+mb_{t},\end{aligned}}

где a _t — предполагаемый уровень в момент времени t и b _t — предполагаемая тенденция в момент времени t :

{\begin{aligned}a_{t}&=2s'_{t}-s''_{t}\\[5pt]b_{t}&={\frac {\alpha }{1-\alpha }}(s'_{t}-s''_{t}).\end{aligned}}

Тройное экспоненциальное сглаживание (Холт Винтерс)

Тройное экспоненциальное сглаживание применяет экспоненциальное сглаживание три раза, что обычно используется, когда из исследуемого временного ряда необходимо удалить три высокочастотных сигнала. Существуют разные типы сезонности: «мультипликативная» и «аддитивная» по своей природе, подобно тому, как сложение и умножение являются основными операциями в математике.

Если каждый месяц в декабре мы продаем на 10 000 квартир больше, чем в ноябре, сезонность носит аддитивный характер. Однако если в летние месяцы мы продаем на 10% больше квартир, чем в зимние, то сезонность носит мультипликативный характер. Мультипликативную сезонность можно представить как постоянный коэффициент, а не абсолютную величину. ^[15]

Тройное экспоненциальное сглаживание было впервые предложено учеником Холта Питером Уинтерсом в 1960 году после прочтения книги 1940-х годов по обработке сигналов, посвященной экспоненциальному сглаживанию. ^[16] Новая идея Холта заключалась в том, чтобы повторить фильтрацию нечетное число раз больше 1 и меньше 5, что было популярно среди ученых предыдущих эпох. ^[16] Хотя рекурсивная фильтрация использовалась и раньше, она применялась дважды и четыре раза, чтобы совпасть с гипотезой Адамара , в то время как тройное применение требовало более чем удвоенного количества операций сингулярной свертки. Использование тройного применения считается эмпирическим методом, а не основанным на теоретических основах, и практики часто переоценивают его. - Предположим, мы имеем последовательность наблюдений , начинающуюся во времени с цикла сезонного изменения длины . $x_{t},$ $t=0$ $L$

Метод вычисляет линию тренда для данных, а также сезонные индексы, которые взвешивают значения в линии тренда в зависимости от того, где этот момент времени попадает в цикл продолжительности . $L$

Пусть представляет собой сглаженное значение постоянной части для времени , представляет собой последовательность лучших оценок линейного тренда, наложенных на сезонные изменения, и представляет собой последовательность сезонных поправочных коэффициентов. Мы хотим оценить каждый раз mod в цикле, в котором происходят наблюдения. Как правило, для инициализации набора сезонных факторов требуется как минимум два полных сезона (или периода) исторических данных. $s_{t}$ $t$ $b_{t}$ $c_{t}$ $c_{t}$ $t$ $L$ $2L$

Выходные данные алгоритма снова записываются как оценка значения at time на основе необработанных данных до момента time . Тройное экспоненциальное сглаживание с мультипликативной сезонностью задается формулами ^[1] $F_{t+m}$ $x_{t+m}$ $t+m>0$ $t$

{\begin{aligned}s_{0}&=x_{0}\\[5pt]s_{t}&=\alpha {\frac {x_{t}}{c_{t-L}}}+(1-\alpha )(s_{t-1}+b_{t-1})\\[5pt]b_{t}&=\beta (s_{t}-s_{t-1})+(1-\beta )b_{t-1}\\[5pt]c_{t}&=\gamma {\frac {x_{t}}{s_{t}}}+(1-\gamma )c_{t-L}\\[5pt]F_{t+m}&=(s_{t}+mb_{t})c_{t-L+1+(m-1){\bmod {L}}},\end{aligned}}

где ( ) – коэффициент сглаживания данных , ( ) – коэффициент сглаживания тренда , и ( ) – коэффициент сглаживания сезонных изменений . $\alpha$ $0\leq \alpha \leq 1$ $\beta$ $0\leq \beta \leq 1$ $\gamma$ $0\leq \gamma \leq 1$

Общая формула для первоначальной оценки тренда : $b$

{\begin{aligned}b_{0}&={\frac {1}{L}}\left({\frac {x_{L+1}-x_{1}}{L}}+{\frac {x_{L+2}-x_{2}}{L}}+\cdots +{\frac {x_{L+L}-x_{L}}{L}}\right)\end{aligned}}

Установление первоначальных оценок сезонных индексов является немного более сложным. Если в ваших данных присутствует количество полных циклов, то: $c_{i}$ $i=1,2,\ldots ,L$ $N$

c_{i}={\frac {1}{N}}\sum _{j=1}^{N}{\frac {x_{L(j-1)+i}}{A_{j}}}\quad {\text{for }}i=1,2,\ldots ,L

где

A_{j}={\frac {\sum _{i=1}^{L}x_{L(j-1)+i}}{L}}\quad {\text{for }}j=1,2,\ldots ,N

Обратите внимание, что это среднее значение за цикл ваших данных. $A_{j}$ $x$ $j^{\text{th}}$

Тройное экспоненциальное сглаживание с аддитивной сезонностью определяется следующим образом:

{\begin{aligned}s_{0}&=x_{0}\\s_{t}&=\alpha (x_{t}-c_{t-L})+(1-\alpha )(s_{t-1}+b_{t-1})\\b_{t}&=\beta (s_{t}-s_{t-1})+(1-\beta )b_{t-1}\\c_{t}&=\gamma (x_{t}-s_{t-1}-b_{t-1})+(1-\gamma )c_{t-L}\\F_{t+m}&=s_{t}+mb_{t}+c_{t-L+1+(m-1){\bmod {L}}},\end{aligned}}

Реализации в пакетах статистики

R : функция HoltWinters в пакете статистики ^[17] и функция ets в пакете прогноза ^[18] (более полная реализация, обычно приводящая к лучшей производительности ^[19] ).
Python : модуль holtwinters пакета statsmodels позволяет выполнять простое, двойное и тройное экспоненциальное сглаживание.
IBM SPSS включает простой, простой сезонный, линейный тренд Холта, линейный тренд Брауна, затухающий тренд, добавку Уинтерса и мультипликатив Уинтерса в процедуру моделирования временных рядов в своих статистических пакетах Статистика и Modeler. Функция Expert Modeler по умолчанию оценивает все семь моделей экспоненциального сглаживания и модели ARIMA с диапазоном несезонных и сезонных значений p , d и q и выбирает модель с наименьшим показателем байесовского информационного критерия .
Стата : команда tssmooth ^[20]
ЛибреОфис 5.2 ^[21]
Microsoft Excel 2016 ^[22]

Смотрите также

Примечания

^ abc «Электронный справочник NIST/SEMATECH по статистическим методам». НИСТ . Проверено 23 мая 2010 г.
^ ab Оппенгейм, Алан В.; Шафер, Рональд В. (1975). Цифровая обработка сигналов . Прентис Холл . п. 5. ISBN 0-13-214635-5.
^ Браун, Роберт Г. (1956). Экспоненциальное сглаживание для прогнозирования спроса. Кембридж, Массачусетс: Arthur D. Little Inc., с. 15.
^ Холт, Чарльз К. (1957). «Прогнозирование тенденций и сезонности с помощью экспоненциально взвешенных средних значений». Меморандум Управления военно-морских исследований . 52 .переиздано Холтом, Чарльзом К. (январь – март 2004 г.). «Прогнозирование тенденций и сезонности с помощью экспоненциально взвешенных средних значений». Международный журнал прогнозирования . 20 (1): 5–10. doi :10.1016/j.ijforecast.2003.09.015.
^ Браун, Роберт Гуделл (1963). Сглаживание прогнозирования и предсказание дискретных временных рядов. Энглвуд Клиффс, Нью-Джерси: Прентис-Холл.
^ «Электронный справочник NIST/SEMATECH по статистическим методам, 6.4.3.1. Одиночное экспоненциальное сглаживание» . НИСТ . Проверено 5 июля 2017 г.
^ Нау, Роберт. «Модели усреднения и экспоненциального сглаживания» . Проверено 26 июля 2010 г.
^ «Анализ производства и операций» Намиас. 2009.
^ Чисар П. и Чисар С.М. (2011). «Методы оптимизации статистики EWMA». Acta Polytechnica Hungarica , 8 (5), 73–87. Страница 78.
^ 7.1 Простое экспоненциальное сглаживание | Прогнозирование: принципы и практика.
↑ Намиас, Стивен (3 марта 2008 г.). Анализ производства и операций (6-е изд.). ISBN 978-0-07-337785-8.^{[ нужна страница ]}
^ «Модель: экспоненциальное сглаживание второго порядка». SAP AG . Проверено 23 января 2013 г.
^ «6.4.3.3. Двойное экспоненциальное сглаживание». itl.nist.gov . Проверено 25 сентября 2011 г.
^ «Модели усреднения и экспоненциального сглаживания». герцог.edu . Проверено 25 сентября 2011 г.
^ Калехар, Праджакта С. «Прогнозирование временных рядов с использованием экспоненциального сглаживания Холта – Уинтерса» (PDF) . Проверено 23 июня 2014 г.
^ аб Уинтерс, PR (апрель 1960 г.). «Прогнозирование продаж с помощью экспоненциально взвешенных скользящих средних». Наука управления . 6 (3): 324–342. дои : 10.1287/mnsc.6.3.324.
^ "R: Фильтрация Холта-Уинтерса" . stat.ethz.ch. _ Проверено 5 июня 2016 г.
^ "ets {forecast} | Inside-R | Сайт сообщества R" . внутри-r.org . Архивировано из оригинала 16 июля 2016 года . Проверено 5 июня 2016 г.
^ «Сравнение HoltWinters() и ets()». Взгляд на будущее . 29 мая 2011 года . Проверено 5 июня 2016 г.
^ tssmooth в руководстве Stata
^ «LibreOffice 5.2: Примечания к выпуску - Wiki Document Foundation» .
^ «Функции прогнозирования Excel 2016 | Реальная статистика с использованием Excel» .

Внешние ссылки

Конспект лекций по экспоненциальному сглаживанию (Роберт Нау, Университет Дьюка)
Сглаживание данных, Джон МакЛун, Демонстрационный проект Wolfram
Подход Холта-Уинтерса к экспоненциальному сглаживанию: 50 лет и набирает силу Пол Гудвин (2010) Форсайт: Международный журнал прикладного прогнозирования
Алгоритмы для неравномерно распределенных временных рядов: скользящие средние и другие скользящие операторы Андреаса Экнера