В статистике, эконометрике и обработке сигналов модель авторегрессии ( AR ) является представлением типа случайного процесса; как таковая, она может использоваться для описания определенных изменяющихся во времени процессов в природе, экономике, поведении и т. д. Модель авторегрессии определяет, что выходная переменная линейно зависит от своих собственных предыдущих значений и от стохастического члена (несовершенно предсказуемого члена); таким образом, модель имеет форму стохастического разностного уравнения (или рекуррентного соотношения), которое не следует путать с дифференциальным уравнением . Вместе с моделью скользящего среднего (MA) она является особым случаем и ключевым компонентом более общих моделей авторегрессии–скользящего среднего (ARMA) и авторегрессии интегрированного скользящего среднего (ARIMA) временных рядов, которые имеют более сложную стохастическую структуру; она также является особым случаем векторной модели авторегрессии (VAR), которая состоит из системы из более чем одного взаимосвязанного стохастического разностного уравнения в более чем одной развивающейся случайной величине.
В отличие от модели скользящего среднего (MA), модель авторегрессии не всегда стационарна, поскольку может содержать единичный корень.
Большие языковые модели называются авторегрессионными, но они не являются классической авторегрессионной моделью в этом смысле, поскольку они нелинейны.
Определение
Обозначение указывает на авторегрессионную модель порядка p . Модель AR( p ) определяется как
так что, перенеся член суммы в левую сторону и используя полиномиальную запись , мы имеем
Таким образом, авторегрессионную модель можно рассматривать как выходной сигнал фильтра с бесконечной импульсной характеристикой , входным сигналом которого является белый шум.
Некоторые ограничения параметров необходимы для того, чтобы модель оставалась стационарной в слабом смысле . Например, процессы в модели AR(1) с не являются стационарными. В более общем смысле, для того, чтобы модель AR( p ) была стационарной в слабом смысле, корни многочлена должны лежать вне единичной окружности , т. е. каждый (комплексный) корень должен удовлетворять (см. страницы 89,92 [3] ).
Межвременной эффект шоков
В процессе AR одноразовый шок влияет на значения эволюционирующей переменной бесконечно далеко в будущем. Например, рассмотрим модель AR(1) . Ненулевое значение для, скажем, в момент времени t =1 влияет на величину . Тогда по уравнению AR для в терминах , это влияет на величину . Тогда по уравнению AR для в терминах , это влияет на величину . Продолжение этого процесса показывает, что эффект никогда не заканчивается, хотя если процесс стационарен , то эффект уменьшается до нуля в пределе.
Поскольку каждый шок влияет на значения X бесконечно далеко в будущем от момента их возникновения, любое заданное значение X t подвержено влиянию шоков, происходящих бесконечно далеко в прошлом. Это также можно увидеть, переписав авторегрессию
(где постоянный член был подавлен путем предположения, что переменная измерялась как отклонения от ее среднего значения) как
При выполнении деления полиномов в правой части полином в операторе обратного сдвига, применяемом к , имеет бесконечный порядок, то есть в правой части уравнения появляется бесконечное число запаздывающих значений .
где B — оператор обратного сдвига , где — функция, определяющая авторегрессию, а где — коэффициенты в авторегрессии. Формула верна только в том случае, если все корни имеют кратность 1. [ необходима цитата ]
Автокорреляционная функция процесса AR( p ) представляет собой сумму затухающих экспонент.
Каждый действительный корень вносит компонент в функцию автокорреляции, который убывает экспоненциально.
Аналогично, каждая пара комплексно-сопряженных корней вносит вклад в экспоненциально затухающие колебания.
Графики AR(п) процессы
Простейшим процессом AR является AR(0), в котором нет зависимости между членами. Только член ошибки/инновации/шума вносит вклад в выход процесса, поэтому на рисунке AR(0) соответствует белому шуму.
Для процесса AR(1) с положительным только предыдущий член в процессе и шумовой член вносят вклад в выход. Если близко к 0, то процесс по-прежнему выглядит как белый шум, но по мере приближения к 1 выход получает больший вклад от предыдущего члена относительно шума. Это приводит к «сглаживанию» или интеграции выходного сигнала, аналогично фильтру нижних частот .
Для процесса AR(2) предыдущие два члена и шумовой член вносят вклад в выход. Если оба и положительны, выход будет напоминать фильтр нижних частот, при этом высокочастотная часть шума уменьшена. Если положительно, а отрицательно, то процесс благоприятствует изменению знака между членами процесса. Выход колеблется. Это можно сравнить с обнаружением края или обнаружением изменения направления.
Пример: процесс AR(1)
Процесс AR(1) задается как: где — процесс белого шума с нулевым средним значением и постоянной дисперсией . (Примечание: нижний индекс был опущен.) Процесс является стационарным в слабом смысле , если , поскольку он получен как выход стабильного фильтра, входом которого является белый шум. (Если , то дисперсия зависит от временного лага t, так что дисперсия ряда расходится к бесконечности, когда t стремится к бесконечности, и, следовательно, не является стационарным в слабом смысле.) Предполагая , что среднее значение одинаково для всех значений t по самому определению стационарности в слабом смысле. Если среднее значение обозначается как , то из этого следует , и, следовательно,
Дисперсия равна
где — стандартное отклонение . Это можно показать, заметив, что
и затем замечаем, что указанная выше величина является устойчивой неподвижной точкой этого отношения.
Автоковариация определяется как
Видно, что автоковариационная функция затухает со временем затухания (также называемым постоянной времени ) . [4]
Спектральная плотность функции — это преобразование Фурье автоковариационной функции. В дискретных терминах это будет дискретно-временное преобразование Фурье:
Это выражение является периодическим из-за дискретной природы , что проявляется как косинусный член в знаменателе. Если мы предположим, что время выборки ( ) намного меньше времени затухания ( ), то мы можем использовать континуальное приближение для :
где — угловая частота, связанная со временем затухания .
Альтернативное выражение для можно получить, сначала подставив в определяющее уравнение. Продолжая этот процесс N раз, получаем
При N, стремящемся к бесконечности, будет стремиться к нулю и:
Видно, что — это белый шум, свернутый с ядром плюс постоянное среднее значение. Если белый шум — это гауссовский процесс , то — также гауссовский процесс. В других случаях центральная предельная теорема указывает, что будет приблизительно нормально распределен, когда близок к единице.
Для процесс будет геометрической прогрессией ( экспоненциальный рост или затухание). В этом случае решение можно найти аналитически: где — неизвестная константа ( начальное условие ).
Явная форма среднего/разности процесса AR(1)
Модель AR(1) является дискретно-временным аналогом непрерывного процесса Орнштейна-Уленбека . Поэтому иногда полезно понимать свойства модели AR(1), представленной в эквивалентной форме. В этой форме модель AR(1) с параметром процесса задается как
, где , — среднее значение модели, а — процесс белого шума с нулевым средним значением и постоянной дисперсией .
Переписав это как и затем выведя (по индукции) , можно показать, что
и
.
Выбор максимального лага
Частичная автокорреляция процесса AR(p) равна нулю при лагах, больших, чем p, поэтому соответствующим максимальным лагом p является тот, после которого все частичные автокорреляции равны нулю.
Он основан на параметрах , где i = 1, ..., p . Существует прямое соответствие между этими параметрами и функцией ковариации процесса, и это соответствие может быть инвертировано для определения параметров из функции автокорреляции (которая сама получается из ковариаций). Это делается с помощью уравнений Юла–Уокера.
Уравнения Юла–Уокера
Уравнения Юла–Уокера, названные в честь Удни Юла и Гилберта Уокера , [5] [6] представляют собой следующий набор уравнений. [7]
где m = 0, …, p , что дает p + 1 уравнений. Здесь — автоковариационная функция X t , — стандартное отклонение входного шумового процесса, — дельта-функция Кронекера .
Поскольку последняя часть отдельного уравнения не равна нулю только при m = 0 , систему уравнений можно решить, представив уравнения для m > 0 в матричной форме, получив таким образом уравнение
которое можно решить для всех Оставшееся уравнение для m = 0 имеет вид
которые, как только они известны, могут быть решены для
Альтернативная формулировка в терминах функции автокорреляции . Параметры AR определяются первыми p +1 элементами функции автокорреляции. Затем полная функция автокорреляции может быть получена путем рекурсивного вычисления [8]
Примеры некоторых низкоуровневых AR( p ) процессов
р =1
Следовательно
р =2
Уравнения Юла–Уокера для процесса AR(2) имеют вид
Помните, что
Используя первое уравнение, получаем
Использование формулы рекурсии дает
Оценка параметров АР
Приведенные выше уравнения (уравнения Юла–Уокера) предоставляют несколько путей оценки параметров модели AR( p ) путем замены теоретических ковариаций оценочными значениями. [9] Некоторые из этих вариантов можно описать следующим образом:
Оценка автоковариаций или автокорреляций. Здесь каждый из этих членов оценивается отдельно, с использованием обычных оценок. Существуют различные способы сделать это, и выбор между ними влияет на свойства схемы оценки. Например, отрицательные оценки дисперсии могут быть получены некоторыми выборами.
Формулировка как задача регрессии наименьших квадратов , в которой строится обычная задача прогнозирования наименьших квадратов, основанная на прогнозировании значений X t на предыдущих значениях p того же ряда. Это можно рассматривать как схему прямого прогнозирования. Нормальные уравнения для этой задачи можно рассматривать как соответствующие приближению матричной формы уравнений Юла–Уокера, в которых каждое появление автоковариации того же лага заменяется немного другой оценкой.
Формулировка как расширенная форма обычной задачи прогнозирования наименьших квадратов. Здесь два набора уравнений прогнозирования объединены в одну схему оценки и один набор нормальных уравнений. Один набор — это набор уравнений прямого прогнозирования, а другой — соответствующий набор уравнений обратного прогнозирования, относящийся к обратному представлению модели AR:
Здесь предсказанные значения X t будут основаны на будущих значениях p того же ряда. [ необходимо разъяснение ] Этот способ оценки параметров AR принадлежит Джону Паркеру Бергу [10] и называется методом Берга: [11] Берг и более поздние авторы называли эти конкретные оценки «оценками максимальной энтропии», [12] но рассуждения, лежащие в основе этого, применимы к использованию любого набора оцененных параметров AR. По сравнению со схемой оценки, использующей только уравнения прямого прогнозирования, производятся другие оценки автоковариаций, и оценки имеют другие свойства стабильности. Оценки Берга особенно связаны с оценкой максимальной энтропии спектра . [13]
Другие возможные подходы к оценке включают оценку максимального правдоподобия . Доступны два различных варианта максимального правдоподобия: в одном (в целом эквивалентном схеме наименьших квадратов прямого прогнозирования) рассматриваемая функция правдоподобия соответствует условному распределению более поздних значений в ряду при заданных начальных значениях p в ряду; во втором рассматриваемая функция правдоподобия соответствует безусловному совместному распределению всех значений в наблюдаемом ряду. Существенные различия в результатах этих подходов могут возникать, если наблюдаемый ряд короткий или если процесс близок к нестационарности.
Спектр
Спектральная плотность мощности (СПМ) процесса AR( p ) с дисперсией шума равна [8]
АР(0)
Для белого шума (AR(0))
АР(1)
Для АР(1)
Если есть один спектральный пик в , часто называемый красным шумом . По мере приближения к 1, на низких частотах наблюдается более сильная мощность, т.е. большие временные задержки. Это фильтр нижних частот, при применении к полному спектру света все, кроме красного света, будет отфильтровано.
Если есть минимум в , часто называемый синим шумом . Это также действует как фильтр верхних частот, все, кроме синего света, будет отфильтровано.
Отсюда следует, что полюсами являются значения z, удовлетворяющие:
,
что дает:
.
и являются обратными величинами характеристических корней, а также собственными значениями матрицы временного обновления:
Процессы AR(2) можно разделить на три группы в зависимости от характеристик их корней/полюсов:
При , процесс имеет пару комплексно-сопряженных полюсов, создавая пик средней частоты при:
с шириной полосы пропускания около пика, обратно пропорциональной модулям полюсов:
Все члены, включающие квадратные корни, являются действительными в случае комплексных полюсов, поскольку они существуют только тогда, когда .
В противном случае процесс имеет реальные корни, и:
Когда он действует как фильтр нижних частот на белом шуме со спектральным пиком в
Когда он действует как фильтр верхних частот для белого шума со спектральным пиком при .
Процесс нестационарен, когда полюса находятся на единичной окружности или вне ее, или, что эквивалентно, когда характеристические корни находятся на единичной окружности или внутри нее. Процесс устойчив, когда полюса находятся строго внутри единичной окружности (корни строго вне единичной окружности), или, что эквивалентно, когда коэффициенты находятся в треугольнике .
Полную функцию PSD можно выразить в вещественной форме следующим образом:
Реализации в статистических пакетах
R – пакет stats включает функцию ar ; [14] пакет astsa включает функцию sarima для соответствия различным моделям, включая AR. [15]
MATLAB – Econometrics Toolbox [16] и System Identification Toolbox [17] включают в себя модели дополненной реальности. [18]
MATLAB и Octave – набор инструментов TSA содержит несколько функций оценки для одномерных, многомерных и адаптивных моделей дополненной реальности. [19]
PyMC 3 — фреймворк байесовской статистики и вероятностного программирования, поддерживающий режимы AR с задержками p .
bayesloop – поддерживает вывод параметров и выбор модели для процесса AR-1 с параметрами, изменяющимися во времени. [20]
Python – statsmodels.org размещает модель дополненной реальности. [21]
Импульсный ответ
Импульсный отклик системы — это изменение эволюционирующей переменной в ответ на изменение значения шокового термина k периодов ранее, как функция k . Поскольку модель AR является частным случаем векторной авторегрессионной модели, здесь применяется вычисление импульсного отклика в векторной авторегрессии#импульсный отклик .
н- прогнозирование на шаг вперед
После того, как параметры авторегрессии
были оценены, авторегрессия может быть использована для прогнозирования произвольного количества периодов в будущем. Сначала используйте t для обозначения первого периода, для которого данные еще не доступны; подставьте известные предыдущие значения X t-i для i = 1, ..., p в уравнение авторегрессии, при этом установив погрешность, равную нулю (потому что мы прогнозируем X t как равную его ожидаемому значению, а ожидаемое значение ненаблюдаемого погрешного члена равно нулю). Выход уравнения авторегрессии является прогнозом для первого ненаблюдаемого периода. Затем используйте t для обозначения следующего периода, для которого данные еще не доступны; снова уравнение авторегрессии используется для составления прогноза, с одним отличием: значение X за один период до прогнозируемого в данный момент периода неизвестно, поэтому вместо него используется его ожидаемое значение — предсказанное значение, полученное на предыдущем этапе прогнозирования. Затем для будущих периодов используется та же процедура, каждый раз используя еще одно прогнозируемое значение в правой части прогностического уравнения до тех пор, пока после p прогнозов все p значений в правой части не станут прогнозируемыми значениями из предыдущих шагов.
Существует четыре источника неопределенности в отношении прогнозов, полученных таким образом: (1) неопределенность относительно того, является ли модель авторегрессии правильной моделью; (2) неопределенность относительно точности прогнозируемых значений, которые используются в качестве запаздывающих значений в правой части уравнения авторегрессии; (3) неопределенность относительно истинных значений коэффициентов авторегрессии; и (4) неопределенность относительно значения погрешности для прогнозируемого периода. Каждый из последних трех может быть количественно определен и объединен, чтобы получить доверительный интервал для прогнозов на n шагов вперед; доверительный интервал будет становиться шире по мере увеличения n из-за использования все большего числа оценочных значений для переменных правой части.
^ Бокс, Джордж Э. П. (1994). Анализ временных рядов: прогнозирование и контроль. Гвилим М. Дженкинс, Грегори К. Рейнсел (3-е изд.). Энглвуд Клиффс, Нью-Джерси: Prentice Hall. стр. 54. ISBN 0-13-060774-6. OCLC 28888762.
^ Шамвей, Роберт Х. (2000). Анализ временных рядов и его применение. Дэвид С. Стоффер. Нью-Йорк: Springer. С. 90–91. ISBN0-387-98950-1. OCLC 42392178. Архивировано из оригинала 2023-04-16 . Получено 2022-09-03 .
^ Шамвей, Роберт Х.; Стоффер, Дэвид (2010). Анализ временных рядов и его применение: с примерами R (3-е изд.). Springer. ISBN978-1441978646.
^ Лай, Дихуэй; и Лу, Бинфэн; «Понимание модели авторегрессии для временных рядов как детерминированной динамической системы». Архивировано 24.03.2023 в Wayback Machine , в Predictive Analytics and Futurism , июнь 2017 г., номер 15, июнь 2017 г., страницы 7–9.
↑ Юл, Г. Удни (1927) «О методе исследования периодичности в возмущенных рядах с особым упором на числа солнечных пятен Вольфера». Архивировано 14 мая 2011 г. в Wayback Machine , Philosophical Transactions of the Royal Society of London , Ser. A, Vol. 226, 267–298.]
↑ Уокер, Гилберт (1931) «О периодичности в рядах связанных терминов». Архивировано 7 июня 2011 г. в Wayback Machine , Труды Лондонского королевского общества , Сер. A, том 131, 518–532.
^ ab Фон Шторх, Ганс; Цвирс, Фрэнсис В. (2001). Статистический анализ в климатических исследованиях . Cambridge University Press. doi :10.1017/CBO9780511612336. ISBN0-521-01230-9.[ нужна страница ]
^ Берг, Джон Паркер (1968); «Новый метод анализа данных временных рядов», в Modern Spectrum Analysis (под редакцией Д. Г. Чайлдерса), Институт перспективных исследований НАТО по обработке сигналов с упором на подводную акустику. IEEE Press, Нью-Йорк.
^ Броквелл, Питер Дж.; Дальхаус, Райнер; Триндаде, А. Александр (2005). «Модифицированные алгоритмы Бёрга для многомерной авторегрессии подмножеств» (PDF) . Statistica Sinica . 15 : 197–213. Архивировано из оригинала (PDF) 2012-10-21.
^ Берг, Джон Паркер (1967) «Спектральный анализ с максимальной энтропией», Труды 37-го заседания Общества геофизиков-разведчиков , Оклахома-Сити, Оклахома.
^ Bos, Robert; De Waele, Stijn; Broersen, Piet MT (2002). «Авторегрессионная спектральная оценка путем применения алгоритма Burg к нерегулярно выбранным данным». IEEE Transactions on Instrumentation and Measurement . 51 (6): 1289. Bibcode : 2002ITIM...51.1289B. doi : 10.1109/TIM.2002.808031. Архивировано из оригинала 2023-04-16 . Получено 2019-12-11 .
^ "Подгонка авторегрессионных моделей к временным рядам" Архивировано 28 января 2016 г. на Wayback Machine (на языке R)
^ Стоффер, Дэвид; Пойзон, Ники (2023-01-09). "astsa: Прикладной статистический анализ временных рядов" . Получено 20 августа 2023 г.
Миллс, Теренс К. (1990). Методы временных рядов для экономистов . Cambridge University Press. ISBN 9780521343398.
Персиваль, Дональд Б.; Уолден, Эндрю Т. (1993). Спектральный анализ для физических приложений . Cambridge University Press. Bibcode :1993sapa.book.....P.
Пандит, Судхакар М.; Ву, Шиен-Мин (1983). Временные ряды и системный анализ с приложениями . John Wiley & Sons.
Внешние ссылки
Авторегрессионный анализ (AR) Пола Бурка
Лекция по эконометрике (тема: Авторегрессионные модели) на YouTube от Марка Тома