Распределенная задержка

В статистике и эконометрике модель с распределенным лагом — это модель данных временных рядов , в которой уравнение регрессии используется для прогнозирования текущих значений зависимой переменной на основе как текущих значений объясняющей переменной , так и запаздывающих (прошлый период) значений эту объясняющую переменную. ^[1]^[2]

Отправной точкой для модели с распределенным лагом является предполагаемая структура вида

y_{t}=a+w_{0}x_{t}+w_{1}x_{t-1}+w_{2}x_{t-2}+...+{\text{error term}}

или форма

y_{t}=a+w_{0}x_{t}+w_{1}x_{t-1}+w_{2}x_{t-2}+...+w_{n}x_{t-n}+{\text{error term}},

где y _t — значение зависимой переменной y в период времени t , a — оцениваемый член, а w _i называется лаговым весом (также подлежащим оценке), приложенным к значению i периодов ранее независимой переменной. Икс . В первом уравнении предполагается, что на зависимую переменную влияют значения независимой переменной сколь угодно далеко в прошлом, поэтому количество весов запаздывания бесконечно, и модель называется моделью с бесконечным распределенным запаздыванием . В альтернативном втором уравнении имеется только конечное число весов лага, что указывает на предположение о том, что существует максимальный лаг, за пределами которого значения независимой переменной не влияют на зависимую переменную; модель, основанная на этом предположении, называется моделью с конечным распределенным лагом .

В модели с бесконечным распределенным лагом необходимо оценить бесконечное количество весов лагов; ясно, что это можно сделать только в том случае, если предположить некоторую структуру отношений между различными весами запаздывания, причем вся их бесконечность выражается через конечное число предполагаемых основных параметров. В модели с конечным распределенным запаздыванием параметры могут быть непосредственно оценены с помощью обычного метода наименьших квадратов (при условии, что количество точек данных значительно превышает количество весов запаздывания); тем не менее, такая оценка может дать очень неточные результаты из-за крайней мультиколлинеарности между различными лаговыми значениями независимой переменной, поэтому снова может оказаться необходимым предположить некоторую структуру связи между различными весами лага.

Концепция моделей с распределенным запаздыванием легко обобщается на контекст более чем одной объясняющей переменной в правой части.

Неструктурированная оценка

Самый простой способ оценить параметры, связанные с распределенными задержками, - это обычный метод наименьших квадратов , предполагающий фиксированное максимальное запаздывание , предполагающий независимо и одинаково распределенные ошибки и не налагающий никакой структуры на отношения коэффициентов запаздывающих объяснителей друг с другом. Однако часто возникает мультиколлинеарность среди отстающих объяснителей, что приводит к высокой дисперсии оценок коэффициентов. $p$

Структурированная оценка

Структурированные модели с распределенным лагом бывают двух типов: конечные и бесконечные. Бесконечные распределенные лаги позволяют значению независимой переменной в определенный момент времени влиять на зависимую переменную бесконечно далеко в будущем, или, другими словами, они позволяют значению независимой переменной влиять на текущее значение зависимой переменной. это произошло бесконечно давно; но после некоторого периода задержки эффект снижается до нуля. Конечные распределенные лаги позволяют независимой переменной в определенный момент времени влиять на зависимую переменную только в течение конечного числа периодов.

Конечные распределенные лаги

Наиболее важной структурированной моделью с конечным распределенным лагом является модель лага Алмона . ^[3] Эта модель позволяет данным определять форму лаговой конструкции, но исследователь должен указать максимальную длину лаги; неправильно указанная максимальная длина лага может исказить форму предполагаемой структуры лага, а также кумулятивный эффект независимой переменной. Лаг Алмона предполагает, что $k + 1$ лаговых весов связаны с $n + 1$ линейно оцениваемыми базовыми параметрами $(n < k) a j$ в соответствии с

w_{i}=\sum _{j=0}^{n}a_{j}i^{j}

для $i=0,\dots ,k.$

Бесконечные распределенные лаги

Наиболее распространенным типом структурированной модели бесконечного распределенного лага является геометрический лаг , также известный как лаг Койка . В этой лаговой структуре веса (величины влияния) значений запаздывающих независимых переменных уменьшаются экспоненциально с длиной лага; хотя форма лаговой структуры, таким образом, полностью зависит от выбора этого метода, скорость снижения, а также общая величина эффекта определяются данными. Спецификация уравнения регрессии очень проста: в качестве объяснителей (правых переменных в регрессии) включаются значение зависимой переменной с лагом в один период и текущее значение независимой переменной:

y_{t}=a+\lambda y_{t-1}+bx_{t}+{\text{error term}},

где . В этой модели краткосрочный (за один и тот же период) эффект изменения единицы измерения независимой переменной равен значению b , тогда как долгосрочный (кумулятивный) эффект устойчивого изменения единицы измерения независимой переменной можно показать как быть $0\leq \lambda <1$

b+\lambda b+\lambda ^{2}b+...=b/(1-\lambda ).

Были предложены другие модели с бесконечным распределенным запаздыванием, позволяющие данным определять форму структуры запаздывания. Полиномиальный обратный лаг ^[4]^[5] предполагает, что веса лага связаны с основными, линейно оцениваемыми параметрами a _j в соответствии с

w_{i}=\sum _{j=2}^{n}{\frac {a_{j}}{(i+1)^{j}}},

для $i=0,\dots ,\infty .$

Геометрическая комбинация лагов ^[6] предполагает, что веса лагов связаны с основными, линейно оцениваемыми параметрами a _j согласно либо

w_{i}=\sum _{j=2}^{n}a_{j}(1/j)^{i},

для или $i=0,\dots ,\infty$

w_{i}=\sum _{j=1}^{n}a_{j}[j/(n+1)]^{i},

для $i=0,\dots ,\infty .$

Гамма -лаг ^[7] и рациональный лаг ^[8] — это другие структуры с бесконечным распределенным лагом.

Модель распределенного лага в исследованиях здоровья

Модели с распределенным лагом были введены в исследования, связанные со здоровьем, в 2002 году Занобетти и Шварцем. ^[9] Байесовская версия модели была предложена Уэлти в 2007 году. ^[10] Гаспаррини представил более гибкие статистические модели в 2010 году ^[11] , которые способны описывать дополнительные временные измерения взаимосвязи воздействия и реакции, и разработал семейство Нелинейные модели с распределенной задержкой (DLNM) — система моделирования, которая может одновременно представлять нелинейные зависимости «воздействие-реакция» и отложенные эффекты. ^[12]

Концепция модели распределенного лага была впервые применена к продольному когортному исследованию Сюем в 2015 году ^[13] для изучения взаимосвязи между PM2,5 и детской астмой , а более сложный метод распределенного лага был направлен на анализ продольного когортного исследования, такой как байесовский распределенный лаг. Модель взаимодействия ^[14] Уилсона была впоследствии разработана для ответа на аналогичные исследовательские вопросы.