В статистике и эконометрике модель с распределенным лагом — это модель данных временных рядов , в которой уравнение регрессии используется для прогнозирования текущих значений зависимой переменной на основе как текущих значений объясняющей переменной , так и запаздывающих (прошлый период) значений эту объясняющую переменную. [1] [2]
Отправной точкой для модели с распределенным лагом является предполагаемая структура вида
или форма
где y t — значение зависимой переменной y в период времени t , a — оцениваемый член, а w i называется лаговым весом (также подлежащим оценке), приложенным к значению i периодов ранее независимой переменной. Икс . В первом уравнении предполагается, что на зависимую переменную влияют значения независимой переменной сколь угодно далеко в прошлом, поэтому количество весов запаздывания бесконечно, и модель называется моделью с бесконечным распределенным запаздыванием . В альтернативном втором уравнении имеется только конечное число весов лага, что указывает на предположение о том, что существует максимальный лаг, за пределами которого значения независимой переменной не влияют на зависимую переменную; модель, основанная на этом предположении, называется моделью с конечным распределенным лагом .
В модели с бесконечным распределенным лагом необходимо оценить бесконечное количество весов лагов; ясно, что это можно сделать только в том случае, если предположить некоторую структуру отношений между различными весами запаздывания, причем вся их бесконечность выражается через конечное число предполагаемых основных параметров. В модели с конечным распределенным запаздыванием параметры могут быть непосредственно оценены с помощью обычного метода наименьших квадратов (при условии, что количество точек данных значительно превышает количество весов запаздывания); тем не менее, такая оценка может дать очень неточные результаты из-за крайней мультиколлинеарности между различными лаговыми значениями независимой переменной, поэтому снова может оказаться необходимым предположить некоторую структуру связи между различными весами лага.
Концепция моделей с распределенным запаздыванием легко обобщается на контекст более чем одной объясняющей переменной в правой части.
Самый простой способ оценить параметры, связанные с распределенными задержками, - это обычный метод наименьших квадратов , предполагающий фиксированное максимальное запаздывание , предполагающий независимо и одинаково распределенные ошибки и не налагающий никакой структуры на отношения коэффициентов запаздывающих объяснителей друг с другом. Однако часто возникает мультиколлинеарность среди отстающих объяснителей, что приводит к высокой дисперсии оценок коэффициентов.
Структурированные модели с распределенным лагом бывают двух типов: конечные и бесконечные. Бесконечные распределенные лаги позволяют значению независимой переменной в определенный момент времени влиять на зависимую переменную бесконечно далеко в будущем, или, другими словами, они позволяют значению независимой переменной влиять на текущее значение зависимой переменной. это произошло бесконечно давно; но после некоторого периода задержки эффект снижается до нуля. Конечные распределенные лаги позволяют независимой переменной в определенный момент времени влиять на зависимую переменную только в течение конечного числа периодов.
Наиболее важной структурированной моделью с конечным распределенным лагом является модель лага Алмона . [3] Эта модель позволяет данным определять форму лаговой конструкции, но исследователь должен указать максимальную длину лаги; неправильно указанная максимальная длина лага может исказить форму предполагаемой структуры лага, а также кумулятивный эффект независимой переменной. Лаг Алмона предполагает, что k + 1 лаговых весов связаны с n + 1 линейно оцениваемыми базовыми параметрами ( n < k ) a j в соответствии с
для
Наиболее распространенным типом структурированной модели бесконечного распределенного лага является геометрический лаг , также известный как лаг Койка . В этой лаговой структуре веса (величины влияния) значений запаздывающих независимых переменных уменьшаются экспоненциально с длиной лага; хотя форма лаговой структуры, таким образом, полностью зависит от выбора этого метода, скорость снижения, а также общая величина эффекта определяются данными. Спецификация уравнения регрессии очень проста: в качестве объяснителей (правых переменных в регрессии) включаются значение зависимой переменной с лагом в один период и текущее значение независимой переменной:
где . В этой модели краткосрочный (за один и тот же период) эффект изменения единицы измерения независимой переменной равен значению b , тогда как долгосрочный (кумулятивный) эффект устойчивого изменения единицы измерения независимой переменной можно показать как быть
Были предложены другие модели с бесконечным распределенным запаздыванием, позволяющие данным определять форму структуры запаздывания. Полиномиальный обратный лаг [4] [5] предполагает, что веса лага связаны с основными, линейно оцениваемыми параметрами a j в соответствии с
для
Геометрическая комбинация лагов [6] предполагает, что веса лагов связаны с основными, линейно оцениваемыми параметрами a j согласно либо
для или
для
Гамма -лаг [7] и рациональный лаг [8] — это другие структуры с бесконечным распределенным лагом.
Модели с распределенным лагом были введены в исследования, связанные со здоровьем, в 2002 году Занобетти и Шварцем. [9] Байесовская версия модели была предложена Уэлти в 2007 году. [10] Гаспаррини представил более гибкие статистические модели в 2010 году [11] , которые способны описывать дополнительные временные измерения взаимосвязи воздействия и реакции, и разработал семейство Нелинейные модели с распределенной задержкой (DLNM) — система моделирования, которая может одновременно представлять нелинейные зависимости «воздействие-реакция» и отложенные эффекты. [12]
Концепция модели распределенного лага была впервые применена к продольному когортному исследованию Сюем в 2015 году [13] для изучения взаимосвязи между PM2,5 и детской астмой , а более сложный метод распределенного лага был направлен на анализ продольного когортного исследования, такой как байесовский распределенный лаг. Модель взаимодействия [14] Уилсона была впоследствии разработана для ответа на аналогичные исследовательские вопросы.