Коинтеграция — это статистическое свойство набора ( X 1 , X 2 , ..., X k ) переменных временного ряда . Во-первых, все ряды должны быть интегрированы порядка d . Затем, если линейная комбинация этого набора интегрирована порядка меньше d , то набор называется коинтегрированным. Формально, если ( X , Y , Z ) каждый интегрирован порядка d , и существуют коэффициенты a , b , c такие, что aX + bY + cZ интегрирован порядка меньше d , то X , Y , и Z коинтегрированы. Коинтеграция стала важным свойством в современном анализе временных рядов. Временные ряды часто имеют тренды — либо детерминированные, либо стохастические . В влиятельной статье [1] Чарльз Нельсон и Чарльз Плоссер (1982) представили статистические доказательства того, что многие макроэкономические временные ряды США (такие как ВНП, заработная плата, занятость и т. д.) имеют стохастические тренды.
Если два или более ряда индивидуально интегрированы (в смысле временного ряда), но некоторая линейная комбинация из них имеет более низкий порядок интеграции , то ряды называются коинтегрированными. Распространенным примером является случай, когда отдельные ряды интегрированы первым порядком ( ), но существует некоторый (коинтегрирующий) вектор коэффициентов, образующий их стационарную линейную комбинацию.
Первым, кто ввел и проанализировал концепцию ложной — или бессмысленной — регрессии, был Удни Юл в 1926 году. [2] До 1980-х годов многие экономисты использовали линейные регрессии на нестационарных данных временных рядов, что, как показали лауреаты Нобелевской премии Клайв Грейнджер и Пол Ньюболд, является опасным подходом, который может привести к ложной корреляции , [3] [4], поскольку стандартные методы детрендирования могут привести к данным, которые все еще нестационарны. [5] В своей совместной с Робертом Энглом статье 1987 года Грейнджер формализовал подход коинтеграционного вектора и ввел этот термин. [6]
Для интегрированных процессов Грейнджер и Ньюболд показали, что детрендирование не устраняет проблему ложной корреляции, и что лучшей альтернативой является проверка на коинтеграцию. Два ряда с трендами могут быть коинтегрированы только в том случае, если между ними существует подлинная связь. Таким образом, стандартная текущая методология для регрессий временных рядов заключается в проверке всех временных рядов, вовлеченных в интеграцию. Если по обе стороны регрессионной связи есть ряды , то регрессии могут давать вводящие в заблуждение результаты.
Возможное наличие коинтеграции должно быть принято во внимание при выборе метода проверки гипотез относительно связи между двумя переменными, имеющими единичные корни (т.е. интегрированными по крайней мере первого порядка). [3] Обычная процедура проверки гипотез относительно связи между нестационарными переменными состояла в запуске обычных регрессий наименьших квадратов (OLS) на данных, которые были разнесены. Этот метод смещен, если нестационарные переменные коинтегрированы.
Например, регрессия ряда потребления для любой страны (например, Фиджи) против ВНП для случайно выбранной непохожей страны (например, Афганистана) может дать высокую связь R-квадрат (предполагая высокую объясняющую способность потребления Фиджи на основе ВНП Афганистана ). Это называется ложной регрессией : два интегрированных ряда , которые не связаны напрямую причинно - следственной связью, могут, тем не менее, показывать значительную корреляцию.
Шесть основных методов проверки коинтеграции:
Если и оба имеют порядок интегрирования d = 1 и коинтегрированы, то их линейная комбинация должна быть стационарной для некоторого значения и . Другими словами:
где неподвижен.
Если известно, мы можем проверить стационарность с помощью расширенного теста Дики–Фуллера или теста Филлипса–Перрона . Если неизвестно, мы должны сначала оценить его. Обычно это делается с помощью обычных наименьших квадратов (путем регрессии по и отсекателю). Затем мы можем запустить тест ADF по . Однако, когда оценивается, критические значения этого теста ADF нестандартны и увеличиваются по абсолютному значению по мере включения большего количества регрессоров. [7]
Если переменные оказываются коинтегрированными, проводится регрессия второго этапа. Это регрессия на запаздывающих регрессорах и запаздывающих остатках первого этапа, . Регрессия второго этапа задается как:
Если переменные не коинтегрированы (если мы не можем отвергнуть нулевое значение отсутствия коинтеграции при тестировании ), то мы оцениваем модель различий:
Тест Йохансена — это тест на коинтеграцию, который допускает более одного коинтеграционного отношения, в отличие от метода Энгла–Грейнджера, но этот тест зависит от асимптотических свойств, т. е. больших выборок. Если размер выборки слишком мал, то результаты будут ненадежными, и следует использовать Auto Regressive Distributed Lags (ARDL). [8] [9]
Peter CB Phillips и Sam Ouliaris (1990) показывают, что тесты единичного корня на основе остатков, применяемые к оцененным коинтеграционным остаткам, не имеют обычных распределений Дики–Фуллера при нулевой гипотезе отсутствия коинтеграции. [10] Из-за явления ложной регрессии при нулевой гипотезе распределение этих тестов имеет асимптотические распределения, которые зависят от (1) числа детерминированных членов тренда и (2) числа переменных, с которыми проверяется коинтеграция. Эти распределения известны как распределения Филлипса–Оулиариса, и критические значения были табулированы. В конечных выборках превосходная альтернатива использованию этих асимптотических критических значений заключается в генерации критических значений из симуляций.
На практике коинтеграция часто используется для двух рядов, но она более применима и может использоваться для переменных, интегрированных более высокого порядка (для обнаружения коррелированных ускорений или других эффектов второй разности). Мультикоинтеграция расширяет метод коинтеграции за пределы двух переменных, а иногда и на переменные, интегрированные в разных порядках.
Тесты на коинтеграцию предполагают, что вектор коинтеграции постоянен в течение периода исследования. В действительности, возможно, что долгосрочные отношения между базовыми переменными изменятся (могут произойти сдвиги в векторе коинтеграции). Причиной этого могут быть технический прогресс, экономические кризисы, изменения в предпочтениях людей и соответственно в поведении, смена политики или режима, а также организационные или институциональные изменения. Это особенно вероятно, если период выборки длинный. Чтобы учесть эту проблему, были введены тесты на коинтеграцию с одним неизвестным структурным разрывом , [11] и также доступны тесты на коинтеграцию с двумя неизвестными разрывами. [12]
Было предложено несколько байесовских методов для вычисления апостериорного распределения числа коинтеграционных отношений и коинтеграционных линейных комбинаций. [13]