Причинность по Грейнджеру

Когда временной ряд X вызывает по Грейнджеру временной ряд Y , закономерности в X приблизительно повторяются в Y с некоторой задержкой (два примера обозначены стрелками). Таким образом, прошлые значения X *можно* использовать для прогнозирования будущих значений Y.

Тест причинности Грейнджера — это статистический тест гипотезы для определения того, полезен ли один временной ряд для прогнозирования другого, впервые предложенный в 1969 году. ^[1] Обычно регрессии отражают «простые» корреляции , но Клайв Грейнджер утверждал, что причинность в экономике может быть проверена путем измерения способности предсказывать будущие значения временного ряда с использованием предыдущих значений другого временного ряда. Поскольку вопрос «истинной причинности» является глубоко философским, и из-за ошибки post hoc ergo propter hoc, предполагающей, что одна вещь, предшествующая другой, может использоваться в качестве доказательства причинности, эконометристы утверждают, что тест Грейнджера обнаруживает только «предсказательную причинность». ^[2] Использование термина «причинность» само по себе является неправильным, поскольку причинность Грейнджера лучше описывать как «предшествование», ^[3] или, как сам Грейнджер позже утверждал в 1977 году, «временно связанную». ^[4] Вместо того, чтобы проверять, является ли X причиной Y, причинность по Грейнджеру проверяет, предсказывает ли X Y. ^[5]

Говорят , что временной ряд X является причиной Y по Грейнджеру , если можно показать, обычно с помощью серии t-тестов и F-тестов на запаздывающих значениях X ( и с учетом запаздывающих значений Y ), что эти значения X предоставляют статистически значимую информацию о будущих значениях Y.

Грэнджер также подчеркнул, что некоторые исследования, использующие тестирование «причинности по Грэнджеру» в областях, не связанных с экономикой, пришли к «смешным» выводам. ^[6] «Конечно, появилось много смехотворных статей», — сказал он в своей Нобелевской лекции. ^[7] Тем не менее, он остается популярным методом анализа причинности во временных рядах из-за его вычислительной простоты. ^[8]^[9] Первоначальное определение причинности по Грэнджеру не учитывает скрытые сопутствующие эффекты и не охватывает мгновенные и нелинейные причинно-следственные связи, хотя для решения этих проблем было предложено несколько расширений. ^[8]

Интуиция

Мы говорим, что переменная X , которая эволюционирует с течением времени , является причиной по Грейнджеру другой эволюционирующей переменной Y, если предсказания значения Y, основанные на ее собственных прошлых значениях и на прошлых значениях X, лучше, чем предсказания Y, основанные только на собственных прошлых значениях Y.

Базовые принципы

Грейнджер определил причинно-следственную связь на основе двух принципов: ^[8]^[10]

Причина предшествует следствию.
Причина несет в себе уникальную информацию о будущих значениях ее следствия.

Учитывая эти два предположения о причинно-следственной связи, Грейнджер предложил проверить следующую гипотезу для выявления причинно-следственной связи : $X$ $Y$

\mathbb {P} [Y(t+1)\in A\mid {\mathcal {I}}(t)]\neq \mathbb {P} [Y(t+1)\in A\mid {\mathcal {I}}_{-X}(t)],

где относится к вероятности, является произвольным непустым множеством, и и соответственно обозначают информацию, доступную на момент времени во всей вселенной, и информацию в модифицированной вселенной, в которой исключено. Если принята вышеуказанная гипотеза, мы говорим, что Грейнджер-причины . ^[8]^[10] $\mathbb {P}$ $A$ ${\mathcal {I}}(t)$ ${\mathcal {I}}_{-X}(t)$ $t$ $X$ $X$ $Y$

Метод

Если временной ряд является стационарным процессом , тест выполняется с использованием значений уровня двух (или более) переменных. Если переменные нестационарны, то тест выполняется с использованием первых (или более высоких) разностей. Количество включаемых лагов обычно выбирается с использованием информационного критерия, такого как информационный критерий Акаике или информационный критерий Шварца . Любое конкретное лаговое значение одной из переменных сохраняется в регрессии, если (1) оно значимо согласно t-критерию, и (2) оно и другие лаговые значения переменной совместно добавляют объяснительную силу к модели согласно F-критерию. Тогда нулевая гипотеза об отсутствии причинности по Грейнджеру не отвергается, если и только если в регрессии не были сохранены лаговые значения объясняющей переменной.

На практике может оказаться, что ни одна из переменных по Грейнджеру не является причиной другой, или что каждая из двух переменных по Грейнджеру является причиной другой.

Математическое утверждение

Пусть y и x будут стационарными временными рядами. Чтобы проверить нулевую гипотезу о том, что x не является причиной y по Грейнджеру , сначала находят соответствующие запаздывающие значения y для включения в одномерную авторегрессию y :

y_{t}=a_{0}+a_{1}y_{t-1}+a_{2}y_{t-2}+\cdots +a_{m}y_{t-m}+{\text{error}}_{t}.

Далее авторегрессия дополняется включением запаздывающих значений x :

y_{t}=a_{0}+a_{1}y_{t-1}+a_{2}y_{t-2}+\cdots +a_{m}y_{t-m}+b_{p}x_{t-p}+\cdots +b_{q}x_{t-q}+{\text{error}}_{t}.

В этой регрессии сохраняются все запаздывающие значения x , которые индивидуально значимы согласно их t-статистике, при условии, что в совокупности они добавляют объяснительную силу к регрессии согласно F-тесту (нулевая гипотеза которого не является объяснительной силой, совместно добавленной x ). В обозначениях вышеприведенной расширенной регрессии p является наименьшей, а q — наибольшей длиной лага, для которой запаздывающее значение x является значимым.

Нулевая гипотеза о том, что x не является причиной y по Грейнджеру, не отвергается тогда и только тогда, когда в регрессии не сохраняются запаздывающие значения x .

Многомерный анализ

Многомерный анализ причинности по Грейнджеру обычно выполняется путем подгонки векторной авторегрессионной модели (VAR) под временной ряд. В частности, пусть для будет -мерным многомерным временным рядом. Причинность по Грейнджеру выполняется путем подгонки VAR-модели с временными задержками следующим образом: $X(t)\in \mathbb {R} ^{d\times 1}$ $t=1,\ldots ,T$ $d$ $L$

X(t)=\sum _{\tau =1}^{L}A_{\tau }X(t-\tau )+\varepsilon (t),

где — белый гауссовский случайный вектор, а — матрица для каждого . Временной ряд называется причиной Грейнджера другого временного ряда , если хотя бы один из элементов для значительно больше нуля (по абсолютной величине). ^[11] $\varepsilon (t)$ $A_{\tau }$ $\tau$ $X_{i}$ $X_{j}$ $A_{\tau }(j,i)$ $\tau =1,\ldots ,L$

Непараметрический тест

Вышеуказанные линейные методы подходят для проверки причинности по Грейнджеру в среднем. Однако они не способны обнаружить причинность по Грейнджеру в более высоких моментах, например, в дисперсии. Непараметрические тесты на причинность по Грейнджеру предназначены для решения этой проблемы. ^[12] Определение причинности по Грейнджеру в этих тестах является общим и не включает никаких предположений моделирования, таких как линейная авторегрессионная модель. Непараметрические тесты на причинность по Грейнджеру могут использоваться в качестве диагностических инструментов для построения лучших параметрических моделей , включая моменты более высокого порядка и/или нелинейность. ^[13]

Ограничения

Как следует из названия, причинность по Грейнджеру не обязательно является истинной причинностью. Фактически, тесты причинности по Грейнджеру соответствуют только определению причинности по Юму , которое идентифицирует причинно-следственные связи с постоянными связями. ^[14] Если и X , и Y управляются общим третьим процессом с разными задержками, то все равно можно не отвергнуть альтернативную гипотезу причинности по Грейнджеру. Тем не менее, манипулирование одной из переменных не изменит другую. Действительно, тесты причинности по Грейнджеру предназначены для обработки пар переменных и могут давать вводящие в заблуждение результаты, когда истинная связь включает три или более переменных. Сказав это, было высказано мнение, что, учитывая вероятностный взгляд на причинность, причинность по Грейнджеру можно считать истинной причинностью в этом смысле, особенно если принять во внимание «отсеивающее» понятие вероятностной причинности Райхенбаха. ^[15] Другими возможными источниками ошибочных результатов теста являются: (1) недостаточно частая или слишком частая выборка, (2) нелинейная причинно-следственная связь, (3) нестационарность и нелинейность временного ряда и (4) существование рациональных ожиданий. ^[14] Похожий тест с большим количеством переменных можно применить с векторной авторегрессией .

Обоснованность теста причинности Грейнджера была оспорена в академической литературе ^[16] в статье, в которой утверждалось, что «даже самое фундаментальное требование, лежащее в основе любого возможного определения причинности, не удовлетворяется тестом причинности Грейнджера... любое определение причинности должно ссылаться на предсказание будущего из прошлого... мы обнаруживаем, что Грейнджер также позволяет «предсказывать» прошлое из будущего».

Расширения

Был разработан метод причинности по Грейнджеру, который не чувствителен к отклонениям от предположения, что ошибка распределена нормально. ^[17] Этот метод особенно полезен в финансовой экономике, поскольку многие финансовые переменные распределены ненормально. ^[18] Недавно в литературе было предложено тестирование асимметричной причинности, чтобы отделить причинное влияние положительных изменений от отрицательных. ^[19] Также доступно расширение тестирования (не)причинности по Грейнджеру на панельные данные. ^[20] Модифицированный тест причинности по Грейнджеру, основанный на типе GARCH (обобщенная авторегрессионная условная гетероскедастичность) моделей временных рядов с целыми значениями, доступен во многих областях. ^[21]^[22]

Изменяющаяся во времени причинность по Грейнджеру

Расширение причинности Грейнджера для включения ее динамической, изменяющейся во времени природы позволяет более тонко понимать, как причинно-следственные связи в данных временных рядов развиваются с течением времени. ^[23] Методология использует рекурсивные методы, такие как окна Forward Expanding (FE), Rolling (RO) и Recursive Evolving (RE), чтобы преодолеть ограничения традиционных тестов причинности Грейнджера и понять изменения в причинно-следственных связях в разные периоды. ^[24] Центральным аспектом этой методологии является команда «tvgc» в Stata. ^[23] Эмпирические приложения, такие как данные, включающие транзакционные сборы и экономические подсистемы в Ethereum, подчеркивают динамическую природу экономических связей с течением времени. ^[25]

В области нейронауки

Долгое время считалось, что разные области мозга специфичны для конкретных задач; что структурная связь, локальная для определенной области, каким-то образом диктует функцию этой части. Собирая работы, которые выполнялись в течение многих лет, произошел переход к другому, сетецентрическому подходу к описанию потока информации в мозге. Объяснение функции начинает включать концепцию сетей, существующих на разных уровнях и в разных местах мозга. ^[26] Поведение этих сетей можно описать недетерминированными процессами, которые развиваются с течением времени. То есть, при наличии одного и того же входного стимула вы не получите один и тот же выход от сети. Динамика этих сетей регулируется вероятностями, поэтому мы относимся к ним как к стохастическим (случайным) процессам , чтобы мы могли зафиксировать эти виды динамики между различными областями мозга.

Различные методы получения некоторой меры потока информации из активности нейрона и его окружающего ансамбля были исследованы в прошлом, но они ограничены в типах выводов, которые могут быть сделаны, и дают мало понимания направленного потока информации, его размера эффекта и того, как он может меняться со временем. ^[27] Недавно причинность Грейнджера была применена для решения некоторых из этих проблем. ^[28] Проще говоря, изучается, как лучше всего предсказать будущее нейрона: используя либо весь ансамбль, либо весь ансамбль, за исключением определенного целевого нейрона. Если предсказание ухудшается за счет исключения целевого нейрона, то мы говорим, что он имеет «g-причинную» связь с текущим нейроном.

Расширения для точечных моделей процессов

Предыдущие методы причинности по Грейнджеру могли работать только с непрерывными данными, поэтому анализ записей нейронных импульсных последовательностей включал преобразования, которые в конечном итоге изменяли стохастические свойства данных, косвенно изменяя обоснованность выводов, которые можно было из них сделать. Однако в 2011 году была предложена новая универсальная структура причинности по Грейнджеру, которая могла напрямую работать с любой модальностью, включая нейронные импульсные последовательности. ^[27]

Данные о нейронных спайках можно смоделировать как точечный процесс . Временной точечный процесс — это стохастический временной ряд двоичных событий, происходящих в непрерывном времени. Он может принимать только два значения в каждый момент времени, указывая, произошло ли событие на самом деле. Этот тип двоичного представления информации подходит для активности нейронных популяций , поскольку потенциал действия одного нейрона имеет типичную форму волны. Таким образом, то, что несет фактическую информацию, выводимую нейроном, — это возникновение «спайка», а также время между последовательными спайками. Используя этот подход, можно абстрагировать поток информации в нейронной сети, чтобы он был просто временем спайков для каждого нейрона в течение периода наблюдения. Точечный процесс может быть представлен либо синхронизацией самих всплесков, либо временем ожидания между всплесками, с использованием процесса подсчета, либо, если время достаточно дискретизировано, чтобы гарантировать, что в каждом окне может произойти только одно событие, то есть один временной интервал может содержать только одно событие, как набор единиц и нулей, что очень похоже на двоичный код. ^{[ необходима цитата ]}

Одной из самых простых моделей нейронных импульсов является процесс Пуассона . Однако он ограничен тем, что не имеет памяти. Он не учитывает историю импульсов при расчете текущей вероятности срабатывания. Однако нейроны демонстрируют фундаментальную (биофизическую) зависимость от истории посредством своих относительных и абсолютных рефрактерных периодов. Чтобы решить эту проблему, используется условная функция интенсивности для представления вероятности нейронного импульса, обусловленного его собственной историей. Условная функция интенсивности выражает мгновенную вероятность срабатывания и неявно определяет полную вероятностную модель для точечного процесса. Она определяет вероятность за единицу времени. Поэтому, если эта единица времени взята достаточно малой, чтобы гарантировать, что только один импульс может произойти в этом временном окне, то наша условная функция интенсивности полностью определяет вероятность того, что данный нейрон сработает в определенное время. ^{[ необходима цитата ]}

В вычислительной технике

Разработаны программные пакеты для измерения «причинности по Грейнджеру» на Python и R :

Пакет Python [1]
Пакет R [2]

Смотрите также

Критерии Брэдфорд-Хилла – Критерии измерения причины и следствия
Энтропия переноса – мера количества направленной (асимметричной во времени) передачи информации.
Постулат Коха – Четыре критерия, показывающие причинно-следственную связь между возбудителем заболевания и болезнью

Ссылки

^ Granger, CWJ (1969). «Исследование причинно-следственных связей с помощью эконометрических моделей и кросс-спектральных методов». Econometrica . 37 (3): 424–438. doi :10.2307/1912791. JSTOR 1912791.
^ Diebold, Francis X. (2007). Elements of Forecasting (PDF) (4-е изд.). Thomson South-Western. стр. 230–231. ISBN 978-0324359046.
^ Лимер, Эдвард Э. (1985). «Векторные авторегрессии для причинно-следственной связи?». Серия конференций Карнеги-Рочестера по государственной политике . 22 : 283. doi :10.1016/0167-2231(85)90035-1.
^ Granger, CWJ; Newbold, Paul (1977). Прогнозирование экономических временных рядов . Нью-Йорк: Academic Press. стр. 225. ISBN 0122951506.
^ Гамильтон, Джеймс Д. (1994). Анализ временных рядов (PDF) . Princeton University Press. стр. 306–308. ISBN 0-691-04289-6.
^ Турман, Уолтер (1988). «Куры, яйца и причинность или что появилось первым?» (PDF) . Американский журнал сельскохозяйственной экономики . 70 (2): 237–238. doi :10.2307/1242062. JSTOR 1242062 . Получено 2 апреля 2022 г. .
^ Granger, Clive WJ (2004). «Анализ временных рядов, коинтеграция и приложения» (PDF) . American Economic Review . 94 (3): 421–425. CiteSeerX 10.1.1.370.6488 . doi :10.1257/0002828041464669. S2CID 154709108 . Получено 12 июня 2019 г. .
^ abcd Eichler, Michael (2012). "Причинно-следственный вывод в анализе временных рядов" (PDF) . В Berzuini, Carlo (ред.). Причинность: статистические перспективы и приложения (3-е изд.). Hoboken, NJ: Wiley. стр. 327–352. ISBN 978-0470665565.
^ Сет, Анил (2007). «Причинность по Грейнджеру». Scholarpedia . 2 (7): 1667. Bibcode : 2007SchpJ...2.1667S. doi : 10.4249/scholarpedia.1667 .
^ ab Granger, CWJ (1980). «Тестирование причинности: личная точка зрения». Журнал экономической динамики и управления . 2 : 329–352. doi :10.1016/0165-1889(80)90069-X.
^ Lütkepohl, Helmut (2005). Новое введение в анализ множественных временных рядов (3-е изд.). Берлин: Springer. С. 41–51. ISBN 978-3540262398.
^ Дикс, Сис; Панченко, Валентин (2006). "Новые статистические и практические рекомендации по непараметрическому тестированию причинности по Грейнджеру" (PDF) . Журнал экономической динамики и управления . 30 (9): 1647–1669. doi :10.1016/j.jedc.2005.08.008.
^ Фрэнсис, Билл Б.; Мугу, Мбоджа; Панченко, Валентин (2010). «Существует ли симметричная нелинейная причинно-следственная связь между крупными и мелкими фирмами?» (PDF) . Журнал эмпирических финансов . 17 (1): 23–28. doi :10.1016/j.jempfin.2009.08.003.
^ ab Mariusz, Maziarz (2015-05-20). "Обзор ошибки причинности Грейнджера". Журнал философской экономики . VIII. (2). ISSN 1843-2298.
^ Маннино, Майкл; Бресслер, Стивен Л. (2015). «Основные взгляды на причинность в крупномасштабных сетях мозга». Physics of Life Reviews . 15 : 107–23. Bibcode : 2015PhLRv..15..107M. doi : 10.1016/j.plrev.2015.09.002. PMID 26429630.
^ Грассманн, Грета (2020). «Новые соображения о валидности теста причинности Винера-Грейнджера». Heliyon . 6 (10): e05208. Bibcode :2020Heliy...605208G. doi : 10.1016/j.heliyon.2020.e05208 . PMC 7578691 . PMID 33102842.
^ Хакер, Р. Скотт; Хатеми-дж, А. (2006). «Тесты причинно-следственной связи между интегрированными переменными с использованием асимптотических и бутстраповских распределений: теория и применение». Прикладная экономика . 38 (13): 1489–1500. doi :10.1080/00036840500405763. S2CID 121999615.
^ Мандельброт, Бенуа (1963). «Изменение некоторых спекулятивных цен». Журнал бизнеса . 36 (4): 394–419. doi :10.1086/294632.
^ Hatemi-j, A. (2012). «Асимметричные тесты причинности с приложением». Эмпирическая экономика . 43 : 447–456. doi :10.1007/s00181-011-0484-x. S2CID 153562476.
^ Думитреску, Э.-И.; Херлин, К. (2012). «Тестирование на отсутствие причинности по Грейнджеру в гетерогенных группах». Экономическое моделирование . 29 (4): 1450–1460. CiteSeerX 10.1.1.395.568 . doi :10.1016/j.econmod.2012.02.014. S2CID 9227921.
^ Чен, Кэти WS; Хси, Ин-Хен; Су, Хун-Чи; У, Цзя Цзин (2018-02-01). «Проверка причинности мелких частиц окружающей среды и человеческого гриппа на Тайване: различия, зависящие от возрастной группы, и географическая неоднородность». Environment International . 111 : 354–361. Bibcode :2018EnInt.111..354C. doi :10.1016/j.envint.2017.10.011. ISSN 0160-4120. PMID 29173968.
^ Чен, Кэти WS; Ли, Сангёль (2017). «Байесовский тест причинности для целочисленных моделей временных рядов с приложениями к климатическим и преступным данным». Журнал Королевского статистического общества, серия C (прикладная статистика) . 66 (4): 797–814. doi : 10.1111/rssc.12200. hdl : 10.1111/rssc.12200 . ISSN 1467-9876. S2CID 125296454.
^ ab Baum, Christopher F.; Hurn, Stan; Otero, Jesús (2022-06-30). «Тестирование на изменяющуюся во времени причинность по Грейнджеру». The Stata Journal: Продвижение коммуникаций по статистике и Stata . 22 (2): 355–378. doi : 10.1177/1536867X221106403. ISSN 1536-867X. S2CID 250221497.
^ Shojaie, Ali; Fox, Emily B. (2022-03-07). «Причинность по Грейнджеру: обзор и последние достижения». Annual Review of Statistics and Its Application . 9 (1): 289–319. arXiv : 2105.02675 . Bibcode :2022AnRSA...9..289S. doi : 10.1146/annurev-statistics-040120-010930 . ISSN 2326-8298. PMC 10571505 . PMID 37840549.
^ Анте, Леннарт; Саггу, Аман (2024-01-04). «Изменяющиеся во времени двунаправленные причинно-следственные связи между транзакционными сборами и экономической активностью подсистем, использующих сеть блокчейна Ethereum». Журнал по рискам и финансовому менеджменту . 17 (1): 19. doi : 10.3390/jrfm17010019 . ISSN 1911-8074.
^ Найт, Р. Т. (2007). «Нейронаука: Нейронные сети развенчивают френологию». Science . 316 (5831): 1578–9. doi :10.1126/science.1144677. PMID 17569852. S2CID 15065228.
^ ab Kim, Sanggyun; Putrino, David; Ghosh, Soumya; Brown, Emery N (2011). "Мера причинности по Грейнджеру для моделей точечных процессов ансамблевой нейронной импульсной активности". PLOS Computational Biology . 7 (3): e1001110. Bibcode : 2011PLSCB...7E1110K. doi : 10.1371/journal.pcbi.1001110 . PMC 3063721. PMID 21455283 .
^ Бресслер, Стивен Л.; Сет, Анил К. (2011). «Причинность Винера–Грейнджера: хорошо зарекомендовавшая себя методология». NeuroImage . 58 (2): 323–9. doi :10.1016/j.neuroimage.2010.02.059. PMID 20202481. S2CID 36616970.

Дальнейшее чтение

Эндерс, Уолтер (2004). Прикладные эконометрические временные ряды (второе издание). Нью-Йорк: Wiley. С. 283–288. ISBN 978-0-471-23065-6.
Гуджарати, Дамодар Н.; Портер, Дон К. (2009). «Причинность в экономике: тест причинности Грейнджера». Базовая эконометрика (Пятое международное издание). Нью-Йорк: McGraw-Hill. С. 652–658. ISBN 978-007-127625-2.
Hoover, Kevin D. (1988). «Granger-causality». Новая классическая макроэкономика . Оксфорд: Basil Blackwell. стр. 168–176. ISBN 978-0-631-14605-6.
Кюрштайнер, Гвидо (2008). «Причинность Грейнджера–Симса». Новый экономический словарь Palgrave .
Клейнберг, С. и Хрипчак, Г. (2011) «Обзор причинно-следственных связей в биомедицинской информатике». Архивировано 30 апреля 2012 г. в Wayback Machine J. Biomed Informatics