stringtranslate.com

Причинность Грейнджер

Когда временной ряд X по Грейнджеру вызывает временной ряд Y , закономерности в X примерно повторяются в Y через некоторое время (два примера указаны стрелками). Таким образом , прошлые значения X можно использовать для прогнозирования будущих значений Y.

Тест причинности Грейнджера — это проверка статистической гипотезы для определения того, полезен ли один временной ряд для прогнозирования другого, впервые предложенный в 1969 году. [1] Обычно регрессии отражают «простые» корреляции , но Клайв Грейнджер утверждал, что причинность в экономике можно проверить на предмет путем измерения способности прогнозировать будущие значения временного ряда, используя предыдущие значения другого временного ряда. Поскольку вопрос об «истинной причинности» является глубоко философским и из-за ошибки post hoc ergo propter hoc , заключающейся в предположении, что одна вещь, предшествующая другой, может использоваться в качестве доказательства причинной связи, специалисты по эконометрике утверждают, что тест Грейнджера обнаруживает только «прогнозируемую причинность». . [2] Использование одного только термина «причинность» является неправильным, поскольку причинность Грейнджера лучше описывать как «приоритет» [3] или, как позже заявил сам Грейнджер в 1977 году, «временно связанную». [4] Вместо того, чтобы проверять, является ли X причиной Y, причинность Грейнджера проверяет, прогнозирует ли X Y. [5]

Временной ряд X называется причиной Y по Грейнджеру , если можно показать, обычно с помощью серии t -тестов и F-тестов для лагированных значений X (а также включая лагированные значения Y ), что эти значения X обеспечивают статистически значимая информация о будущих значениях  Y .

Грейнджер также подчеркнула, что некоторые исследования, использующие тест «причинности Грейнджера» в областях, не относящихся к экономике, привели к «смехотворным» выводам. [6] «Конечно, появилось много нелепых статей», — сказал он в своей Нобелевской лекции. [7] Тем не менее, он остается популярным методом анализа причинно-следственных связей во временных рядах из-за своей вычислительной простоты. [8] [9] Первоначальное определение причинности Грейнджера не учитывает скрытые мешающие эффекты и не отражает мгновенные и нелинейные причинно-следственные связи, хотя для решения этих проблем было предложено несколько расширений. [8]

Интуиция

Мы говорим, что переменная X , которая развивается с течением времени по Грейнджеру, вызывает развитие другой переменной Y , если предсказания значения Y , основанные на ее собственных прошлых значениях и прошлых значениях X , лучше, чем предсказания Y , основанные только на собственных значениях Y. прошлые ценности.

Основополагающие принципы

Грейнджер определил причинно-следственную связь, основываясь на двух принципах: [8] [10]

  1. Причина возникает раньше своего следствия.
  2. Причина обладает уникальной информацией о будущих значениях своего следствия.

Учитывая эти два предположения о причинности, Грейнджер предложил проверить следующую гипотезу для выявления причинного воздействия на :

где относится к вероятности, представляет собой произвольное непустое множество и соответственно обозначает информацию, доступную на данный момент во всей вселенной, и ту, что в модифицированной вселенной, из которой она исключена. Если принять приведенную выше гипотезу, мы говорим, что Грейнджер-вызывает . [8] [10]

Метод

Если временной ряд представляет собой стационарный процесс , тест проводится с использованием значений уровня двух (или более) переменных. Если переменные нестационарны, то тест проводится с использованием первых (или более высоких) разностей. Количество включенных лагов обычно выбирается с использованием информационного критерия, такого как информационный критерий Акаике или информационный критерий Шварца . Любое конкретное лагированное значение одной из переменных сохраняется в регрессии, если (1) оно значимо согласно t-критерию и (2) оно и другие лагированные значения переменной совместно добавляют объяснительную силу модели в соответствии с F-тест. Тогда нулевая гипотеза об отсутствии причинности по Грейнджеру не отвергается тогда и только тогда, когда в регрессии не сохранились лагированные значения объясняющей переменной.

На практике может оказаться, что ни одна переменная Грейнджер не является причиной другой или что каждая из двух переменных Грейнджер не является причиной другой.

Математическое утверждение

Пусть y и x — стационарные временные ряды. Чтобы проверить нулевую гипотезу о том, что x не является причиной y по Грейнджеру , сначала нужно найти правильные лагированные значения y для включения в одномерную авторегрессию y :

Затем авторегрессия дополняется включением запаздывающих значений x :

В этой регрессии сохраняются все лагированные значения x , которые индивидуально значимы в соответствии с их t-статистикой, при условии, что вместе они добавляют объяснительную силу к регрессии в соответствии с F-тестом (нулевая гипотеза которого не является объяснительной силой, добавляемой совместно x ' с). В обозначениях приведенной выше расширенной регрессии p — самая короткая, а q — самая длинная длина лага, для которой лагированное значение x является значимым.

Нулевая гипотеза о том, что x не является причиной y по Грейнджеру , не отвергается тогда и только тогда, когда в регрессии не сохраняются запаздывающие значения x .

Многомерный анализ

Многомерный анализ причинно-следственных связей Грейнджера обычно выполняется путем подгонки векторной авторегрессионной модели (VAR) к временному ряду. В частности, пусть for — многомерный временной ряд. Причинность Грейнджера определяется путем подбора модели VAR с временными задержками следующим образом:

где — белый гауссовский случайный вектор и — матрица для каждого . Временной ряд называется причиной Грейнджера другого временного ряда , если хотя бы один из элементов для существенно больше нуля (по абсолютной величине). [11]

Непараметрический тест

Вышеупомянутые линейные методы подходят для проверки причинности Грейнджера в среднем. Однако они не способны обнаружить причинность Грейнджера в более высоких моментах, например, в дисперсии. Непараметрические тесты причинности Грейнджера предназначены для решения этой проблемы. [12] Определение причинности Грейнджера в этих тестах является общим и не предполагает каких-либо допущений моделирования, таких как модель линейной авторегрессии. Непараметрические тесты причинности Грейнджера можно использовать в качестве диагностических инструментов для построения более качественных параметрических моделей , включая моменты более высокого порядка и/или нелинейность. [13]

Ограничения

Как следует из названия, причинность Грейнджера не обязательно является истинной причинностью. Фактически, тесты причинно-следственной связи Грейнджера соответствуют только юмовскому определению причинности , которое идентифицирует причинно-следственные отношения с постоянными соединениями. [14] Если и X , и Y управляются общим третьим процессом с разными задержками, все равно можно не отвергнуть альтернативную гипотезу причинности Грейнджера. Однако манипуляция одной из переменных не изменит другую. Действительно, тесты причинно-следственной связи Грейнджера предназначены для обработки пар переменных и могут давать ошибочные результаты, когда истинная связь включает три или более переменных. При этом утверждалось, что при вероятностном взгляде на причинность причинность Грейнджера можно считать истинной причинностью в этом смысле, особенно если принять во внимание понятие Райхенбаха о «отсеивании» вероятностной причинности. [15] Другими возможными источниками ошибочных результатов испытаний являются: (1) недостаточно частая или слишком частая выборка, (2) нелинейная причинно-следственная связь, (3) нестационарность и нелинейность временных рядов и (4) существование рациональных ожиданий. [14] Аналогичный тест, включающий больше переменных, можно применить с помощью векторной авторегрессии .

Расширения

Был разработан метод причинности Грейнджера, который не чувствителен к отклонениям от предположения о нормальном распределении члена ошибки. [16] Этот метод особенно полезен в финансовой экономике, поскольку многие финансовые переменные не имеют нормального распределения. [17] Недавно в литературе было предложено тестирование асимметричной причинности, чтобы отделить причинное влияние положительных изменений от отрицательных. [18] Также доступно расширение тестирования (не)причинности Грейнджера на панельные данные. [19] Модифицированный тест причинности Грейнджера, основанный на модели целочисленных временных рядов типа GARCH (обобщенная авторегрессионная условная гетероскедастичность), доступен во многих областях. [20] [21]

Изменяющаяся во времени причинность Грейнджер

Расширение причинно-следственной связи Грейнджера за счет включения ее динамической, изменяющейся во времени природы позволяет более детально понять, как причинно-следственные связи в данных временных рядов развиваются с течением времени. [22] В методологии используются рекурсивные методы, такие как окна прямого расширения (FE), прокрутки (RO) и рекурсивного развития (RE), чтобы преодолеть ограничения традиционных тестов причинности Грейнджера и понять изменения в причинно-следственных связях в разные периоды. [23] Центральным аспектом этой методологии является команда «tvgc» в Stata. [22] Эмпирические приложения, такие как данные о комиссиях за транзакции и экономических подсистемах Ethereum, подчеркивают динамичный характер экономических отношений с течением времени. [24]

В нейробиологии

Давнее убеждение о функциях нервной системы утверждало, что разные области мозга отвечают за выполнение определенных задач; что структурные связи , локальные для определенной области, каким-то образом диктовали функцию этой части. Объединив работы, выполненные на протяжении многих лет, произошел переход к иному, сетецентрическому подходу к описанию потока информации в мозгу. Объяснение функций начинает включать концепцию сетей, существующих на разных уровнях и в разных местах мозга. [25] Поведение этих сетей можно описать недетерминированными процессами, которые развиваются во времени. То есть, при одном и том же входном стимуле вы не получите одинаковый результат от сети. Динамика этих сетей управляется вероятностями, поэтому мы рассматриваем их как стохастические (случайные) процессы , чтобы мы могли уловить такого рода динамику между различными областями мозга.

В прошлом исследовались различные методы получения некоторой меры информационного потока на основе активности нейрона и окружающего его ансамбля, но они ограничены в выводах, которые можно сделать, и дают мало информации о направленном потоке информации. , размер его эффекта и то, как он может меняться со временем. [26] Недавно причинно-следственная связь Грейнджера была применена для решения некоторых из этих проблем. [27] Проще говоря, изучается, как лучше всего предсказать будущее нейрона: используя либо весь ансамбль, либо весь ансамбль, за исключением определенного целевого нейрона. Если прогноз ухудшается из-за исключения целевого нейрона, то мы говорим, что он имеет «g-причинную» связь с текущим нейроном.

Расширения для точечных моделей процессов

Предыдущие методы причинно-следственной связи Грейнджера могли работать только с непрерывными данными, поэтому анализ записей нейронных импульсов включал преобразования, которые в конечном итоге изменяли стохастические свойства данных, косвенно изменяя достоверность выводов, которые можно было из них сделать. Однако в 2011 году была предложена новая универсальная модель причинно-следственной связи Грейнджера, которая могла напрямую работать с любой модальностью, включая поезда нейронных импульсов. [26]

Данные нейронных импульсов можно смоделировать как точечный процесс . Временной точечный процесс — это стохастический временной ряд бинарных событий, происходящих в непрерывном времени. В каждый момент времени он может принимать только два значения, указывая, произошло ли событие на самом деле. Этот тип двоичного представления информации подходит для активности нейронных популяций , поскольку потенциал действия отдельного нейрона имеет типичную форму волны. Таким образом, фактическая информация, выдаваемая нейроном, — это возникновение «спайка», а также время между последовательными спайками. Используя этот подход, можно абстрагировать поток информации в нейронной сети как просто время всплесков для каждого нейрона в течение периода наблюдения. Точечный процесс может быть представлен либо временем самих пиков, временем ожидания между пиками, используя процесс подсчета, либо, если время достаточно дискретизировано, чтобы гарантировать, что в каждом окне может произойти только одно событие, то то есть один временной интервал может содержать только одно событие в виде набора единиц и нулей, что очень похоже на двоичный код. [ нужна цитата ]

Одним из простейших типов моделей нейронных импульсов является процесс Пуассона . Однако это ограничено тем, что не имеет памяти. Он не учитывает историю скачков при расчете текущей вероятности стрельбы. Нейроны, однако, демонстрируют фундаментальную (биофизическую) зависимость от истории посредством относительных и абсолютных рефрактерных периодов. Чтобы решить эту проблему, используется функция условной интенсивности , которая представляет вероятность всплеска нейрона, обусловленную его собственной историей. Функция условной интенсивности выражает мгновенную вероятность срабатывания и неявно определяет полную вероятностную модель для точечного процесса. Он определяет вероятность в единицу времени. Итак, если эту единицу времени взять достаточно маленькой, чтобы гарантировать, что в этом временном окне может возникнуть только один всплеск, тогда наша функция условной интенсивности полностью определяет вероятность того, что данный нейрон сработает в определенное время. [ нужна цитата ]

В вычислительной технике

Пакеты программного обеспечения были разработаны для измерения «причинности Грейнджера» на Python и R :

Смотрите также

Рекомендации

  1. ^ Грейнджер, CWJ (1969). «Исследование причинно-следственных связей с помощью эконометрических моделей и кросс-спектральных методов». Эконометрика . 37 (3): 424–438. дои : 10.2307/1912791. JSTOR  1912791.
  2. ^ Диболд, Фрэнсис X. (2007). Элементы прогнозирования (PDF) (4-е изд.). Томсон Юго-Западный. стр. 230–231. ISBN 978-0324359046.
  3. ^ Лимер, Эдвард Э. (1985). «Векторная авторегрессия для причинного вывода?». Серия конференций Карнеги-Рочестер по государственной политике . 22 : 283. дои : 10.1016/0167-2231(85)90035-1.
  4. ^ Грейнджер, CWJ; Ньюболд, Пол (1977). Прогнозирование экономических временных рядов . Нью-Йорк: Академическая пресса. п. 225. ИСБН 0122951506.
  5. ^ Гамильтон, Джеймс Д. (1994). Анализ временных рядов (PDF) . Издательство Принстонского университета. стр. 306–308. ISBN 0-691-04289-6.
  6. ^ Турман, Уолтер (1988). «Куры, яйца и причинно-следственная связь, или что было первым?» (PDF) . Американский журнал экономики сельского хозяйства . 70 (2): 237–238. дои : 10.2307/1242062. JSTOR  1242062 . Проверено 2 апреля 2022 г.
  7. ^ Грейнджер, Клайв У.Дж. (2004). «Анализ временных рядов, коинтеграция и приложения» (PDF) . Американский экономический обзор . 94 (3): 421–425. CiteSeerX 10.1.1.370.6488 . дои : 10.1257/0002828041464669. S2CID  154709108 . Проверено 12 июня 2019 г. 
  8. ^ abcd Эйхлер, Майкл (2012). «Причинно-следственный вывод в анализе временных рядов» (PDF) . В Берзуини, Карло (ред.). Причинность: статистические перспективы и приложения (3-е изд.). Хобокен, Нью-Джерси: Уайли. стр. 327–352. ISBN 978-0470665565.
  9. ^ Сет, Анил (2007). «Причинность Грейнджер». Схоларпедия . 2 (7): 1667. Бибкод : 2007SchpJ...2.1667S. doi : 10.4249/scholarpedia.1667 .
  10. ^ аб Грейнджер, CWJ (1980). «Тестирование причинности: личная точка зрения». Журнал экономической динамики и контроля . 2 : 329–352. дои : 10.1016/0165-1889(80)90069-X.
  11. ^ Люткеполь, Хельмут (2005). Новое введение в анализ множественных временных рядов (3-е изд.). Берлин: Шпрингер. стр. 41–51. ISBN 978-3540262398.
  12. ^ Дикс, Сис; Панченко, Валентин (2006). «Новые статистические и практические рекомендации по непараметрическому тестированию причинности Грейнджера» (PDF) . Журнал экономической динамики и контроля . 30 (9): 1647–1669. doi :10.1016/j.jedc.2005.08.008.
  13. ^ Фрэнсис, Билл Б.; Мугуэ, Мбоджа; Панченко, Валентин (2010). «Существует ли симметричная нелинейная причинно-следственная связь между крупными и малыми фирмами?» (PDF) . Журнал эмпирических финансов . 17 (1): 23–28. doi : 10.1016/j.jempfin.2009.08.003.
  14. ^ аб Мариуш, Мазиарз (20 мая 2015 г.). «Обзор ошибки Грейнджер-причинности». Журнал философской экономики . VIII. (2). ISSN  1843-2298.
  15. ^ Маннино, Майкл; Бресслер, Стивен Л. (2015). «Основные взгляды на причинность в крупномасштабных мозговых сетях». Обзоры физики жизни . 15 : 107–23. Бибкод : 2015PhLRv..15..107M. doi :10.1016/j.plrev.2015.09.002. ПМИД  26429630.
  16. ^ Хакер, Р. Скотт; Хатеми-дж, А. (2006). «Тесты причинности между интегрированными переменными с использованием асимптотических и бутстреп-распределений: теория и применение». Прикладная экономика . 38 (13): 1489–1500. дои : 10.1080/00036840500405763. S2CID  121999615.
  17. ^ Мандельброт, Бенуа (1963). «Изменение некоторых спекулятивных цен». Журнал бизнеса . 36 (4): 394–419. дои : 10.1086/294632.
  18. ^ Хатеми-дж, А. (2012). «Асимметричные тесты причинности с приложением». Эмпирическая экономика . 43 : 447–456. doi : 10.1007/s00181-011-0484-x. S2CID  153562476.
  19. ^ Думитреску, Э.-И.; Херлин, К. (2012). «Тестирование непричинности Грейнджера в гетерогенных панелях». Экономическое моделирование . 29 (4): 1450–1460. CiteSeerX 10.1.1.395.568 . doi :10.1016/j.econmod.2012.02.014. S2CID  9227921. 
  20. ^ Чен, Кэти WS; Се, Ин-Хен; Су, Хун-Чье; Ву, Цзя Цзин (01 февраля 2018 г.). «Тест причинно-следственной связи мелких частиц в окружающей среде и человеческого гриппа на Тайване: различия в возрастных группах и географическая неоднородность». Интернационал окружающей среды . 111 : 354–361. дои : 10.1016/j.envint.2017.10.011. ISSN  0160-4120. ПМИД  29173968.
  21. ^ Чен, Кэти WS; Ли, Санёль (2017). «Байесовский тест причинности для целочисленных моделей временных рядов с применением к данным о климате и преступности». Журнал Королевского статистического общества, серия C (прикладная статистика) . 66 (4): 797–814. дои : 10.1111/rssc.12200. hdl : 10.1111/rssc.12200 . ISSN  1467-9876. S2CID  125296454.
  22. ^ Аб Баум, Кристофер Ф.; Херн, Стэн; Отеро, Хесус (30 июня 2022 г.). «Тестирование изменяющейся во времени причинности Грейнджер». Журнал Stata: Содействие распространению информации по статистике и статистическим данным . 22 (2): 355–378. дои : 10.1177/1536867X221106403. ISSN  1536-867X. S2CID  250221497.
  23. ^ Шоджаи, Али; Фокс, Эмили Б. (07 марта 2022 г.). «Причинность Грейнджер: обзор и последние достижения». Ежегодный обзор статистики и ее применения . 9 (1): 289–319. arXiv : 2105.02675 . Бибкод : 2022AnRSA...9..289S. doi : 10.1146/annurev-statistics-040120-010930 . ISSN  2326-8298. ПМЦ 10571505 . ПМИД  37840549. 
  24. ^ Анте, Леннарт; Саггу, Аман (4 января 2024 г.). «Изменяющиеся во времени двунаправленные причинно-следственные связи между комиссиями за транзакции и экономической активностью подсистем, использующих сеть блокчейна Ethereum». Журнал риска и финансового менеджмента . 17 (1): 19. дои : 10.3390/jrfm17010019 . ISSN  1911-8074.
  25. ^ Найт, RT (2007). «Нейронаука: разоблачение френологии нейронными сетями». Наука . 316 (5831): 1578–9. дои : 10.1126/science.1144677. PMID  17569852. S2CID  15065228.
  26. ^ Аб Ким, Сангюн; Путрино, Дэвид; Гош, Сумья; Браун, Эмери Н. (2011). «Мера причинности Грейнджера для моделей точечных процессов ансамблевой активности нейронов». PLOS Вычислительная биология . 7 (3): e1001110. Бибкод : 2011PLSCB...7E1110K. дои : 10.1371/journal.pcbi.1001110 . ПМК 3063721 . ПМИД  21455283. 
  27. ^ Бресслер, Стивен Л; Сет, Анил К. (2011). «Причинность Винера – Грейнджера: хорошо зарекомендовавшая себя методология». НейроИмидж . 58 (2): 323–9. doi :10.1016/j.neuroimage.2010.02.059. PMID  20202481. S2CID  36616970.

дальнейшее чтение