Тест причинности Грейнджера — это статистический тест гипотезы для определения того, полезен ли один временной ряд для прогнозирования другого, впервые предложенный в 1969 году. [1] Обычно регрессии отражают «простые» корреляции , но Клайв Грейнджер утверждал, что причинность в экономике может быть проверена путем измерения способности предсказывать будущие значения временного ряда с использованием предыдущих значений другого временного ряда. Поскольку вопрос «истинной причинности» является глубоко философским, и из-за ошибки post hoc ergo propter hoc, предполагающей, что одна вещь, предшествующая другой, может использоваться в качестве доказательства причинности, эконометристы утверждают, что тест Грейнджера обнаруживает только «предсказательную причинность». [2] Использование термина «причинность» само по себе является неправильным, поскольку причинность Грейнджера лучше описывать как «предшествование», [3] или, как сам Грейнджер позже утверждал в 1977 году, «временно связанную». [4] Вместо того, чтобы проверять, является ли X причиной Y, причинность по Грейнджеру проверяет, предсказывает ли X Y. [5]
Говорят , что временной ряд X является причиной Y по Грейнджеру , если можно показать, обычно с помощью серии t-тестов и F-тестов на запаздывающих значениях X ( и с учетом запаздывающих значений Y ), что эти значения X предоставляют статистически значимую информацию о будущих значениях Y.
Грэнджер также подчеркнул, что некоторые исследования, использующие тестирование «причинности по Грэнджеру» в областях, не связанных с экономикой, пришли к «смешным» выводам. [6] «Конечно, появилось много смехотворных статей», — сказал он в своей Нобелевской лекции. [7] Тем не менее, он остается популярным методом анализа причинности во временных рядах из-за его вычислительной простоты. [8] [9] Первоначальное определение причинности по Грэнджеру не учитывает скрытые сопутствующие эффекты и не охватывает мгновенные и нелинейные причинно-следственные связи, хотя для решения этих проблем было предложено несколько расширений. [8]
Мы говорим, что переменная X , которая эволюционирует с течением времени , является причиной по Грейнджеру другой эволюционирующей переменной Y, если предсказания значения Y, основанные на ее собственных прошлых значениях и на прошлых значениях X, лучше, чем предсказания Y, основанные только на собственных прошлых значениях Y.
Грейнджер определил причинно-следственную связь на основе двух принципов: [8] [10]
Учитывая эти два предположения о причинно-следственной связи, Грейнджер предложил проверить следующую гипотезу для выявления причинно-следственной связи :
где относится к вероятности, является произвольным непустым множеством, и и соответственно обозначают информацию, доступную на момент времени во всей вселенной, и информацию в модифицированной вселенной, в которой исключено. Если принята вышеуказанная гипотеза, мы говорим, что Грейнджер-причины . [8] [10]
Если временной ряд является стационарным процессом , тест выполняется с использованием значений уровня двух (или более) переменных. Если переменные нестационарны, то тест выполняется с использованием первых (или более высоких) разностей. Количество включаемых лагов обычно выбирается с использованием информационного критерия, такого как информационный критерий Акаике или информационный критерий Шварца . Любое конкретное лаговое значение одной из переменных сохраняется в регрессии, если (1) оно значимо согласно t-критерию, и (2) оно и другие лаговые значения переменной совместно добавляют объяснительную силу к модели согласно F-критерию. Тогда нулевая гипотеза об отсутствии причинности по Грейнджеру не отвергается, если и только если в регрессии не были сохранены лаговые значения объясняющей переменной.
На практике может оказаться, что ни одна из переменных по Грейнджеру не является причиной другой, или что каждая из двух переменных по Грейнджеру является причиной другой.
Пусть y и x будут стационарными временными рядами. Чтобы проверить нулевую гипотезу о том, что x не является причиной y по Грейнджеру , сначала находят соответствующие запаздывающие значения y для включения в одномерную авторегрессию y :
Далее авторегрессия дополняется включением запаздывающих значений x :
В этой регрессии сохраняются все запаздывающие значения x , которые индивидуально значимы согласно их t-статистике, при условии, что в совокупности они добавляют объяснительную силу к регрессии согласно F-тесту (нулевая гипотеза которого не является объяснительной силой, совместно добавленной x ). В обозначениях вышеприведенной расширенной регрессии p является наименьшей, а q — наибольшей длиной лага, для которой запаздывающее значение x является значимым.
Нулевая гипотеза о том, что x не является причиной y по Грейнджеру, не отвергается тогда и только тогда, когда в регрессии не сохраняются запаздывающие значения x .
Многомерный анализ причинности по Грейнджеру обычно выполняется путем подгонки векторной авторегрессионной модели (VAR) под временной ряд. В частности, пусть для будет -мерным многомерным временным рядом. Причинность по Грейнджеру выполняется путем подгонки VAR-модели с временными задержками следующим образом:
где — белый гауссовский случайный вектор, а — матрица для каждого . Временной ряд называется причиной Грейнджера другого временного ряда , если хотя бы один из элементов для значительно больше нуля (по абсолютной величине). [11]
Вышеуказанные линейные методы подходят для проверки причинности по Грейнджеру в среднем. Однако они не способны обнаружить причинность по Грейнджеру в более высоких моментах, например, в дисперсии. Непараметрические тесты на причинность по Грейнджеру предназначены для решения этой проблемы. [12] Определение причинности по Грейнджеру в этих тестах является общим и не включает никаких предположений моделирования, таких как линейная авторегрессионная модель. Непараметрические тесты на причинность по Грейнджеру могут использоваться в качестве диагностических инструментов для построения лучших параметрических моделей , включая моменты более высокого порядка и/или нелинейность. [13]
Как следует из названия, причинность по Грейнджеру не обязательно является истинной причинностью. Фактически, тесты причинности по Грейнджеру соответствуют только определению причинности по Юму , которое идентифицирует причинно-следственные связи с постоянными связями. [14] Если и X , и Y управляются общим третьим процессом с разными задержками, то все равно можно не отвергнуть альтернативную гипотезу причинности по Грейнджеру. Тем не менее, манипулирование одной из переменных не изменит другую. Действительно, тесты причинности по Грейнджеру предназначены для обработки пар переменных и могут давать вводящие в заблуждение результаты, когда истинная связь включает три или более переменных. Сказав это, было высказано мнение, что, учитывая вероятностный взгляд на причинность, причинность по Грейнджеру можно считать истинной причинностью в этом смысле, особенно если принять во внимание «отсеивающее» понятие вероятностной причинности Райхенбаха. [15] Другими возможными источниками ошибочных результатов теста являются: (1) недостаточно частая или слишком частая выборка, (2) нелинейная причинно-следственная связь, (3) нестационарность и нелинейность временного ряда и (4) существование рациональных ожиданий. [14] Похожий тест с большим количеством переменных можно применить с векторной авторегрессией .
Обоснованность теста причинности Грейнджера была оспорена в академической литературе [16] в статье, в которой утверждалось, что «даже самое фундаментальное требование, лежащее в основе любого возможного определения причинности, не удовлетворяется тестом причинности Грейнджера... любое определение причинности должно ссылаться на предсказание будущего из прошлого... мы обнаруживаем, что Грейнджер также позволяет «предсказывать» прошлое из будущего».
Был разработан метод причинности по Грейнджеру, который не чувствителен к отклонениям от предположения, что ошибка распределена нормально. [17] Этот метод особенно полезен в финансовой экономике, поскольку многие финансовые переменные распределены ненормально. [18] Недавно в литературе было предложено тестирование асимметричной причинности, чтобы отделить причинное влияние положительных изменений от отрицательных. [19] Также доступно расширение тестирования (не)причинности по Грейнджеру на панельные данные. [20] Модифицированный тест причинности по Грейнджеру, основанный на типе GARCH (обобщенная авторегрессионная условная гетероскедастичность) моделей временных рядов с целыми значениями, доступен во многих областях. [21] [22]
Расширение причинности Грейнджера для включения ее динамической, изменяющейся во времени природы позволяет более тонко понимать, как причинно-следственные связи в данных временных рядов развиваются с течением времени. [23] Методология использует рекурсивные методы, такие как окна Forward Expanding (FE), Rolling (RO) и Recursive Evolving (RE), чтобы преодолеть ограничения традиционных тестов причинности Грейнджера и понять изменения в причинно-следственных связях в разные периоды. [24] Центральным аспектом этой методологии является команда «tvgc» в Stata. [23] Эмпирические приложения, такие как данные, включающие транзакционные сборы и экономические подсистемы в Ethereum, подчеркивают динамическую природу экономических связей с течением времени. [25]
Долгое время считалось, что разные области мозга специфичны для конкретных задач; что структурная связь, локальная для определенной области, каким-то образом диктует функцию этой части. Собирая работы, которые выполнялись в течение многих лет, произошел переход к другому, сетецентрическому подходу к описанию потока информации в мозге. Объяснение функции начинает включать концепцию сетей, существующих на разных уровнях и в разных местах мозга. [26] Поведение этих сетей можно описать недетерминированными процессами, которые развиваются с течением времени. То есть, при наличии одного и того же входного стимула вы не получите один и тот же выход от сети. Динамика этих сетей регулируется вероятностями, поэтому мы относимся к ним как к стохастическим (случайным) процессам , чтобы мы могли зафиксировать эти виды динамики между различными областями мозга.
Различные методы получения некоторой меры потока информации из активности нейрона и его окружающего ансамбля были исследованы в прошлом, но они ограничены в типах выводов, которые могут быть сделаны, и дают мало понимания направленного потока информации, его размера эффекта и того, как он может меняться со временем. [27] Недавно причинность Грейнджера была применена для решения некоторых из этих проблем. [28] Проще говоря, изучается, как лучше всего предсказать будущее нейрона: используя либо весь ансамбль, либо весь ансамбль, за исключением определенного целевого нейрона. Если предсказание ухудшается за счет исключения целевого нейрона, то мы говорим, что он имеет «g-причинную» связь с текущим нейроном.
Предыдущие методы причинности по Грейнджеру могли работать только с непрерывными данными, поэтому анализ записей нейронных импульсных последовательностей включал преобразования, которые в конечном итоге изменяли стохастические свойства данных, косвенно изменяя обоснованность выводов, которые можно было из них сделать. Однако в 2011 году была предложена новая универсальная структура причинности по Грейнджеру, которая могла напрямую работать с любой модальностью, включая нейронные импульсные последовательности. [27]
Данные о нейронных спайках можно смоделировать как точечный процесс . Временной точечный процесс — это стохастический временной ряд двоичных событий, происходящих в непрерывном времени. Он может принимать только два значения в каждый момент времени, указывая, произошло ли событие на самом деле. Этот тип двоичного представления информации подходит для активности нейронных популяций , поскольку потенциал действия одного нейрона имеет типичную форму волны. Таким образом, то, что несет фактическую информацию, выводимую нейроном, — это возникновение «спайка», а также время между последовательными спайками. Используя этот подход, можно абстрагировать поток информации в нейронной сети, чтобы он был просто временем спайков для каждого нейрона в течение периода наблюдения. Точечный процесс может быть представлен либо синхронизацией самих всплесков, либо временем ожидания между всплесками, с использованием процесса подсчета, либо, если время достаточно дискретизировано, чтобы гарантировать, что в каждом окне может произойти только одно событие, то есть один временной интервал может содержать только одно событие, как набор единиц и нулей, что очень похоже на двоичный код. [ необходима цитата ]
Одной из самых простых моделей нейронных импульсов является процесс Пуассона . Однако он ограничен тем, что не имеет памяти. Он не учитывает историю импульсов при расчете текущей вероятности срабатывания. Однако нейроны демонстрируют фундаментальную (биофизическую) зависимость от истории посредством своих относительных и абсолютных рефрактерных периодов. Чтобы решить эту проблему, используется условная функция интенсивности для представления вероятности нейронного импульса, обусловленного его собственной историей. Условная функция интенсивности выражает мгновенную вероятность срабатывания и неявно определяет полную вероятностную модель для точечного процесса. Она определяет вероятность за единицу времени. Поэтому, если эта единица времени взята достаточно малой, чтобы гарантировать, что только один импульс может произойти в этом временном окне, то наша условная функция интенсивности полностью определяет вероятность того, что данный нейрон сработает в определенное время. [ необходима цитата ]
Разработаны программные пакеты для измерения «причинности по Грейнджеру» на Python и R :