Причинно-следственная модель

В метафизике каузальная модель (или структурная каузальная модель ) — это концептуальная модель , описывающая каузальные механизмы системы . При разработке каузальной модели могут использоваться несколько типов каузальных обозначений . Каузальные модели могут улучшить дизайн исследования, предоставляя четкие правила для принятия решения о том , какие независимые переменные необходимо включить/контролировать.

Они могут позволить получить ответы на некоторые вопросы на основе существующих наблюдательных данных без необходимости проведения интервенционного исследования, такого как рандомизированное контролируемое исследование . Некоторые интервенционные исследования нецелесообразны по этическим или практическим причинам, что означает, что без причинно-следственной модели некоторые гипотезы не могут быть проверены.

Причинно-следственные модели могут помочь с вопросом внешней валидности (применимы ли результаты одного исследования к неизученным популяциям). Причинно-следственные модели могут позволить объединить данные из нескольких исследований (в определенных обстоятельствах) для ответа на вопросы, на которые нельзя ответить с помощью какого-либо отдельного набора данных.

Причинно-следственные модели нашли применение в обработке сигналов , эпидемиологии и машинном обучении . ^[2]

Определение

Причинные модели — это математические модели, представляющие причинные связи в рамках отдельной системы или популяции. Они облегчают выводы о причинных связях из статистических данных. Они могут многому нас научить в области эпистемологии причинности и в отношении причинности и вероятности. Они также применялись к темам, представляющим интерес для философов, таким как логика контрфактуальностей, теория принятия решений и анализ фактической причинности. ^[3]
— Стэнфордская энциклопедия философии

Джуда Перл определяет причинно-следственную модель как упорядоченную тройку , где U — набор экзогенных переменных , значения которых определяются факторами вне модели; V — набор эндогенных переменных, значения которых определяются факторами внутри модели; а E — набор структурных уравнений , которые выражают значение каждой эндогенной переменной как функцию значений других переменных в U и V. ^[2] $\langle U,V,E\rangle$

История

Аристотель определил таксономию причинности, включая материальные, формальные, эффективные и конечные причины. Юм отверг таксономию Аристотеля в пользу контрфактуальностей . В какой-то момент он отрицал, что объекты обладают «силами», которые делают один причиной, а другой следствием. Позже он принял «если бы не было первого объекта, то и второго никогда бы не существовало» (« but-for » причинность). ^[4]

В конце 19 века начала формироваться дисциплина статистики. После многолетних усилий по выявлению причинно-следственных правил для таких областей, как биологическое наследование, Гальтон ввел концепцию средней регрессии (олицетворенной спадом в спорте на втором курсе), которая позже привела его к непричинной концепции корреляции . ^[4]

Будучи позитивистом , Пирсон исключил понятие причинности из большей части науки как недоказуемый частный случай ассоциации и ввел коэффициент корреляции как метрику ассоциации. Он писал: «Сила как причина движения — это то же самое, что бог дерева как причина роста», и что причинность была всего лишь «фетишем среди непостижимых тайн современной науки». Пирсон основал Biometrika и Биометрическую лабораторию в Университетском колледже Лондона , которая стала мировым лидером в области статистики. ^[4]

В 1908 году Харди и Вайнберг решили проблему стабильности признаков , которая заставила Гальтона отказаться от причинности, возродив менделевское наследование . ^[4]

В 1921 году анализ путей Райта стал теоретическим предшественником причинного моделирования и причинных графов . ^[5] Он разработал этот подход, пытаясь распутать относительное влияние наследственности , развития и окружающей среды на рисунок шерсти морских свинок . Он подкрепил свои тогда еретические утверждения, показав, как такой анализ может объяснить связь между массой тела морской свинки при рождении, внутриутробным временем и размером помета. Противодействие этим идеям со стороны выдающихся статистиков привело к тому, что их игнорировали в течение следующих 40 лет (за исключением селекционеров животных). Вместо этого ученые полагались на корреляции, отчасти по просьбе критика Райта (и ведущего статистика) Фишера . ^[4] Одним из исключений была Беркс , студентка, которая в 1926 году первой применила диаграммы путей для представления опосредующего влияния ( медиатора ) и утверждала, что сохранение постоянного медиатора приводит к ошибкам. Она, возможно, изобрела диаграммы путей независимо. ^[4]^{: 304}

В 1923 году Нейман представил концепцию потенциального результата, но его работа не была переведена с польского на английский язык до 1990 года. ^[4]^{: 271}

В 1958 году Кокс предупредил, что контроль переменной Z допустим только в том случае, если крайне маловероятно, что на нее повлияют независимые переменные. ^[4]^{: 154}

В 1960-х годах Дункан , Блэлок , Голдбергер и другие заново открыли анализ путей. Читая работу Блэлока о диаграммах путей, Дункан вспомнил лекцию Огберна двадцатью годами ранее, в которой упоминалась статья Райта, в которой, в свою очередь, упоминался Беркс. ^[4]^{: 308}

Социологи изначально называли причинные модели структурным моделированием уравнений , но как только это стало механическим методом, оно утратило свою полезность, что привело к тому, что некоторые практики отвергли любую связь с причинностью. Экономисты приняли алгебраическую часть анализа пути, назвав ее одновременным моделированием уравнений. Однако экономисты по-прежнему избегали приписывать своим уравнениям причинное значение. ^[4]

Спустя шестьдесят лет после своей первой статьи Райт опубликовал статью, в которой изложил ее суть, после критики Карлина и др., которые возражали, что она рассматривает только линейные зависимости и что надежные, не основанные на моделях представления данных более показательны. ^[4]

В 1973 году Льюис выступил за замену корреляции на причинность (контрфактуальность). Он ссылался на способность людей представлять себе альтернативные миры, в которых причина произошла или не произошла, и в которых следствие появилось только после своей причины. ^[4]^{: 266} В 1974 году Рубин ввел понятие «потенциальных результатов» как языка для постановки причинных вопросов. ^[4]^{: 269}

В 1983 году Картрайт предложил, чтобы любой фактор, который «причинно связан» с эффектом, обусловливался, выходя за рамки простой вероятности как единственного ориентира. ^[4]^{: 48}

В 1986 году Барон и Кенни представили принципы обнаружения и оценки посредничества в системе линейных уравнений. По состоянию на 2014 год их статья была 33-й по частоте цитирования за все время. ^[4]^{: 324} В том же году Гринланд и Робинс представили подход «заменяемости» к обработке искажений путем рассмотрения контрфактуальности. Они предложили оценить, что бы произошло с группой лечения, если бы они не получили лечение, и сравнить этот результат с результатом контрольной группы. Если они совпадали, искажения считались отсутствующими. ^[4]^{: 154}

Лестница причинно-следственной связи

Причинная метамодель Перла включает в себя трехуровневую абстракцию, которую он называет лестницей причинности. Самый низкий уровень, Ассоциация (видение/наблюдение), подразумевает восприятие закономерностей или шаблонов во входных данных, выраженных в виде корреляций. Средний уровень, Вмешательство (действие), предсказывает последствия преднамеренных действий, выраженных в виде причинно-следственных связей. Самый высокий уровень, Контрфактуальность (воображение), включает в себя построение теории (части) мира, которая объясняет, почему определенные действия имеют определенные последствия и что происходит при отсутствии таких действий. ^[4]

Ассоциация

Один объект ассоциируется с другим, если наблюдение одного изменяет вероятность наблюдения другого. Пример: покупатели, которые покупают зубную пасту, с большей вероятностью купят также зубную нить. Математически:

P(\mathrm {нить} |\mathrm {зубная паста})

или вероятность (покупки) зубной нити при (покупке) зубной пасты. Ассоциации также можно измерить, вычислив корреляцию двух событий. Ассоциации не имеют причинно-следственных связей. Одно событие может вызвать другое, может быть верным обратное, или оба события могут быть вызваны каким-то третьим событием (недовольный гигиенист стыдит покупателя, заставляя его лучше ухаживать за полостью рта). ^[4]

Вмешательство

Этот уровень утверждает конкретные причинно-следственные связи между событиями. Причинность оценивается путем экспериментального выполнения некоторого действия, которое влияет на одно из событий. Пример: после удвоения цены зубной пасты, какова будет новая вероятность покупки? Причинность не может быть установлена путем изучения истории (изменений цен), поскольку изменение цены могло произойти по какой-то другой причине, которая сама по себе могла повлиять на второе событие (тариф, который увеличивает цену обоих товаров). Математически:

P(\mathrm {нить} |do (\mathrm {зубная паста}))

где do — оператор, который сигнализирует об экспериментальном вмешательстве (удвоении цены). ^[4] Оператор указывает на выполнение минимального изменения в мире, необходимого для создания желаемого эффекта, «мини-операцию» на модели с минимальными изменениями по сравнению с реальностью. ^[6]

Контрфактуальные факты

Самый высокий уровень, контрфактуальный, предполагает рассмотрение альтернативной версии прошлого события или того, что могло бы произойти при других обстоятельствах для той же экспериментальной единицы. Например, какова вероятность того, что если бы магазин удвоил цену на зубную нить, покупатель, покупающий зубную пасту, все равно купил бы ее?

P(\mathrm {нить} |\mathrm {зубная паста}, 2*\mathrm {цена})

Контрфактуальные утверждения могут указывать на существование причинно-следственной связи. Модели, которые могут отвечать контрфактуальным утверждениям, позволяют осуществлять точные вмешательства, последствия которых можно предсказать. В крайнем случае такие модели принимаются как физические законы (как в законах физики, например, инерции, которая гласит, что если сила не приложена к неподвижному объекту, он не будет двигаться). ^[4]

Причинность

Причинность против корреляции

Статистика вращается вокруг анализа взаимосвязей между несколькими переменными. Традиционно эти взаимосвязи описываются как корреляции , ассоциации без каких-либо подразумеваемых причинно-следственных связей. Причинно-следственные модели пытаются расширить эту структуру, добавляя понятие причинно-следственных связей, в которых изменения одной переменной вызывают изменения других. ^[2]

Определения причинности двадцатого века основывались исключительно на вероятностях/ассоциациях. Одно событие ( ) считалось причиной другого, если оно повышало вероятность другого ( ). Математически это выражается как: $X$ $Y$

P(Y|X)>P(Y)

Такие определения неадекватны, поскольку другие отношения (например, общая причина для и ) могут удовлетворять условию. Причинность имеет отношение ко второй ступени лестницы. Ассоциации находятся на первой ступени и предоставляют только доказательства для последней. ^[4] $X$ $Y$

Более позднее определение попыталось устранить эту неоднозначность, обуславливая фоновые факторы. Математически:

P(Y|X,K=k)>P(Y|K=k)

где — набор фоновых переменных, а представляет значения этих переменных в определенном контексте. Однако требуемый набор фоновых переменных неопределен (множественные наборы могут увеличить вероятность), пока вероятность является единственным критерием ^[^{необходимо разъяснение}^] . ^[4] $K$ $k$

Другие попытки определить причинность включают причинность по Грейнджеру , статистическую проверку гипотезы о том, что причинность (в экономике ) можно оценить путем измерения способности предсказывать будущие значения одного временного ряда, используя предыдущие значения другого временного ряда. ^[4]

Типы

Причина может быть необходимой, достаточной, способствующей или их комбинацией. ^[7]

Необходимый

Для того, чтобы x был необходимой причиной y , наличие y должно подразумевать предшествующее возникновение x . Однако наличие x не подразумевает, что y произойдет. ^[8] Необходимые причины также известны как причины «но», например, y не произошло бы, если бы не возникновение x . ^[4]^{: 261}

Достаточные причины

Для того, чтобы x был достаточной причиной y , наличие x должно подразумевать последующее возникновение y . Однако другая причина z может независимо вызывать y . Таким образом, наличие y не требует предшествующего возникновения x . ^[8]

Сопутствующие причины

Для того, чтобы x был сопутствующей причиной y , наличие x должно увеличить вероятность y . Если вероятность составляет 100%, то x вместо этого называется достаточным. Также может быть необходима сопутствующая причина. ^[9]

Модель

Диаграмма причинно-следственных связей

Причинно-следственная диаграмма — это направленный граф , отображающий причинно-следственные связи между переменными в причинно-следственной модели. Причинно-следственная диаграмма включает в себя набор переменных (или узлов ). Каждый узел соединен стрелкой с одним или несколькими другими узлами, на которые он оказывает причинное влияние. Наконечник стрелки обозначает направление причинно-следственной связи, например, стрелка, соединяющая переменные , а наконечник стрелки указывает на то, что изменение в вызывает изменение в (с соответствующей вероятностью). Путь — это обход графа между двумя узлами, следующий за причинными стрелками. ^[4] $A$ $B$ $B$ $A$ $B$

Причинно-следственные диаграммы включают в себя причинно-следственные диаграммы , направленные ациклические графы и диаграммы Ишикавы . ^[4]

Причинно-следственные диаграммы независимы от количественных вероятностей, которые их информируют. Изменения этих вероятностей (например, из-за технологических усовершенствований) не требуют изменений в модели. ^[4]

Элементы модели

Причинно-следственные модели имеют формальные структуры с элементами, обладающими определенными свойствами. ^[4]

Модели соединений

Три типа соединений трех узлов — это линейные цепи, разветвленные вилки и сливающиеся коллайдеры. ^[4]

Цепь

Цепи — это прямые линии связи со стрелками, указывающими от причины к следствию. В этой модели является посредником, поскольку он опосредует изменение, которое в противном случае имело бы место на . ^[4]^{: 113} $B$ $A$ $C$

A\rightarrow B\rightarrow C

Вилка

В развилках одна причина имеет несколько следствий. Два следствия имеют общую причину. Существует (непричинная) ложная корреляция между и , которая может быть устранена путем обусловливания (для определенного значения ). ^[4]^{: 114} $A$ $C$ $B$ $B$

A\leftarrow B\rightarrow C

«Обусловливание » означает «задано » (т.е. задано значение ). $B$ $B$ $B$

Разработка вилки является запутывающим фактором:

A\leftarrow B\rightarrow C\rightarrow A

В таких моделях является общей причиной и (которая также вызывает ), что делает конфаундер ^[^{необходимо разъяснение}^] . ^[4]^{: 114} $B$ $A$ $C$ $A$ $B$

Коллайдер

В коллайдерах несколько причин влияют на один результат. Обусловливание (для определенного значения ) часто выявляет некаузальную отрицательную корреляцию между и . Эта отрицательная корреляция была названа смещением коллайдера и эффектом «объяснения», поскольку объясняет корреляцию между и . ^[4]^{: 115} Корреляция может быть положительной в случае, когда вклады от обоих и необходимы для влияния на . ^[4]^{: 197} $B$ $B$ $A$ $C$ $B$ $A$ $C$ $A$ $C$ $B$

A\rightarrow B\leftarrow C

Типы узлов

Посредник

Узел-посредник изменяет влияние других причин на результат (в отличие от простого влияния на результат). ^[4]^{: 113} Например, в приведенном выше примере цепочки является посредником, поскольку он изменяет влияние (косвенной причины ) на (результат). $B$ $A$ $C$ $C$

Смутитель

Узел-конфаундер влияет на несколько результатов, создавая положительную корреляцию между ними. ^[4]^{: 114}

Инструментальная переменная

Инструментальная переменная – это та, которая: ^[4]^{: 246}

имеет путь к результату;
не имеет другого пути к причинным переменным;
не оказывает прямого влияния на результат.

Коэффициенты регрессии могут служить оценками причинного эффекта инструментальной переменной на результат, пока этот эффект не является смешанным. Таким образом, инструментальные переменные позволяют количественно оценить причинные факторы без данных о смешанных факторах. ^[4]^{: 249}

Например, если взять модель:

Z\rightarrow X\rightarrow Y\leftarrow U\rightarrow X

$Z$ является инструментальной переменной, поскольку она имеет путь к результату и не смешана, например, с помощью . $Y$ $U$

В приведенном выше примере, если и принимают двоичные значения, то предположение, что не выполняется, называется монотонностью ^[^{необходимо разъяснение}^] . ^[4]^{: 253} $Z$ $X$ $Z=0,X=1$

Усовершенствования техники ^{[ требуется разъяснение ]} включают создание инструмента ^{[ требуется разъяснение ]} путем создания условий для другой переменной ^{[ требуется разъяснение ]} для блокировки ^{[ требуется разъяснение ]} путей ^{[ требуется разъяснение ]} между инструментом и фактором, вызывающим затруднения ^{[ требуется разъяснение ]} и объединения нескольких переменных для формирования единого инструмента ^{[ требуется разъяснение ]} . ^[4]^{: 257}

Менделевская рандомизация

Определение: Менделевская рандомизация использует измеренные вариации в генах с известной функцией для изучения причинно-следственной связи модифицируемого воздействия с заболеванием в наблюдательных исследованиях . ^[10]^[11]

Поскольку гены изменяются случайным образом в разных популяциях, наличие гена обычно квалифицируется как инструментальная переменная, подразумевая, что во многих случаях причинно-следственную связь можно количественно оценить с помощью регрессии в наблюдательном исследовании. ^[4]^{: 255}

Ассоциации

Условия независимости

Условия независимости — это правила для принятия решения о том, являются ли две переменные независимыми друг от друга. Переменные независимы, если значения одной из них не влияют напрямую на значения другой. Несколько причинно-следственных моделей могут разделять условия независимости. Например, модели

A\rightarrow B\rightarrow C

A\leftarrow B\rightarrow C

имеют одинаковые условия независимости, поскольку обусловленность на листьях и независима. Однако эти две модели не имеют одинакового значения и могут быть фальсифицированы на основе данных (то есть, если данные наблюдений показывают связь между и после обусловленности на , то обе модели неверны). И наоборот, данные не могут показать, какая из этих двух моделей верна, поскольку они имеют одинаковые условия независимости. $B$ $A$ $C$ $A$ $C$ $B$

Обусловливание переменной — это механизм проведения гипотетических экспериментов. Обусловливание переменной включает анализ значений других переменных для заданного значения условной переменной. В первом примере обусловливание подразумевает, что наблюдения для заданного значения не должны показывать никакой зависимости между и . Если такая зависимость существует, то модель неверна. Некаузальные модели не могут делать такие различия, потому что они не делают каузальных утверждений. ^[4]^{: 129–130} $B$ $B$ $A$ $C$

Конфаундер/деконфаундер

Существенным элементом дизайна корреляционного исследования является выявление потенциально искажающих влияний на изучаемую переменную, например, демографических. Эти переменные контролируются для устранения этих влияний. Однако правильный список искажающих переменных не может быть определен априори . Таким образом, возможно, что исследование может контролировать нерелевантные переменные или даже (косвенно) изучаемую переменную. ^[4]^{: 139}

Причинно-следственные модели предлагают надежную методику для определения соответствующих смешивающих переменных. Формально Z является смешивающим фактором, если «Y связан с Z через пути, не проходящие через X». Их часто можно определить с использованием данных, собранных для других исследований. Математически, если

P(Y|X)\neq P(Y|do(X))

X и Y смешаны (из-за некоторой переменной-конфаундера Z). ^[4]^{: 151}

Ранее, предположительно, неверные определения фактора, вызывающего сомнение, включали: ^[4]^{: 152}

«Любая переменная, которая коррелирует как с X, так и с Y».
Y ассоциируется с Z среди неэкспонированных.
Неколлапсируемость: разница между «грубым относительным риском и относительным риском, полученным после корректировки на потенциальный искажающий фактор».
Эпидемиологический: переменная, связанная с X в популяции в целом и связанная с Y среди людей, не подвергшихся воздействию X.

Последнее имеет недостаток, поскольку в модели:

X\rightarrow Z\rightarrow Y

Z соответствует определению, но является посредником, а не фактором, искажающим результаты, и является примером контроля результата.

В модели

X\leftarrow A\rightarrow B\leftarrow C\rightarrow Y

Традиционно B считался фактором, мешающим, поскольку он связан с X и Y, но не находится на причинно-следственной связи и не является потомком чего-либо на причинно-следственной связи. Контроль B приводит к тому, что он становится фактором, мешающим. Это известно как M-смещение. ^[4]^{: 161}

Регулировка задней двери

Для анализа причинного эффекта X на Y в причинной модели все переменные-конфаундеры должны быть рассмотрены (деконфаундинг). Чтобы определить набор конфаундеров, (1) каждый некаузальный путь между X и Y должен быть заблокирован этим набором; (2) без нарушения каких-либо причинных путей; и (3) без создания каких-либо ложных путей. ^[4]^{: 158}

Определение : бэкдор-путь от переменной X к Y — это любой путь от X к Y, который начинается со стрелки, указывающей на X. ^[4]^{: 158}

Определение : Для заданной упорядоченной пары переменных (X,Y) в модели набор переменных-конфаундеров Z удовлетворяет критерию бэкдора, если (1) ни одна переменная-конфаундер Z не является потомком X и (2) все пути бэкдора между X и Y блокируются набором переменных-конфаундеров.

Если критерий бэкдора выполняется для (X,Y), X и Y деконфаундируются набором переменных-конфаундеров. Нет необходимости контролировать какие-либо переменные, кроме конфаундеров. ^[4]^{: 158} Критерий бэкдора является достаточным, но не необходимым условием для нахождения набора переменных Z для деконфаундирования анализа причинного эффекта X на y.

Когда причинно-следственная модель является правдоподобным представлением реальности и критерий бэкдора выполняется, то частичные коэффициенты регрессии могут использоваться как (причинно-следственные) коэффициенты пути (для линейных отношений). ^[4]^{: 223}^[12]

P(Y|do(X))=\textstyle \sum _{z}\displaystyle P(Y|X,Z=z)P(Z=z)

^[4]^{: 227}

Регулировка передней двери

Если элементы блокирующего пути не поддаются наблюдению, бэкдор-путь не поддается вычислению, но если все прямые пути из имеют элементы , которые не соединяются открытыми путями , то , множество всех s, может измерять . Фактически, существуют условия, при которых может выступать в качестве прокси для . $X\to Y$ $z$ $z\to Y$ $Z$ $z$ $P(Y|do(X))$ $Z$ $X$

Определение : путь входа — это прямой причинный путь, для которого доступны данные для всех , ^[4]^{: 226} перехватывает все направленные пути к , нет незаблокированных путей от к , и все пути входа от к заблокированы . ^[13] $z\in Z$ $Z$ $X$ $Y$ $Z$ $Y$ $Z$ $Y$ $X$

Следующий пример преобразует выражение do в выражение do-free, обуславливая переменные по пути «входной двери». ^[4]^{: 226}

P(Y|do(X))=\textstyle \sum _{z}\left[\displaystyle P(Z=z|X)\textstyle \sum _{x}\displaystyle P(Y|X=x,Z=z)P(X=x)\right]

Предполагая, что данные для этих наблюдаемых вероятностей доступны, окончательную вероятность можно вычислить без эксперимента, независимо от существования других мешающих путей и без подстройки под бэкдор. ^[4]^{: 226}

Вмешательства

Запросы

Запросы — это вопросы, задаваемые на основе определенной модели. Обычно на них отвечают путем проведения экспериментов (вмешательств). Вмешательства принимают форму фиксации значения одной переменной в модели и наблюдения за результатом. Математически такие запросы имеют вид (из примера): ^[4]^{: 8}

P({\text{floss}}\vline do({\text{toothpaste}}))

где оператор do указывает, что эксперимент явно изменил цену зубной пасты. Графически это блокирует любые причинные факторы, которые в противном случае могли бы повлиять на эту переменную. Диаграммно это стирает все причинные стрелки, указывающие на экспериментальную переменную. ^[4]^{: 40}

Возможны более сложные запросы, в которых оператор do применяется (значение фиксируется) к нескольким переменным.

Интервенционное распределение

Делать исчисления

Исчисление do — это набор манипуляций, доступных для преобразования одного выражения в другое, с общей целью преобразования выражений, содержащих оператор do, в выражения, которые его не содержат. Выражения, не содержащие оператор do, можно оценить только на основе наблюдаемых данных, без необходимости экспериментального вмешательства, которое может быть дорогим, длительным или даже неэтичным (например, попросить субъектов начать курить). ^[4]^{: 231} Набор правил является полным (его можно использовать для вывода каждого истинного утверждения в этой системе). ^[4]^{: 237} Алгоритм может определить, вычислимо ли решение для данной модели за полиномиальное время . ^[4]^{: 238}

Правила

Исчисление включает три правила преобразования выражений условной вероятности с использованием оператора do.

Правило 1

Правило 1 разрешает добавлять или удалять наблюдения.: ^[4]^{: 235}

P(Y|do(X),Z,W)=P(Y|do(X),Z)

в случае, если набор переменных Z блокирует все пути от W до Y и все стрелки, ведущие в X, были удалены. ^[4]^{: 234}

Правило 2

Правило 2 разрешает замену вмешательства наблюдением и наоборот.: ^[4]^{: 235}

P(Y|do(X),Z)=P(Y|X,Z)

в случае, если Z удовлетворяет критерию бэкдора. ^[4]^{: 234}

Правило 3

Правило 3 разрешает удаление или добавление вмешательств.: ^[4]

P(Y|do(X))=P(Y)

в случае, когда нет причинно-следственных связей между X и Y. ^[4]^{: 234} ^{: 235}

Расширения

Правила не подразумевают, что любой запрос может иметь удаленные операторы do. В таких случаях может быть возможно заменить переменную, которая является объектом манипуляции (например, диета), на ту, которая не является таковой (например, холестерин в крови), которую затем можно преобразовать для удаления do. Пример:

P({\text{Heart disease}}|do({\text{blood cholesterol}}))=P({\text{Heart disease}}|do({\text{diet}}))

Контрфактуальные факты

Контрфактуальные предположения рассматривают возможности, которые не встречаются в данных, например, развился бы рак у некурящего, если бы он был заядлым курильщиком. Они являются самой высокой ступенью на лестнице причинности Перла.

Возможный результат

Определение: Потенциальный результат для переменной Y — это «значение, которое Y принял бы для отдельного ^{[ необходимо разъяснение ]} u , если бы X было присвоено значение x». Математически: ^[4]^{: 270}

Y_{X=x}(u)

или .

Y_{x}(u)

Потенциальный результат определяется на уровне отдельного человека . ^[4]^{: 270}

Традиционный подход к потенциальным результатам основан на данных, а не на моделях, что ограничивает его способность распутывать причинно-следственные связи. Он рассматривает причинно-следственные вопросы как проблемы отсутствия данных и дает неправильные ответы даже на стандартные сценарии. ^[4]^{: 275}

Причинно-следственный вывод

В контексте причинно-следственных моделей потенциальные результаты интерпретируются причинно, а не статистически.

Первый закон причинно-следственной связи гласит, что потенциальный результат

Y_{X}(u)

можно вычислить, изменив причинно-следственную модель M (удалив стрелки в X) и вычислив результат для некоторого x . Формально: ^[4]^{: 280}

Y_{X}(u)=Y_{Mx}(u)

Проведение контрфактуального

Исследование контрфактуального факта с использованием причинной модели включает три шага. ^[14] Подход действителен независимо от формы модельных отношений, линейных или иных. Когда модельные отношения полностью определены, можно вычислить точечные значения. В других случаях (например, когда доступны только вероятности) можно вычислить утверждение интервала вероятности, например, что некурящий x будет иметь 10-20% шанс заболеть раком. ^[4]^{: 279}

Учитывая модель:

Y\leftarrow X\rightarrow M\rightarrow Y\leftarrow U

можно применять уравнения для расчета значений A и C, полученные из регрессионного анализа или другого метода, подставляя известные значения из наблюдения и фиксируя значения других переменных (контрфактуальные). ^[4]^{: 278}

Похищать

Применить абдуктивное рассуждение ( логический вывод , который использует наблюдение для поиска наиболее простого/вероятного объяснения) для оценки u , заместителя ненаблюдаемых переменных для конкретного наблюдения, которое поддерживает контрфактуальное утверждение. ^[4]^{: 278} Вычислить вероятность u с учетом пропозициональных доказательств.

Действовать

Для конкретного наблюдения используйте оператор do, чтобы установить контрфактуальность (например, m = 0), изменив уравнения соответствующим образом. ^[4]^{: 278}

Предсказывать

Рассчитайте значения выходных данных ( y ), используя модифицированные уравнения. ^[4]^{: 278}

Медиация

Прямые и косвенные (опосредованные) причины можно различить только посредством проведения контрфактуальных исследований. ^[4]^{: 301} Понимание посредничества требует сохранения постоянного посредника при вмешательстве в прямую причину. В модели

$Y\leftarrow M\leftarrow X\rightarrow Y$

M опосредует влияние X на Y, в то время как X также оказывает непосредственное влияние на Y. Таким образом, M сохраняется постоянным, в то время как do(X) вычисляется.

Ошибка посредничества вместо этого подразумевает обусловленность посредника, если посредник и результат перепутаны, как в вышеприведенной модели.

Для линейных моделей косвенный эффект может быть вычислен путем умножения всех коэффициентов пути вдоль опосредованного пути. Общий косвенный эффект вычисляется путем суммирования отдельных косвенных эффектов. Для линейных моделей посредничество указывается, когда коэффициенты уравнения, подобранного без включения медиатора, значительно отличаются от уравнения, включающего его. ^[4]^{: 324}

Прямой эффект

В экспериментах на такой модели контролируемый прямой эффект (CDE) вычисляется путем принудительного задания значения медиатора M (do(M = 0)) и случайного назначения некоторых субъектов каждому из значений X (do(X=0), do(X=1), ...) и наблюдения за полученными значениями Y. ^[4]^{: 317}

CDE(0)=P(Y=1|do(X=1),do(M=0))-P(Y=1|do(X=0),do(M=0))

Каждому значению медиатора соответствует CDE.

Однако лучшим экспериментом будет вычисление естественного прямого эффекта (NDE). Это эффект, определяемый путем оставления связи между X и M нетронутой и вмешательства в связь между X и Y. ^[4]^{: 318}

NDE=P(Y_{M=M0}=1|do(X=1))-P(Y_{M=M0}=1|do(X=0))

Например, рассмотрим прямой эффект увеличения количества визитов к стоматологу-гигиенисту (X) с одного раза в два года до одного раза в год, что стимулирует использование зубной нити (M). Десны (Y) становятся здоровее либо из-за гигиениста (прямое), либо из-за использования зубной нити (опосредованное/косвенное). Эксперимент заключается в том, чтобы продолжать использовать зубную нить, пропуская визит к гигиенисту.

Косвенный эффект

Косвенное влияние X на Y — это «увеличение, которое мы увидим в Y, сохраняя X постоянным и увеличивая M до любого значения, которого M достигнет при единичном увеличении X». ^[4]^{: 328}

Косвенные эффекты нельзя «контролировать», поскольку прямой путь нельзя отключить, удерживая другую переменную постоянной. Естественный косвенный эффект (NIE) — это эффект на здоровье десен (Y) от использования зубной нити (M). NIE рассчитывается как сумма (случаев использования зубной нити и отсутствия зубной нити) разницы между вероятностью использования зубной нити с гигиенистом и без него, или: ^[4]^{: 321}

NIE=\sum _{m}[P(M=m|X=1)-P(M=m|X=0)]xxP(Y=1|X=0,M=m)

Вышеуказанный расчет NDE включает контрфактуальные индексы ( ). Для нелинейных моделей, казалось бы, очевидная эквивалентность ^[4]^{: 322} $Y_{M=M0}$

{\mathsf {Total\ effect=Direct\ effect+Indirect\ effect}}

не применяется из-за аномалий, таких как пороговые эффекты и двоичные значения. Однако,

{\mathsf {Total\ effect}}(X=0\rightarrow X=1)=NDE(X=0\rightarrow X=1)-\ NIE(X=1\rightarrow X=0)

работает для всех модельных отношений (линейных и нелинейных). Это позволяет затем рассчитывать NDE непосредственно из данных наблюдений, без вмешательств или использования контрфактуальных индексов. ^[4]^{: 326}

Транспортабельность

Причинные модели предоставляют средство для интеграции данных между наборами данных, известное как транспорт, даже если причинные модели (и связанные с ними данные) различаются. Например, данные опроса могут быть объединены с рандомизированными контролируемыми данными испытаний. ^[4]^{: 352} Транспорт предлагает решение вопроса внешней валидности , то есть того, может ли исследование применяться в другом контексте.

Если две модели совпадают по всем соответствующим переменным, и известно, что данные из одной модели не предвзяты, данные из одной популяции могут быть использованы для вывода выводов о другой. В других случаях, когда известно, что данные предвзяты, повторное взвешивание может позволить переносить набор данных. В третьем случае выводы могут быть сделаны из неполного набора данных. В некоторых случаях данные из исследований нескольких популяций могут быть объединены (посредством переноса), чтобы сделать выводы о неизмеренной популяции. В некоторых случаях объединение оценок (например, P(W|X)) из нескольких исследований может повысить точность вывода. ^[4]^{: 355}

Do-calculus предоставляет общий критерий для переноса: целевая переменная может быть преобразована в другое выражение посредством серии do-операций, которые не включают никаких «производящих разницу» переменных (тех, которые различают две популяции). ^[4]^{: 355} Аналогичное правило применяется к исследованиям, в которых участвуют относительно разные участники. ^[4]^{: 356}

Байесовская сеть

Любая причинно-следственная модель может быть реализована как байесовская сеть. Байесовские сети могут использоваться для предоставления обратной вероятности события (при заданном результате, каковы вероятности конкретной причины). Для этого требуется подготовка таблицы условных вероятностей, показывающей все возможные входы и результаты с их связанными вероятностями. ^[4]^{: 119}

Например, если задана модель с двумя переменными: «Болезнь» и «Тест» (для болезни), то таблица условных вероятностей принимает вид: ^[4]^{: 117}

Согласно этой таблице, при отсутствии у пациента заболевания вероятность положительного результата теста составляет 12%.

Хотя это и поддается решению для небольших задач, по мере увеличения числа переменных и связанных с ними состояний таблица вероятностей (и связанное с ней время вычислений) увеличивается экспоненциально. ^[4]^{: 121}

Байесовские сети используются в коммерческих целях в таких приложениях, как исправление ошибок в беспроводных данных и анализ ДНК. ^[4]^{: 122}

Инварианты/контекст

Другая концептуализация причинности включает понятие инвариантных отношений. В случае идентификации рукописных цифр форма цифры контролирует значение, поэтому форма и значение являются инвариантами. Изменение формы меняет значение. Другие свойства этого не делают (например, цвет). Эта инвариантность должна переноситься на наборы данных, созданные в разных контекстах (неинвариантные свойства формируют контекст). Вместо обучения (оценки причинности) с использованием объединенных наборов данных, обучение на одном и тестирование на другом может помочь отличить вариантные свойства от инвариантных. ^[15]

Смотрите также

Причинно-следственная система
Причинно-следственная сеть – байесовская сеть с явным требованием, чтобы связи были причинно-следственными.
Моделирование структурных уравнений – статистический метод проверки и оценки причинно-следственных связей.
Анализ пути (статистика)
Байесовская сеть
Причинно-следственная карта
Динамическое причинно-следственное моделирование
Причинно-следственная модель Рубина

Ссылки

^ Карл Фристон (февраль 2009 г.). «Причинное моделирование и мозговые связи в функциональной магнитно-резонансной томографии». PLOS Biology . 7 (2): e1000033. doi : 10.1371/journal.pbio.1000033 . PMC 2642881. PMID 19226186 .
^ abc Pearl 2009.
^ Хичкок, Кристофер (2018), «Причинные модели», в Zalta, Edward N. (ред.), The Stanford Encyclopedia of Philosophy (ред. осень 2018 г.), Metaphysics Research Lab, Stanford University , получено 08.09.2018
^ abcdefghijklmnopqrstu vwxyz aa ab ac ad ae af ag ah ai aj ak al am an ao ap aq ar as at au av aw ax ay az ba bb bc bd be bf bg bh bi bj bk bl bm bn bo bp bq br bs bt bu bv bw bx by bz ca cb cc cd ce cf cg ch ci cj ck cl Pearl, Judea ; Mackenzie, Dana (2018-05-15). Книга «Почему?»: Новая наука о причине и следствии. Базовые книги. ISBN 9780465097616.
^ Окаша, Самир (2012-01-12). «Причинность в биологии». В Beebee, Helen; Hitchcock, Christopher; Menzies, Peter (ред.). Оксфордский справочник по причинности. Том 1. OUP Oxford. doi :10.1093/oxfordhb/9780199279739.001.0001. ISBN 9780191629464.
^ Pearl, Judea (2021). «Причинный и контрфактуальный вывод». В Knauff, Markus; Spohn, Wolfgang (ред.). Справочник по рациональности . MIT Press . doi : 10.7551/mitpress/11252.003.0044. ISBN 9780262366175.
^ Эпп, Сусанна С. (2004). Дискретная математика с приложениями. Томсон-Брукс/Коул. С. 25–26. ISBN 9780534359454.
^ ab "Причинное рассуждение". www.istarassessment.org . Получено 2 марта 2016 г. .
^ Ригельман, Р. (1979). «Сопутствующая причина: ненужная и недостаточная». Postgraduate Medicine . 66 (2): 177–179. doi :10.1080/00325481.1979.11715231. PMID 450828.
^ Катан МБ (март 1986). «Изоформы аполипопротеина E, сывороточный холестерин и рак». Lancet . 1 (8479): 507–8. doi :10.1016/s0140-6736(86)92972-7. PMID 2869248. S2CID 38327985.
^ Смит, Джордж Дэйви; Эбрахим, Шах (2008). Менделевская рандомизация: генетические варианты как инструменты для усиления причинно-следственных выводов в наблюдательных исследованиях. National Academies Press (США).
^ Pearl 2009, глава 3-3. Управление искажениями, вызывающими искажения.
^ Перл, Джудеа; Глимур, Маделин; Джуэлл, Николас П. (7 марта 2016 г.). Причинно-следственные выводы в статистике: Учебник . John Wiley & Sons. ISBN 978-1-119-18684-7.
↑ Перл 2009, стр. 207.
^ Хао, Карен (8 мая 2019 г.). «Глубокое обучение может раскрыть, почему мир устроен так, а не иначе». MIT Technology Review . Получено 10 февраля 2020 г.

Источники

Pearl, Judea (2009-09-14). Причинность. Cambridge University Press. ISBN 9781139643986.

Внешние ссылки

Pearl, Judea (26.02.2010). «Введение в причинно-следственные связи». Международный журнал биостатистики . 6 (2): Статья 7. doi : 10.2202/1557-4679.1203. ISSN 1557-4679. PMC 2836213. PMID 20305706 .
Причинно-следственное моделирование в PhilPapers
Фальк, Дэн (17.03.2019). «Алгоритмы ИИ теперь потрясающе хороши в науке». Wired . ISSN 1059-1028 . Получено 20.03.2019 .
Модлин, Тим (2019-08-30). «Почему мир». Boston Review . Получено 2019-09-09 .
Хартнетт, Кевин (15 мая 2018 г.). «Чтобы построить по-настоящему интеллектуальные машины, научите их причинно-следственной связи». Журнал Quanta . Получено 19 сентября 2019 г.
^[1]

^ Изучение представлений с использованием каузальной инвариантности, ICLR, февраль 2020 г. , получено 10 февраля 2020 г.