Причинная модель

В философии науки причинная модель (или структурно-каузальная модель ) — это концептуальная модель , описывающая причинные механизмы системы . При разработке причинной модели можно использовать несколько типов причинных обозначений . Причинно-следственные модели могут улучшить дизайн исследования, предоставляя четкие правила для принятия решения о том, какие независимые переменные необходимо включать/контролировать.

Они могут позволить ответить на некоторые вопросы на основе существующих данных наблюдений без необходимости проведения интервенционного исследования, такого как рандомизированное контролируемое исследование . Некоторые интервенционные исследования неприемлемы по этическим или практическим причинам, а это означает, что без причинно-следственной модели некоторые гипотезы невозможно проверить.

Причинно-следственные модели могут помочь в вопросе внешней достоверности (применимы ли результаты одного исследования к неизученным группам населения). Причинно-следственные модели могут позволить объединить данные нескольких исследований (при определенных обстоятельствах) для ответа на вопросы, на которые не может ответить ни один отдельный набор данных.

Причинно-следственные модели нашли применение в обработке сигналов , эпидемиологии и машинном обучении . ^[2]

Определение

Причинные модели — это математические модели, представляющие причинно-следственные связи внутри отдельной системы или популяции. Они облегчают выводы о причинно-следственных связях на основе статистических данных. Они могут многому нас научить в области эпистемологии причинности и взаимосвязи между причинностью и вероятностью. Они также применялись к темам, интересующим философов, таким как логика контрфактов, теория принятия решений и анализ фактической причинно-следственной связи. ^[3]
- Стэнфордская энциклопедия философии

Джудея Перл определяет причинную модель как упорядоченную тройку , где U — набор экзогенных переменных , значения которых определяются факторами вне модели; V — набор эндогенных переменных, значения которых определяются факторами модели; и E представляет собой набор структурных уравнений , которые выражают значение каждой эндогенной переменной как функцию значений других переменных в U и V. ^[2] $\langle U,V,E\rangle$

История

Аристотель определил таксономию причинности, включая материальные, формальные, действенные и конечные причины. Юм отверг таксономию Аристотеля в пользу контрфактов . В какой-то момент он отрицал, что объекты обладают «силами», которые делают один причиной, а другой — следствием. Позже он принял «если бы первого объекта не было, то и второго никогда не существовало» («причинность « но-для »). ^[4]

В конце 19 века начала формироваться статистика. После многолетних усилий по выявлению причинных правил для таких областей, как биологическая наследственность, Гальтон представил концепцию регрессии средних (воплощенную в спаде второкурсников в спорте), которая позже привела его к непричинной концепции корреляции . ^[4]

Будучи позитивистом , Пирсон исключил из большей части науки понятие причинности как недоказуемого частного случая ассоциации и ввел коэффициент корреляции в качестве показателя ассоциации. Он писал: «Сила как причина движения — это то же самое, что древесный бог как причина роста», и эта причинность была всего лишь «фетишем среди непостижимых тайн современной науки». Пирсон основал «Биометрику» и лабораторию биометрии в Университетском колледже Лондона , которые стали мировым лидером в области статистики. ^[4]

В 1908 году Харди и Вайнберг решили проблему стабильности признаков , которая заставила Гальтона отказаться от причинно-следственной связи, возродив менделевское наследование . ^[4]

В 1921 году анализ путей Райта стал теоретическим предшественником причинного моделирования и причинных графов . ^[5] Он разработал этот подход, пытаясь разобраться в относительном влиянии наследственности , развития и окружающей среды на рисунок шерсти морских свинок . Он подкрепил свои тогдашние еретические утверждения, показав, как такие анализы могут объяснить взаимосвязь между массой морских свинок при рождении, внутриутробным периодом и размером помета. Противодействие этим идеям со стороны видных статистиков привело к тому, что их игнорировали в течение следующих 40 лет (за исключением животноводов). Вместо этого ученые полагались на корреляции, отчасти по указанию критика Райта (и ведущего статистика) Фишера . ^[4] Единственным исключением был Беркс , студент, который в 1926 году первым применил диаграммы путей для представления посреднического влияния ( посредника ) и утверждал, что сохранение константы посредника приводит к ошибкам. Возможно, она самостоятельно изобрела диаграммы путей. ^[4]^{: 304}

В 1923 году Нейман представил концепцию потенциального результата, но его статья не переводилась с польского на английский до 1990 года. ^[4]^{: 271}

В 1958 году Кокс предупредил, что контроль над переменной Z действителен только в том случае, если на нее маловероятно влияние независимых переменных. ^[4]^{: 154}

В 1960-х годах Дункан , Блэлок , Голдбергер и другие заново открыли анализ путей. Читая работу Блэлока о диаграммах путей, Дункан вспомнил лекцию Огберна двадцатью годами ранее, в которой упоминалась статья Райта, в которой, в свою очередь, упоминался Бёркс. ^[4]^{: 308}

Социологи первоначально называли причинные модели моделированием структурных уравнений , но как только этот метод стал механическим, он потерял свою полезность, что заставило некоторых практиков отвергнуть любую связь с причинностью. Экономисты приняли алгебраическую часть путевого анализа, назвав ее моделированием одновременных уравнений. Однако экономисты по-прежнему избегали придавать своим уравнениям причинно-следственный смысл. ^[4]

Через шестьдесят лет после своей первой статьи Райт опубликовал статью, в которой она резюмировалась, после критики Карлина и др., которые возражали, что она касается только линейных отношений и что надежное, свободное от моделей представление данных более показательно. ^[4]

В 1973 году Льюис выступал за замену корреляции причинностью без причинности (контрфактическими утверждениями). Он упомянул о способности людей представлять себе альтернативные миры, в которых причина возникает или не возникает и в которых следствие появляется только вслед за своей причиной. ^[4]^{: 266} В 1974 году Рубин ввел понятие «потенциальных результатов» как язык для постановки причинно-следственных вопросов. ^[4]^{: 269}

В 1983 году Картрайт предложил обуславливать любой фактор, «каузально релевантный» эффекту, выходя за рамки простой вероятности как единственного ориентира. ^[4]^{: 48}

В 1986 году Бэрон и Кенни представили принципы обнаружения и оценки посредничества в системе линейных уравнений. По состоянию на 2014 год их статья была 33-й по цитируемости за все время. ^[4]^{: 324} В том же году Гренландия и Робинс представили подход «обменимости» к устранению путаницы, рассматривая контрфакты. Они предложили оценить, что случилось бы с группой лечения, если бы они не получили лечение, и сравнить этот результат с результатом контрольной группы. Если они совпадали, считалось, что смешение отсутствует. ^[4]^{: 154}

Лестница причинно-следственной связи

Причинная метамодель Перла включает трехуровневую абстракцию, которую он называет лестницей причинности. Самый низкий уровень, Ассоциация (видение/наблюдение), предполагает ощущение закономерностей или закономерностей во входных данных, выраженных в виде корреляций. Средний уровень, Вмешательство (действие), предсказывает последствия преднамеренных действий, выраженные в виде причинно-следственных связей. Самый высокий уровень, Контрфакты (воображение), включает в себя построение теории (части) мира, которая объясняет, почему определенные действия имеют определенные последствия и что происходит в отсутствие таких действий. ^[4]

Ассоциация

Один объект связан с другим, если наблюдение одного меняет вероятность наблюдения другого. Пример: покупатели, покупающие зубную пасту, с большей вероятностью покупают также зубную нить. Математически:

P(\mathrm {нить} |\mathrm {зубная паста})

или вероятность (покупки) зубной нити при (покупке) зубной пасты. Ассоциации также можно измерить, вычислив корреляцию двух событий. Ассоциации не имеют причинно-следственной связи. Одно событие может вызвать другое, может быть наоборот, или оба события могут быть вызваны каким-то третьим событием (несчастный гигиенист стыдит покупателя, заставляя его лучше относиться к своей полости рта). ^[4]

Вмешательство

Этот уровень утверждает конкретные причинно-следственные связи между событиями. Причинно-следственная связь оценивается путем экспериментального выполнения какого-либо действия, влияющего на одно из событий. Пример: какова будет новая вероятность покупки после удвоения цены на зубную пасту? Причинно-следственную связь невозможно установить путем изучения истории (изменений цен), поскольку изменение цены могло произойти по какой-то другой причине, которая сама по себе могла повлиять на второе событие (тариф, который увеличивает цену обоих товаров). Математически:

{\ displaystyle P (\ mathrm {нить} | do (\ mathrm {зубная паста}))}

где do — оператор, сигнализирующий об экспериментальном вмешательстве (удвоении цены). ^[4] Оператор указывает на выполнение минимального изменения в мире, необходимого для создания желаемого эффекта, «мини-операции» на модели с как можно меньшими отклонениями от реальности. ^[6]

Контрфакты

Самый высокий уровень, контрфактический, предполагает рассмотрение альтернативной версии прошлого события или того, что могло бы произойти при других обстоятельствах для одной и той же экспериментальной единицы. Например, какова вероятность того, что, если бы магазин удвоил цену на зубную нить, покупатель зубной пасты все равно купил бы ее?

P(\mathrm {нить} |\mathrm {зубная паста}, 2*\mathrm {цена})

Контрфакты могут указывать на наличие причинно-следственной связи. Модели, которые могут отвечать на противоречивые факты, позволяют проводить точные вмешательства, последствия которых можно предсказать. В крайнем случае, такие модели принимаются как физические законы (как в законах физики, например, инерции, которая гласит, что если к неподвижному объекту не приложена сила, он не будет двигаться). ^[4]

Причинность

Причинность против корреляции

Статистика вращается вокруг анализа взаимосвязей между несколькими переменными. Традиционно эти отношения описываются как корреляции , ассоциации без каких-либо подразумеваемых причинно-следственных связей. Причинно-следственные модели пытаются расширить эту структуру, добавляя понятие причинно-следственных связей, в которых изменения одной переменной вызывают изменения других. ^[2]

Определения причинности двадцатого века основывались исключительно на вероятностях/ассоциациях. Считалось, что одно событие ( ) вызывает другое, если оно увеличивает вероятность другого ( ). Математически это выражается так: $X$ $Y$

P(Y|X)>P(Y)

Такие определения неадекватны, поскольку другие отношения (например, общая причина для и ) могут удовлетворять условию. Причинность имеет отношение ко второй ступени лестницы. Ассоциации находятся на первом этапе и служат лишь доказательством последнего. ^[4] $X$ $Y$

В более позднем определении была предпринята попытка устранить эту двусмысленность, обуславливая фоновые факторы. Математически:

P(Y|X,K=k)>P(Y|K=k)

где — набор фоновых переменных и представляет значения этих переменных в определенном контексте. Однако требуемый набор фоновых переменных не определен (несколько наборов могут увеличить вероятность), пока вероятность является единственным критерием ^[^{необходимы разъяснения}^] . ^[4] $K$ $k$

Другие попытки определить причинность включают причинность Грейнджера — статистическую проверку гипотезы о том, что причинность (в экономике ) можно оценить путем измерения способности предсказывать будущие значения одного временного ряда, используя предыдущие значения другого временного ряда. ^[4]

Типы

Причина может быть необходимой, достаточной, способствующей или какой-либо их комбинацией. ^[7]

Необходимый

Чтобы x был необходимой причиной y , наличие y должно подразумевать предшествующее возникновение x . Однако наличие x не означает, что произойдет y . ^[8] Необходимые причины также известны как причины «если бы не», поскольку y не произошло бы, если бы не появление x . ^[4]^{: 261}

Достаточные причины

Чтобы x было достаточной причиной y , наличие x должно подразумевать последующее появление y . Однако другая причина z может независимо вызывать y . Таким образом, наличие y не требует предварительного появления x . ^[8]

Сопутствующие причины

Чтобы x было причиной, способствующей y , наличие x должно увеличивать вероятность y . Если вероятность равна 100%, то x вместо этого называется достаточным. Также может потребоваться сопутствующая причина. ^[9]

Модель

Причинно-следственная диаграмма

Причинно-следственная диаграмма — это ориентированный граф , который отображает причинно-следственные связи между переменными в причинно-следственной модели. Причинно-следственная диаграмма включает в себя набор переменных (или узлов ). Каждый узел соединен стрелкой с одним или несколькими другими узлами, на которые он оказывает причинное влияние. Стрелка очерчивает направление причинно-следственной связи, например, стрелка, соединяющая переменные , а стрелка указывает на то, что изменение вызывает изменение (с соответствующей вероятностью). Путь — это обход графа между двумя узлами по причинным стрелкам. ^[4] $A$ $B$ $B$ $A$ $B$

Причинные диаграммы включают диаграммы причинных петель , направленные ациклические графы и диаграммы Исикавы . ^[4]

Причинно-следственные диаграммы не зависят от количественных вероятностей, которые их информируют. Изменения этих вероятностей (например, из-за технологических усовершенствований) не требуют изменений в модели. ^[4]

Элементы модели

Причинные модели имеют формальную структуру с элементами с определенными свойствами. ^[4]

Схемы соединений

Три типа соединений трех узлов — это линейные цепи, ветвящиеся вилки и сливающиеся коллайдеры. ^[4]

Цепь

Цепочки представляют собой прямые линии со стрелками, указывающими от причины к следствию. В этой модели является посредником, поскольку он опосредует изменения, которые в противном случае произошли бы в . ^[4]^{: 113} $B$ $A$ $C$

A\rightarrow B\rightarrow C

Вилка

В форках одна причина имеет несколько последствий. Оба эффекта имеют общую причину. Существует (непричинная) ложная корреляция между и , которую можно устранить, установив условие (для конкретного значения ). ^[4]^{: 114} $A$ $C$ $B$ $B$

A\leftarrow B\rightarrow C

«Условие » означает «заданное » (т. е. заданное значение ). $B$ $B$ $B$

Разработка вилки является помехой:

A\leftarrow B\rightarrow C\rightarrow A

В таких моделях частой причиной является и (что также вызывает ), создающее помеху ^[^{необходимы пояснения}^] . ^[4]^{: 114} $B$ $A$ $C$ $A$ $B$

Коллайдер

В коллайдерах несколько причин влияют на один результат. Обуславливание (для конкретного значения ) часто выявляет непричинную отрицательную корреляцию между и . Эта отрицательная корреляция была названа предвзятостью коллайдера и эффектом «объяснения», поскольку он объясняет корреляцию между и . ^[4]^{: 115} Корреляция может быть положительной в том случае, когда для воздействия необходимы вклады обоих и . ^[4]^{: 197} $B$ $B$ $A$ $C$ $B$ $A$ $C$ $A$ $C$ $B$

A\rightarrow B\leftarrow C

Типы узлов

Посредник

Узел-посредник изменяет влияние других причин на результат (в отличие от простого влияния на результат). ^[4]^{: 113} Например, в приведенном выше примере цепочки является посредником, поскольку он изменяет влияние (косвенной причины ) на (результат). $B$ $A$ $C$ $C$

сбивающий с толку

Узел-конфаундер влияет на несколько результатов, создавая между ними положительную корреляцию. ^[4]^{: 114}

Инструментальная переменная

Инструментальная переменная – это такая, которая: ^[4]^{: 246}

имеет путь к результату;
не имеет другого пути к причинным переменным;
не имеет прямого влияния на результат.

Коэффициенты регрессии могут служить оценкой причинного влияния инструментальной переменной на результат, если этот эффект не смешивается. Таким образом, инструментальные переменные позволяют количественно оценить причинные факторы без данных о искажающих факторах. ^[4]^{: 249}

Например, учитывая модель:

Z\rightarrow X\rightarrow Y\leftarrow U\rightarrow X

$Z$ является инструментальной переменной, поскольку она имеет путь к результату и не смешивается, например, с . $Y$ $U$

В приведенном выше примере, если и принимают двоичные значения, то допущение, которое не возникает, называется монотонностью ^[^{необходимы пояснения}^] . ^[4]^{: 253} $Z$ $X$ $Z=0,X=1$

Усовершенствования метода ^{[ необходимы пояснения ]} включают создание инструмента ^{[ необходимы пояснения ]} путем обуславливания другой переменной ^{[ необходимы пояснения ]} для блокировки ^{[ необходимы пояснения ]} пути ^{[ необходимы пояснения ]} между инструментом и искажающим фактором ^{[ необходимы пояснения ]} и объединение нескольких переменные для формирования единого инструмента ^{[ необходимы разъяснения ]} . ^[4]^{: 257}

Менделевская рандомизация

Определение: Менделевская рандомизация использует измеренные вариации генов с известной функцией для изучения причинного влияния модифицируемого воздействия на заболевание в обсервационных исследованиях . ^[10]^[11]

Поскольку гены варьируются случайным образом в разных популяциях, наличие гена обычно квалифицируется как инструментальная переменная, подразумевая, что во многих случаях причинно-следственную связь можно определить количественно с помощью регрессии в наблюдательном исследовании. ^[4]^{: 255}

Ассоциации

Условия независимости

Условия независимости — это правила, позволяющие решить, являются ли две переменные независимыми друг от друга. Переменные являются независимыми, если значения одной не влияют напрямую на значения другой. Множественные причинные модели могут иметь общие условия независимости. Например, модели

A\rightarrow B\rightarrow C

A\leftarrow B\rightarrow C

имеют одинаковые условия независимости, поскольку обуславливают листья и независимы. Однако эти две модели не имеют одинакового значения и могут быть фальсифицированы на основе данных (то есть, если данные наблюдений показывают связь между и после обусловливания , то обе модели неверны). И наоборот, данные не могут показать, какая из этих двух моделей верна, поскольку они имеют одинаковые условия независимости. $B$ $A$ $C$ $A$ $C$ $B$

Обусловливание переменной — это механизм проведения гипотетических экспериментов. Кондиционирование переменной включает в себя анализ значений других переменных для заданного значения условной переменной. В первом примере условие on подразумевает, что наблюдения для данного значения не должны показывать зависимости между и . Если такая зависимость существует, то модель некорректна. Некаузальные модели не могут проводить такие различия, потому что они не делают причинных утверждений. ^[4]^{: 129–130} $B$ $B$ $A$ $C$

Искажающий / опровергающий

Важным элементом дизайна корреляционного исследования является выявление потенциально мешающих влияний на изучаемую переменную, например демографию. Эти переменные контролируются для устранения этих влияний. Однако правильный список мешающих переменных не может быть определен априори . Таким образом, возможно, что исследование может контролировать нерелевантные переменные или даже (косвенно) изучаемую переменную. ^[4]^{: 139}

Причинно-следственные модели предлагают надежный метод выявления соответствующих мешающих переменных. Формально Z является искажающим фактором, если «Y связан с Z путями, не проходящими через X». Их часто можно определить, используя данные, собранные в ходе других исследований. Математически, если

P(Y|X)\neq P(Y|do(X))

X и Y смешиваются (из-за некоторой мешающей переменной Z). ^[4]^{: 151}

Ранее предположительно неверные определения конфаундера включали: ^[4]^{: 152.}

«Любая переменная, которая коррелирует как с X, так и с Y».
Y ассоциируется с Z среди необлученных.
Неколлапсируемость: разница между «грубым относительным риском и относительным риском, возникающим после поправки на потенциальный искажающий фактор».
Эпидемиологический: переменная, связанная с X среди населения в целом и связанная с Y среди людей, не подвергавшихся воздействию X.

Последнее имеет недостаток в том, что в модели:

X\rightarrow Z\rightarrow Y

Z соответствует определению, но является посредником, а не помехой, и является примером контроля за результатом.

В модели

X\leftarrow A\rightarrow B\leftarrow C\rightarrow Y

Традиционно B считался искажающим фактором, поскольку он связан с X и Y, но не находится на причинном пути и не является потомком чего-либо на причинном пути. Контроль за B приводит к тому, что он становится помехой. Это известно как М-смещение. ^[4]^{: 161}

Регулировка задней двери

Для анализа причинного влияния X на Y в причинной модели необходимо учитывать все мешающие переменные (деконфаундинг). Чтобы идентифицировать набор мешающих факторов, (1) каждый некаузальный путь между X и Y должен быть заблокирован этим набором; (2) без нарушения каких-либо причинно-следственных связей; и (3) без создания каких-либо ложных путей. ^[4]^{: 158}

Определение : черный путь от переменной X к Y — это любой путь от X к Y, который начинается со стрелки, указывающей на X. ^[4]^{: 158}

Определение : Учитывая упорядоченную пару переменных (X,Y) в модели, набор мешающих переменных Z удовлетворяет критерию бэкдора, если (1) ни одна искажающая переменная Z не является потомком X и (2) все бэкдорные пути между X и Y заблокированы набором искажающих факторов.

Если критерий бэкдора удовлетворен для (X,Y), X и Y устраняются с помощью набора переменных-конфаундеров. Нет необходимости контролировать какие-либо переменные, кроме искажающих факторов. ^[4]^{: 158} Критерий бэкдора является достаточным, но не необходимым условием для нахождения набора переменных Z, позволяющего исключить анализ причинного воздействия X на y.

Когда причинно-следственная модель является правдоподобным представлением реальности и бэкдор-критерий удовлетворен, тогда коэффициенты частичной регрессии можно использовать в качестве (причинно-следственных) коэффициентов пути (для линейных отношений). ^[4]^{: 223}^[12]

P(Y|do(X))=\textstyle \sum _{z}\displaystyle P(Y|X,Z=z)P(Z=z)

^[4]^{: 227}

Регулировка входной двери

Если все элементы блокирующего пути ненаблюдаемы, путь через черный ход не поддается вычислению, но если все прямые пути из имеют элементы , к которым не соединяются открытые пути , то набор всех s может измерить . Фактически, существуют условия, при которых он может выступать в качестве прокси для . $X\to Y$ $z$ $z\to Y$ $Z$ $z$ $P(Y|do(X))$ $Z$ $X$

Определение : входной путь — это прямой причинный путь, для которого данные доступны для всех , ^[4]^:226 перехватывает все направленные пути к , нет незаблокированных путей от до , а все бэкдорные пути от до блокируются . ^[13] $z\in Z$ $Z$ $X$ $Y$ $Z$ $Y$ $Z$ $Y$ $X$

Следующее преобразует выражение do в выражение без выполнения действий путем обусловления переменных на пути к входной двери. ^[4]^{: 226}

P(Y|do(X))=\textstyle \sum _{z}\left[\displaystyle P(Z=z|X)\textstyle \sum _{x}\displaystyle P(Y|X=x,Z=z)P(X=x)\right]

Предполагая, что данные об этих наблюдаемых вероятностях доступны, окончательную вероятность можно вычислить без эксперимента, независимо от существования других мешающих путей и без скрытых корректировок. ^[4]^{: 226}

Вмешательства

Запросы

Запросы — это вопросы, задаваемые на основе конкретной модели. На них обычно отвечают путем проведения экспериментов (вмешательств). Вмешательства принимают форму фиксации значения одной переменной в модели и наблюдения за результатом. Математически такие запросы имеют вид (из примера): ^[4]^{: 8}

P({\text{floss}}\vline do({\text{toothpaste}}))

где оператор do указывает, что эксперимент явно изменил цену зубной пасты. Графически это блокирует любые причинные факторы, которые в противном случае могли бы повлиять на эту переменную. Схематически это стирает все причинные стрелки, указывающие на экспериментальную переменную. ^[4]^{: 40}

Возможны более сложные запросы, в которых оператор do применяется (значение фиксировано) к нескольким переменным.

Сделать расчет

Исчисление do — это набор манипуляций, доступных для преобразования одного выражения в другое, с общей целью преобразования выражений, содержащих оператор do, в выражения, которые его не содержат. Выражения, не включающие оператор do, можно оценить только на основе данных наблюдений, без необходимости экспериментального вмешательства, которое может быть дорогостоящим, длительным или даже неэтичным (например, предлагать испытуемым бросить курить). ^[4]^{: 231} Набор правил полон (его можно использовать для вывода каждого истинного утверждения в этой системе). ^[4]^{: 237} Алгоритм может определить, вычислимо ли для данной модели решение за полиномиальное время . ^[4]^{: 238}

Правила

Исчисление включает три правила преобразования выражений условной вероятности с использованием оператора do.

Правило 1

Правило 1 разрешает добавление или удаление наблюдений.: ^[4]^{: 235}

P(Y|do(X),Z,W)=P(Y|do(X),Z)

в случае, если набор переменных Z блокирует все пути из W в Y и все стрелки, ведущие в X, удалены. ^[4]^{: 234}

Правило 2

Правило 2 разрешает замену вмешательства наблюдением или наоборот: ^[4]^{: 235}

P(Y|do(X),Z)=P(Y|X,Z)

в случае, когда Z удовлетворяет критерию «черной двери». ^[4]^{: 234}

Правило 3

Правило 3 разрешает удаление или добавление вмешательств: ^[4]

P(Y|do(X))=P(Y)

в случае, когда никакие причинные пути не соединяют X и Y. ^[4]^{: 234} ^{: 235}

Расширения

Правила не подразумевают, что из любого запроса можно удалить операторы do. В таких случаях можно заменить переменную, которой можно манипулировать (например, диета), на переменную, которая не подвергается манипуляциям (например, уровень холестерина в крови), которую затем можно преобразовать, чтобы удалить эту переменную. Пример:

P({\text{Heart disease}}|do({\text{blood cholesterol}}))=P({\text{Heart disease}}|do({\text{diet}}))

Контрфакты

Контрфакты рассматривают возможности, которые не обнаруживаются в данных, например, развился ли бы рак у некурящего, если бы он вместо этого был заядлым курильщиком. Это высшая ступень причинно-следственной лестницы Перла.

Потенциальный результат

Определение: Потенциальный результат для переменной Y — это «значение Y, которое Y приняло бы для отдельного ^{[ необходимо уточнение ]} u , если бы X было присвоено значение x». Математически: ^[4]^{: 270}

Y_{X=x}(u)

или .

Y_{x}(u)

Потенциальный результат определяется на уровне индивида u. ^[4]^{: 270}

Традиционный подход к потенциальным результатам основан на данных, а не на моделях, что ограничивает его способность распутывать причинно-следственные связи. Он рассматривает причинно-следственные вопросы как проблемы отсутствия данных и дает неправильные ответы даже на стандартные сценарии. ^[4]^{: 275}

Причинно-следственный вывод

В контексте причинно-следственных моделей потенциальные результаты интерпретируются причинно, а не статистически.

Первый закон причинного вывода гласит, что потенциальный результат

Y_{X}(u)

можно вычислить, изменив причинную модель M (путем удаления стрелок из X) и вычислив результат для некоторого x . Формально: ^[4]^{: 280}

Y_{X}(u)=Y_{Mx}(u)

Проведение контрфактического

Исследование контрфактического явления с использованием причинно-следственной модели включает в себя три этапа. ^[14] Подход справедлив независимо от формы модельных связей, линейной или иной. Когда взаимосвязи модели полностью определены, можно вычислить значения точек. В других случаях (например, когда доступны только вероятности) можно вычислить утверждение о вероятностном интервале, например, что некурящий x будет иметь 10-20% вероятность заболевания раком. ^[4]^{: 279}

Учитывая модель:

Y\leftarrow X\rightarrow M\rightarrow Y\leftarrow U

можно применять уравнения для расчета значений A и C, полученные на основе регрессионного анализа или другого метода, заменяя известные значения из наблюдений и фиксируя значения других переменных (противфактические). ^[4]^{: 278}

Похитить

Примените абдуктивное рассуждение ( логический вывод , который использует наблюдение для поиска самого простого/наиболее вероятного объяснения), чтобы оценить u , прокси для ненаблюдаемых переменных в конкретном наблюдении, которое подтверждает обратное. ^[4]^{: 278} Вычислите вероятность u с учетом пропозициональных доказательств.

Действовать

Для конкретного наблюдения используйте оператор do, чтобы установить обратное (например, m =0), соответствующим образом изменив уравнения. ^[4]^{: 278}

Предсказывать

Вычислите значения выхода ( y ) с помощью модифицированных уравнений. ^[4]^{: 278}

Посредничество

Различить прямые и косвенные (опосредованные) причины можно только путем проведения контрфактических действий. ^[4]^{: 301} Понимание посредничества требует, чтобы посредник оставался постоянным, одновременно вмешиваясь в непосредственную причину. В модели

$Y\leftarrow M\leftarrow X\rightarrow Y$

M опосредует влияние X на Y, в то время как X также оказывает непосредственное влияние на Y. Таким образом, M остается постоянным, а do(X) вычисляется.

Вместо этого ошибка посредничества предполагает обусловленность посредника, если посредник и результат путаются, как это происходит в приведенной выше модели.

Для линейных моделей косвенный эффект можно вычислить, взяв произведение всех коэффициентов пути вдоль опосредованного пути. Общий косвенный эффект рассчитывается как сумма отдельных косвенных эффектов. Для линейных моделей посредничество указывается, когда коэффициенты уравнения, подобранного без включения посредника, значительно отличаются от уравнения, которое его включает. ^[4]^{: 324}

Прямой эффект

В экспериментах по такой модели управляемый прямой эффект (CDE) вычисляется путем принудительного установления значения посредника M (do(M = 0)) и случайного назначения некоторым испытуемым каждого из значений X (do(X=0) ), do(X=1), ...) и наблюдая за результирующими значениями Y. ^[4]^{: 317}

CDE(0)=P(Y=1|do(X=1),do(M=0))-P(Y=1|do(X=0),do(M=0))

Каждому значению посредника соответствует соответствующий CDE.

Однако лучший эксперимент — вычислить естественный прямой эффект. (NDE) Это эффект, определяемый тем, что отношения между X и M остаются нетронутыми, при этом вмешиваясь в отношения между X и Y. ^[4]^{: 318}

NDE=P(Y_{M=M0}=1|do(X=1))-P(Y_{M=M0}=1|do(X=0))

Например, рассмотрим прямой эффект увеличения числа посещений стоматолога-гигиениста (X) каждые два года из года в год, что поощряет использование зубной нити (M). Десны (Y) становятся здоровее либо благодаря гигиенисту (прямо), либо благодаря использованию зубной нити (медиатор/косвенно). Эксперимент состоит в том, чтобы продолжать пользоваться зубной нитью, пропуская визит к гигиенисту.

Косвенный эффект

Косвенное влияние X на Y - это «увеличение, которое мы увидели бы в Y, сохраняя X постоянным и увеличивая M до любого значения, которое M могло бы достичь при увеличении X на единицу». ^[4]^{: 328}

Косвенные эффекты нельзя «контролировать», поскольку прямой путь нельзя отключить, удерживая константу другой переменной. Естественный косвенный эффект (NIE) – это влияние на здоровье десен (Y) от использования зубной нити (M). NIE рассчитывается как сумма (в случаях использования зубной нити и отсутствия зубной нити) разницы между вероятностью использования зубной нити с учетом гигиениста и без него, или: ^[4]^{: 321}

NIE=\sum _{m}[P(M=m|X=1)-P(M=m|X=0)]xxP(Y=1|X=0,M=m)

Приведенный выше расчет NDE включает в себя контрфактические индексы ( ). Для нелинейных моделей кажущаяся очевидная эквивалентность ^[4]^{: 322} $Y_{M=M0}$

{\mathsf {Total\ effect=Direct\ effect+Indirect\ effect}}

не применяется из-за аномалий, таких как пороговые эффекты и двоичные значения. Однако,

{\mathsf {Total\ effect}}(X=0\rightarrow X=1)=NDE(X=0\rightarrow X=1)-\ NIE(X=1\rightarrow X=0)

работает для всех отношений модели (линейных и нелинейных). Это позволяет затем рассчитывать NDE непосредственно на основе данных наблюдений, без вмешательства или использования контрфактических индексов. ^[4]^{: 326}

Транспортабельность

Причинно-следственные модели предоставляют средство интеграции данных из разных наборов данных, известное как транспорт, даже несмотря на то, что причинно-следственные модели (и связанные с ними данные) различаются. Например, данные опроса можно объединить с данными рандомизированных контролируемых исследований. ^[4]^{: 352} Транспорт предлагает решение вопроса внешней валидности : можно ли исследование применить в другом контексте.

Если две модели совпадают по всем важным переменным и данные одной модели, как известно, являются несмещенными, данные одной совокупности можно использовать для того, чтобы сделать выводы о другой. В других случаях, когда известно, что данные необъективны, повторное взвешивание может позволить перенести набор данных. В третьем случае выводы можно сделать на основе неполного набора данных. В некоторых случаях данные исследований нескольких популяций можно объединить (посредством транспортировки), чтобы сделать выводы о неизмеренной популяции. В некоторых случаях объединение оценок (например, P(W|X)) из нескольких исследований может повысить точность вывода. ^[4]^{: 355}

Do-исчисление обеспечивает общий критерий переноса: целевая переменная может быть преобразована в другое выражение с помощью серии do-операций, которые не включают в себя какие-либо переменные, «производящие различия» (те, которые различают две совокупности). ^[4]^{: 355} Аналогичное правило применяется к исследованиям, в которых участвуют существенно разные участники. ^[4]^{: 356}

Байесовская сеть

Любая причинно-следственная модель может быть реализована как байесовская сеть. Байесовские сети можно использовать для определения обратной вероятности события (с учетом результата, каковы вероятности конкретной причины). Для этого требуется подготовить таблицу условной вероятности, показывающую все возможные входные данные и результаты с соответствующими вероятностями. ^[4]^{: 119}

Например, для модели с двумя переменными «Заболевание» и «Тест» (для заболевания) таблица условной вероятности принимает вид: ^[4]^{: 117.}

Согласно этой таблице, при отсутствии у пациента заболевания вероятность положительного результата теста составляет 12%.

Хотя это приемлемо для небольших задач, по мере увеличения количества переменных и связанных с ними состояний таблица вероятностей (и связанное с ней время вычислений) увеличивается экспоненциально. ^[4]^{: 121}

Байесовские сети используются в коммерческих целях в таких приложениях, как исправление ошибок беспроводных данных и анализ ДНК. ^[4]^{: 122}

Инварианты/контекст

Другая концептуализация причинности включает понятие инвариантных отношений. В случае идентификации рукописных цифр форма цифры контролирует значение, поэтому форма и значение являются инвариантами. Изменение формы меняет смысл. Другие свойства этого не делают (например, цвет). Эта инвариантность должна распространяться на наборы данных, созданные в разных контекстах (неинвариантные свойства формируют контекст). Вместо обучения (оценки причинно-следственной связи) с использованием объединенных наборов данных изучение одного и тестирование другого может помочь отличить варианты от инвариантных свойств. ^[15]

Смотрите также

Причинная система
Причинная сеть - байесовская сеть с явным требованием, чтобы отношения были причинными.
Моделирование структурными уравнениями - статистический метод проверки и оценки причинно-следственных связей.
Анализ пути (статистика)
Байесовская сеть
Причинно-следственная карта
Динамическое причинно-следственное моделирование

Источники

Перл, Иудея (14 сентября 2009 г.). Причинность. Издательство Кембриджского университета. ISBN 9781139643986.

Внешние ссылки

Перл, Иудея (26 февраля 2010 г.). «Введение в причинный вывод». Международный журнал биостатистики . 6 (2): Статья 7. doi :10.2202/1557-4679.1203. ISSN 1557-4679. ПМЦ 2836213 . ПМИД 20305706.
Причинно-следственное моделирование в PhilPapers
Фальк, Дэн (17 марта 2019 г.). «Алгоритмы ИИ теперь поразительно хороши в науке». Проводной . ISSN 1059-1028 . Проверено 20 марта 2019 г.
Модлин, Тим (30 августа 2019 г.). «Почему мир». Бостонское обозрение . Проверено 9 сентября 2019 г.
Хартнетт, Кевин (15 мая 2018 г.). «Чтобы создать по-настоящему умные машины, научите их причине и следствию». Журнал Кванта . Проверено 19 сентября 2019 г.
^[1]

^ Изучение представлений с использованием причинной инвариантности, ICLR, февраль 2020 г. , получено 10 февраля 2020 г.

Причинная модель

Определение

История

Лестница причинно-следственной связи

Ассоциация

Вмешательство

Контрфакты

Причинность

Причинность против корреляции

Типы

Необходимый

Достаточные причины

Сопутствующие причины

Модель

Причинно-следственная диаграмма

Элементы модели

Схемы соединений

Цепь

Вилка

Коллайдер

Типы узлов

Посредник

сбивающий с толку

Инструментальная переменная

Менделевская рандомизация

Ассоциации

Условия независимости

Искажающий / опровергающий

Регулировка задней двери

Регулировка входной двери

Вмешательства

Запросы

Сделать расчет

Правила

Правило 1

Правило 2

Правило 3

Расширения

Контрфакты

Потенциальный результат

Причинно-следственный вывод

Проведение контрфактического

Похитить

Действовать

Предсказывать

Посредничество

Прямой эффект

Косвенный эффект

Транспортабельность

Байесовская сеть

Инварианты/контекст

Смотрите также

Рекомендации

Источники

Внешние ссылки