В метафизике каузальная модель (или структурная каузальная модель ) — это концептуальная модель , описывающая каузальные механизмы системы . При разработке каузальной модели могут использоваться несколько типов каузальных обозначений . Каузальные модели могут улучшить дизайн исследования, предоставляя четкие правила для принятия решения о том , какие независимые переменные необходимо включить/контролировать.
Они могут позволить получить ответы на некоторые вопросы на основе существующих наблюдательных данных без необходимости проведения интервенционного исследования, такого как рандомизированное контролируемое исследование . Некоторые интервенционные исследования нецелесообразны по этическим или практическим причинам, что означает, что без причинно-следственной модели некоторые гипотезы не могут быть проверены.
Причинно-следственные модели могут помочь с вопросом внешней валидности (применимы ли результаты одного исследования к неизученным популяциям). Причинно-следственные модели могут позволить объединить данные из нескольких исследований (в определенных обстоятельствах) для ответа на вопросы, на которые не может ответить ни один отдельный набор данных.
Причинно-следственные модели нашли применение в обработке сигналов , эпидемиологии и машинном обучении . [2]
Причинные модели — это математические модели, представляющие причинные связи в рамках отдельной системы или популяции. Они облегчают выводы о причинных связях из статистических данных. Они могут многому нас научить в области эпистемологии причинности и в отношении причинности и вероятности. Они также применялись к темам, представляющим интерес для философов, таким как логика контрфактуальностей, теория принятия решений и анализ фактической причинности. [3]
— Стэнфордская энциклопедия философии
Джуда Перл определяет причинно-следственную модель как упорядоченную тройку , где U — набор экзогенных переменных , значения которых определяются факторами вне модели; V — набор эндогенных переменных, значения которых определяются факторами внутри модели; а E — набор структурных уравнений , которые выражают значение каждой эндогенной переменной как функцию значений других переменных в U и V. [2]
Аристотель определил таксономию причинности, включая материальные, формальные, эффективные и конечные причины. Юм отверг таксономию Аристотеля в пользу контрфактуальностей . В какой-то момент он отрицал, что объекты обладают «силами», которые делают один причиной, а другой следствием. Позже он принял «если бы не было первого объекта, то и второго никогда бы не существовало» (« but-for » причинность). [4]
В конце 19 века начала формироваться дисциплина статистики. После многолетних усилий по выявлению причинно-следственных правил для таких областей, как биологическое наследование, Гальтон ввел концепцию средней регрессии (олицетворенной спадом в спорте на втором курсе), которая позже привела его к непричинной концепции корреляции . [4]
Будучи позитивистом , Пирсон исключил понятие причинности из большей части науки как недоказуемый частный случай ассоциации и ввел коэффициент корреляции как метрику ассоциации. Он писал: «Сила как причина движения — это то же самое, что бог дерева как причина роста», и что причинность была всего лишь «фетишем среди непостижимых тайн современной науки». Пирсон основал Biometrika и Биометрическую лабораторию в Университетском колледже Лондона , которая стала мировым лидером в области статистики. [4]
В 1908 году Харди и Вайнберг решили проблему стабильности признаков , которая заставила Гальтона отказаться от причинности, возродив менделевское наследование . [4]
В 1921 году анализ путей Райта стал теоретическим предшественником причинного моделирования и причинных графов . [5] Он разработал этот подход, пытаясь распутать относительное влияние наследственности , развития и окружающей среды на рисунок шерсти морских свинок . Он подкрепил свои тогда еретические утверждения, показав, как такой анализ может объяснить связь между массой тела морской свинки при рождении, внутриутробным временем и размером помета. Противодействие этим идеям со стороны выдающихся статистиков привело к тому, что их игнорировали в течение следующих 40 лет (за исключением селекционеров животных). Вместо этого ученые полагались на корреляции, отчасти по просьбе критика Райта (и ведущего статистика) Фишера . [4] Одним из исключений была Беркс , студентка, которая в 1926 году первой применила диаграммы путей для представления опосредующего влияния ( медиатора ) и утверждала, что сохранение постоянного медиатора приводит к ошибкам. Она, возможно, изобрела диаграммы путей независимо. [4] : 304
В 1923 году Нейман представил концепцию потенциального результата, но его работа не была переведена с польского на английский язык до 1990 года. [4] : 271
В 1958 году Кокс предупредил, что контроль переменной Z допустим только в том случае, если крайне маловероятно, что на нее повлияют независимые переменные. [4] : 154
В 1960-х годах Дункан , Блэлок , Голдбергер и другие заново открыли анализ путей. Читая работу Блэлока о диаграммах путей, Дункан вспомнил лекцию Огберна двадцатью годами ранее, в которой упоминалась статья Райта, в которой, в свою очередь, упоминался Беркс. [4] : 308
Социологи изначально называли причинные модели структурным моделированием уравнений , но как только это стало механическим методом, оно утратило свою полезность, что привело к тому, что некоторые практики отвергли любую связь с причинностью. Экономисты приняли алгебраическую часть анализа пути, назвав ее одновременным моделированием уравнений. Однако экономисты по-прежнему избегали приписывать своим уравнениям причинное значение. [4]
Спустя шестьдесят лет после своей первой статьи Райт опубликовал статью, в которой изложил ее суть, после критики Карлина и др., которые возражали, что она рассматривает только линейные зависимости и что надежные, не основанные на моделях представления данных более показательны. [4]
В 1973 году Льюис выступил за замену корреляции на причинность (контрфактуальность). Он ссылался на способность людей представлять себе альтернативные миры, в которых причина произошла или не произошла, и в которых следствие появилось только после своей причины. [4] : 266 В 1974 году Рубин ввел понятие «потенциальных результатов» как языка для постановки причинных вопросов. [4] : 269
В 1983 году Картрайт предложил, чтобы любой фактор, который «причинно связан» с эффектом, обусловливался, выходя за рамки простой вероятности как единственного ориентира. [4] : 48
В 1986 году Барон и Кенни представили принципы обнаружения и оценки посредничества в системе линейных уравнений. По состоянию на 2014 год их статья была 33-й по частоте цитирования за все время. [4] : 324 В том же году Гринланд и Робинс представили подход «заменяемости» к обработке искажений путем рассмотрения контрфактуальности. Они предложили оценить, что бы произошло с группой лечения, если бы они не получили лечение, и сравнить этот результат с результатом контрольной группы. Если они совпадали, искажения считались отсутствующими. [4] : 154
Причинная метамодель Перла включает в себя трехуровневую абстракцию, которую он называет лестницей причинности. Самый низкий уровень, Ассоциация (видение/наблюдение), подразумевает восприятие закономерностей или шаблонов во входных данных, выраженных в виде корреляций. Средний уровень, Вмешательство (действие), предсказывает последствия преднамеренных действий, выраженных в виде причинно-следственных связей. Самый высокий уровень, Контрфактуальность (воображение), включает в себя построение теории (части) мира, которая объясняет, почему определенные действия имеют определенные последствия и что происходит при отсутствии таких действий. [4]
Один объект ассоциируется с другим, если наблюдение одного изменяет вероятность наблюдения другого. Пример: покупатели, которые покупают зубную пасту, с большей вероятностью купят также зубную нить. Математически:
или вероятность (покупки) зубной нити при (покупке) зубной пасты. Ассоциации также можно измерить, вычислив корреляцию двух событий. Ассоциации не имеют причинно-следственных связей. Одно событие может вызвать другое, может быть верным обратное, или оба события могут быть вызваны каким-то третьим событием (недовольный гигиенист стыдит покупателя, заставляя его лучше ухаживать за полостью рта). [4]
Этот уровень утверждает конкретные причинно-следственные связи между событиями. Причинность оценивается путем экспериментального выполнения некоторого действия, которое влияет на одно из событий. Пример: после удвоения цены зубной пасты, какова будет новая вероятность покупки? Причинность не может быть установлена путем изучения истории (изменений цен), поскольку изменение цены могло произойти по какой-то другой причине, которая сама по себе могла повлиять на второе событие (тариф, который увеличивает цену обоих товаров). Математически:
где do — оператор, который сигнализирует об экспериментальном вмешательстве (удвоении цены). [4] Оператор указывает на выполнение минимального изменения в мире, необходимого для создания желаемого эффекта, «мини-операцию» на модели с минимальными изменениями по сравнению с реальностью. [6]
Самый высокий уровень, контрфактуальный, предполагает рассмотрение альтернативной версии прошлого события или того, что могло бы произойти при других обстоятельствах для той же экспериментальной единицы. Например, какова вероятность того, что если бы магазин удвоил цену на зубную нить, покупатель, покупающий зубную пасту, все равно купил бы ее?
Контрфактуальные утверждения могут указывать на существование причинно-следственной связи. Модели, которые могут отвечать контрфактуальным утверждениям, позволяют осуществлять точные вмешательства, последствия которых можно предсказать. В крайнем случае такие модели принимаются как физические законы (как в законах физики, например, инерции, которая гласит, что если сила не приложена к неподвижному объекту, он не будет двигаться). [4]
Статистика вращается вокруг анализа взаимосвязей между несколькими переменными. Традиционно эти взаимосвязи описываются как корреляции , ассоциации без каких-либо подразумеваемых причинно-следственных связей. Причинно-следственные модели пытаются расширить эту структуру, добавляя понятие причинно-следственных связей, в которых изменения одной переменной вызывают изменения других. [2]
Определения причинности двадцатого века основывались исключительно на вероятностях/ассоциациях. Одно событие ( ) считалось причиной другого, если оно повышало вероятность другого ( ). Математически это выражается как:
Такие определения неадекватны, поскольку другие отношения (например, общая причина для и ) могут удовлетворять условию. Причинность имеет отношение ко второй ступени лестницы. Ассоциации находятся на первой ступени и предоставляют только доказательства для последней. [4]
Более позднее определение попыталось устранить эту неоднозначность, обуславливая фоновые факторы. Математически:
где — набор фоновых переменных, а представляет значения этих переменных в определенном контексте. Однако требуемый набор фоновых переменных неопределен (множественные наборы могут увеличить вероятность), пока вероятность является единственным критерием [ необходимо разъяснение ] . [4]
Другие попытки определить причинность включают причинность по Грейнджеру , статистическую проверку гипотезы о том, что причинность (в экономике ) можно оценить путем измерения способности предсказывать будущие значения одного временного ряда, используя предыдущие значения другого временного ряда. [4]
Причина может быть необходимой, достаточной, способствующей или их комбинацией. [7]
Для того, чтобы x был необходимой причиной y , наличие y должно подразумевать предшествующее возникновение x . Однако наличие x не подразумевает, что y произойдет. [8] Необходимые причины также известны как причины «но», например, y не произошло бы, если бы не возникновение x . [4] : 261
Для того, чтобы x был достаточной причиной y , наличие x должно подразумевать последующее возникновение y . Однако другая причина z может независимо вызывать y . Таким образом, наличие y не требует предшествующего возникновения x . [8]
Для того, чтобы x был сопутствующей причиной y , наличие x должно увеличить вероятность y . Если вероятность составляет 100%, то x вместо этого называется достаточным. Также может быть необходима сопутствующая причина. [9]
Причинно-следственная диаграмма — это направленный граф , отображающий причинно-следственные связи между переменными в причинно-следственной модели. Причинно-следственная диаграмма включает в себя набор переменных (или узлов ). Каждый узел соединен стрелкой с одним или несколькими другими узлами, на которые он оказывает причинное влияние. Наконечник стрелки обозначает направление причинно-следственной связи, например, стрелка, соединяющая переменные , а наконечник стрелки указывает на то, что изменение в вызывает изменение в (с соответствующей вероятностью). Путь — это обход графа между двумя узлами, следующий за причинными стрелками. [4]
Причинно-следственные диаграммы включают в себя причинно-следственные диаграммы , направленные ациклические графы и диаграммы Ишикавы . [4]
Причинно-следственные диаграммы независимы от количественных вероятностей, которые их информируют. Изменения этих вероятностей (например, из-за технологических усовершенствований) не требуют изменений в модели. [4]
Причинно-следственные модели имеют формальные структуры с элементами, обладающими определенными свойствами. [4]
Три типа соединений трех узлов — это линейные цепи, разветвленные вилки и сливающиеся коллайдеры. [4]
Цепи — это прямые линии связи со стрелками, указывающими от причины к следствию. В этой модели является посредником, поскольку он опосредует изменение, которое в противном случае имело бы место на . [4] : 113
В форках одна причина имеет несколько следствий. Два следствия имеют общую причину. Существует (непричинная) ложная корреляция между и , которая может быть устранена путем обусловливания (для определенного значения ). [4] : 114
«Обусловливание » означает «задано » (т.е. задано значение ).
Разработка вилки является запутывающим фактором:
В таких моделях является общей причиной и (которая также вызывает ), что делает конфаундер [ необходимо разъяснение ] . [4] : 114
В коллайдерах несколько причин влияют на один результат. Обусловливание (для определенного значения ) часто выявляет некаузальную отрицательную корреляцию между и . Эта отрицательная корреляция была названа смещением коллайдера и эффектом «объяснения», поскольку объясняет корреляцию между и . [4] : 115 Корреляция может быть положительной в случае, когда вклады от обоих и необходимы для влияния на . [4] : 197
Узел-посредник изменяет влияние других причин на результат (в отличие от простого влияния на результат). [4] : 113 Например, в приведенном выше примере цепочки является посредником, поскольку он изменяет влияние (косвенной причины ) на (результат).
Узел-конфаундер влияет на несколько результатов, создавая положительную корреляцию между ними. [4] : 114
Инструментальная переменная – это та, которая: [4] : 246
Коэффициенты регрессии могут служить оценками причинного эффекта инструментальной переменной на результат, пока этот эффект не является смешанным. Таким образом, инструментальные переменные позволяют количественно оценить причинные факторы без данных о смешанных факторах. [4] : 249
Например, если взять модель:
является инструментальной переменной, поскольку она имеет путь к результату и не смешана, например, с помощью .
В приведенном выше примере, если и принимают двоичные значения, то предположение, что не выполняется, называется монотонностью [ необходимо разъяснение ] . [4] : 253
Усовершенствования техники [ требуется разъяснение ] включают создание инструмента [ требуется разъяснение ] путем создания условий для другой переменной [ требуется разъяснение ] для блокировки [ требуется разъяснение ] путей [ требуется разъяснение ] между инструментом и фактором, вызывающим затруднение [ требуется разъяснение ] и объединения нескольких переменных для формирования единого инструмента [ требуется разъяснение ] . [4] : 257
Определение: Менделевская рандомизация использует измеренные вариации в генах с известной функцией для изучения причинно-следственной связи модифицируемого воздействия с заболеванием в наблюдательных исследованиях . [10] [11]
Поскольку гены изменяются случайным образом в разных популяциях, наличие гена обычно квалифицируется как инструментальная переменная, подразумевая, что во многих случаях причинно-следственную связь можно количественно оценить с помощью регрессии в наблюдательном исследовании. [4] : 255
Условия независимости — это правила для принятия решения о том, являются ли две переменные независимыми друг от друга. Переменные независимы, если значения одной из них не влияют напрямую на значения другой. Несколько причинно-следственных моделей могут разделять условия независимости. Например, модели
и
имеют одинаковые условия независимости, поскольку обусловленность на листьях и независима. Однако эти две модели не имеют одинакового значения и могут быть фальсифицированы на основе данных (то есть, если данные наблюдений показывают связь между и после обусловленности на , то обе модели неверны). И наоборот, данные не могут показать, какая из этих двух моделей верна, поскольку они имеют одинаковые условия независимости.
Обусловливание переменной — это механизм проведения гипотетических экспериментов. Обусловливание переменной включает анализ значений других переменных для заданного значения условной переменной. В первом примере обусловливание подразумевает, что наблюдения для заданного значения не должны показывать никакой зависимости между и . Если такая зависимость существует, то модель неверна. Некаузальные модели не могут делать такие различия, потому что они не делают каузальных утверждений. [4] : 129–130
Существенным элементом дизайна корреляционного исследования является выявление потенциально искажающих влияний на изучаемую переменную, например, демографических. Эти переменные контролируются для устранения этих влияний. Однако правильный список искажающих переменных не может быть определен априори . Таким образом, возможно, что исследование может контролировать нерелевантные переменные или даже (косвенно) изучаемую переменную. [4] : 139
Причинно-следственные модели предлагают надежный метод для определения соответствующих смешивающих переменных. Формально Z является смешивающим фактором, если «Y связан с Z через пути, не проходящие через X». Их часто можно определить с использованием данных, собранных для других исследований. Математически, если
X и Y смешаны (из-за некоторой переменной-конфаундера Z). [4] : 151
Ранее, предположительно, неверные определения фактора, вызывающего сомнение, включали: [4] : 152
Последнее имеет недостаток, поскольку в модели:
Z соответствует определению, но является посредником, а не фактором, искажающим результаты, и является примером контроля результата.
В модели
Традиционно B считался фактором, мешающим, поскольку он связан с X и Y, но не находится на причинно-следственной связи и не является потомком чего-либо на причинно-следственной связи. Контроль B приводит к тому, что он становится фактором, мешающим. Это известно как M-смещение. [4] : 161
Для анализа причинного эффекта X на Y в причинной модели все переменные-конфаундеры должны быть рассмотрены (деконфаундинг). Чтобы определить набор конфаундеров, (1) каждый некаузальный путь между X и Y должен быть заблокирован этим набором; (2) без нарушения каких-либо причинных путей; и (3) без создания каких-либо ложных путей. [4] : 158
Определение : бэкдор-путь от переменной X к Y — это любой путь от X к Y, который начинается со стрелки, указывающей на X. [4] : 158
Определение : Для заданной упорядоченной пары переменных (X,Y) в модели набор переменных-конфаундеров Z удовлетворяет критерию бэкдора, если (1) ни одна переменная-конфаундер Z не является потомком X и (2) все пути бэкдора между X и Y блокируются набором переменных-конфаундеров.
Если критерий бэкдора выполняется для (X,Y), X и Y деконфаундируются набором переменных-конфаундеров. Нет необходимости контролировать какие-либо переменные, кроме конфаундеров. [4] : 158 Критерий бэкдора является достаточным, но не необходимым условием для нахождения набора переменных Z для деконфаундирования анализа причинного эффекта X на y.
Когда причинно-следственная модель является правдоподобным представлением реальности и критерий бэкдора выполняется, то частичные коэффициенты регрессии могут использоваться как (причинно-следственные) коэффициенты пути (для линейных отношений). [4] : 223 [12]
Если элементы блокирующего пути не поддаются наблюдению, бэкдор-путь не поддается вычислению, но если все прямые пути из имеют элементы , которые не соединяются открытыми путями , то , множество всех s, может измерять . Фактически, существуют условия, при которых может выступать в качестве прокси для .
Определение : путь входа — это прямой причинный путь, для которого доступны данные для всех , [4] : 226 перехватывает все направленные пути к , нет незаблокированных путей от к , и все пути входа от к заблокированы . [13]
Следующий пример преобразует выражение do в выражение do-free, обуславливая переменные по пути «входной двери». [4] : 226
Предполагая, что данные для этих наблюдаемых вероятностей доступны, окончательную вероятность можно вычислить без эксперимента, независимо от существования других мешающих путей и без подстройки под бэкдор. [4] : 226
Запросы — это вопросы, задаваемые на основе определенной модели. Обычно на них отвечают путем проведения экспериментов (вмешательств). Вмешательства принимают форму фиксации значения одной переменной в модели и наблюдения за результатом. Математически такие запросы имеют вид (из примера): [4] : 8
где оператор do указывает, что эксперимент явно изменил цену зубной пасты. Графически это блокирует любые причинные факторы, которые в противном случае могли бы повлиять на эту переменную. Диаграммно это стирает все причинные стрелки, указывающие на экспериментальную переменную. [4] : 40
Возможны более сложные запросы, в которых оператор do применяется (значение фиксируется) к нескольким переменным.
Исчисление do — это набор манипуляций, доступных для преобразования одного выражения в другое, с общей целью преобразования выражений, содержащих оператор do, в выражения, которые его не содержат. Выражения, не содержащие оператор do, можно оценить только на основе наблюдательных данных, без необходимости экспериментального вмешательства, которое может быть дорогим, длительным или даже неэтичным (например, попросить субъектов начать курить). [4] : 231 Набор правил является полным (его можно использовать для вывода каждого истинного утверждения в этой системе). [4] : 237 Алгоритм может определить, вычислимо ли решение для данной модели за полиномиальное время . [4] : 238
Исчисление включает три правила преобразования выражений условной вероятности с использованием оператора do.
Правило 1 разрешает добавлять или удалять наблюдения.: [4] : 235
в случае, если набор переменных Z блокирует все пути от W до Y и все стрелки, ведущие в X, были удалены. [4] : 234
Правило 2 разрешает замену вмешательства наблюдением и наоборот.: [4] : 235
в случае, если Z удовлетворяет критерию бэкдора. [4] : 234
Правило 3 разрешает удаление или добавление вмешательств.: [4]
в случае, когда нет причинно-следственных связей между X и Y. [4] : 234 : 235
Правила не подразумевают, что любой запрос может иметь удаленные операторы do. В таких случаях может быть возможно заменить переменную, которая является объектом манипуляции (например, диета), на ту, которая не является таковой (например, холестерин в крови), которую затем можно преобразовать для удаления do. Пример:
Контрфактуальные предположения рассматривают возможности, которые не встречаются в данных, например, развился бы рак у некурящего, если бы он был заядлым курильщиком. Они являются высшей ступенью на лестнице причинности Перла.
Определение: Потенциальный результат для переменной Y — это «значение, которое Y принял бы для отдельного [ необходимо разъяснение ] u , если бы X было присвоено значение x». Математически: [4] : 270
Потенциальный результат определяется на уровне отдельного человека . [4] : 270
Традиционный подход к потенциальным результатам основан на данных, а не на моделях, что ограничивает его способность распутывать причинно-следственные связи. Он рассматривает причинно-следственные вопросы как проблемы отсутствия данных и дает неправильные ответы даже на стандартные сценарии. [4] : 275
В контексте причинно-следственных моделей потенциальные результаты интерпретируются причинно, а не статистически.
Первый закон причинно-следственной связи гласит, что потенциальный результат
можно вычислить, изменив причинно-следственную модель M (удалив стрелки в X) и вычислив результат для некоторого x . Формально: [4] : 280
Исследование контрфактуального факта с использованием причинной модели включает три шага. [14] Подход действителен независимо от формы модельных отношений, линейных или иных. Когда модельные отношения полностью определены, можно вычислить точечные значения. В других случаях (например, когда доступны только вероятности) можно вычислить утверждение интервала вероятности, например, что некурящий x будет иметь 10-20% шанс заболеть раком. [4] : 279
Учитывая модель:
можно применять уравнения для расчета значений A и C, полученные из регрессионного анализа или другого метода, подставляя известные значения из наблюдения и фиксируя значения других переменных (контрфактуальные). [4] : 278
Применить абдуктивное рассуждение ( логический вывод , который использует наблюдение для поиска наиболее простого/вероятного объяснения) для оценки u , заместителя ненаблюдаемых переменных для конкретного наблюдения, которое поддерживает контрфактуальное утверждение. [4] : 278 Вычислить вероятность u с учетом пропозициональных доказательств.
Для конкретного наблюдения используйте оператор do, чтобы установить контрфактуальность (например, m = 0), изменив уравнения соответствующим образом. [4] : 278
Рассчитайте значения выходных данных ( y ), используя модифицированные уравнения. [4] : 278
Прямые и косвенные (опосредованные) причины можно различить только посредством проведения контрфактуальных исследований. [4] : 301 Понимание посредничества требует сохранения постоянного посредника при вмешательстве в прямую причину. В модели
M опосредует влияние X на Y, в то время как X также оказывает непосредственное влияние на Y. Таким образом, M остается постоянным, в то время как do(X) вычисляется.
Ошибка посредничества вместо этого подразумевает обусловленность посредника, если посредник и результат перепутаны, как в вышеприведенной модели.
Для линейных моделей косвенный эффект может быть вычислен путем умножения всех коэффициентов пути вдоль опосредованного пути. Общий косвенный эффект вычисляется путем суммирования отдельных косвенных эффектов. Для линейных моделей опосредование указывается, когда коэффициенты уравнения, подобранного без включения посредника, значительно отличаются от уравнения, включающего его. [4] : 324
В экспериментах на такой модели контролируемый прямой эффект (CDE) вычисляется путем принудительного задания значения медиатора M (do(M = 0)) и случайного назначения некоторых субъектов каждому из значений X (do(X=0), do(X=1), ...) и наблюдения за полученными значениями Y. [4] : 317
Каждому значению медиатора соответствует CDE.
Однако лучшим экспериментом будет вычисление естественного прямого эффекта (NDE). Это эффект, определяемый путем оставления связи между X и M нетронутой и вмешательства в связь между X и Y. [4] : 318
Например, рассмотрим прямой эффект увеличения количества визитов к стоматологу-гигиенисту (X) с одного раза в два года до одного раза в год, что стимулирует использование зубной нити (M). Десны (Y) становятся здоровее либо из-за гигиениста (прямое), либо из-за использования зубной нити (опосредованное/косвенное). Эксперимент заключается в том, чтобы продолжать использовать зубную нить, пропуская визит к гигиенисту.
Косвенное влияние X на Y — это «увеличение, которое мы увидим в Y, сохраняя X постоянным и увеличивая M до любого значения, которого M достигнет при единичном увеличении X». [4] : 328
Косвенные эффекты нельзя «контролировать», поскольку прямой путь нельзя отключить, удерживая другую переменную постоянной. Естественный косвенный эффект (NIE) — это эффект на здоровье десен (Y) от использования зубной нити (M). NIE рассчитывается как сумма (случаев использования зубной нити и отсутствия зубной нити) разницы между вероятностью использования зубной нити с гигиенистом и без него, или: [4] : 321
Вышеуказанный расчет NDE включает контрфактуальные индексы ( ). Для нелинейных моделей, казалось бы, очевидная эквивалентность [4] : 322
не применяется из-за аномалий, таких как пороговые эффекты и двоичные значения. Однако,
работает для всех модельных отношений (линейных и нелинейных). Это позволяет затем рассчитывать NDE напрямую из данных наблюдений, без вмешательств или использования контрфактуальных индексов. [4] : 326
Причинные модели предоставляют средство для интеграции данных между наборами данных, известное как транспорт, даже если причинные модели (и связанные с ними данные) различаются. Например, данные опроса могут быть объединены с рандомизированными контролируемыми данными испытаний. [4] : 352 Транспорт предлагает решение вопроса внешней валидности , то есть того, может ли исследование применяться в другом контексте.
Если две модели совпадают по всем соответствующим переменным, и известно, что данные из одной модели не предвзяты, данные из одной популяции могут быть использованы для вывода выводов о другой. В других случаях, когда известно, что данные предвзяты, повторное взвешивание может позволить переносить набор данных. В третьем случае выводы могут быть сделаны из неполного набора данных. В некоторых случаях данные из исследований нескольких популяций могут быть объединены (посредством переноса), чтобы сделать выводы о неизмеренной популяции. В некоторых случаях объединение оценок (например, P(W|X)) из нескольких исследований может повысить точность вывода. [4] : 355
Do-calculus предоставляет общий критерий для переноса: целевая переменная может быть преобразована в другое выражение посредством серии do-операций, которые не включают никаких «производящих разницу» переменных (тех, которые различают две популяции). [4] : 355 Аналогичное правило применяется к исследованиям, в которых участвуют относительно разные участники. [4] : 356
Любая причинно-следственная модель может быть реализована как байесовская сеть. Байесовские сети могут использоваться для предоставления обратной вероятности события (при заданном результате, каковы вероятности конкретной причины). Для этого требуется подготовка таблицы условных вероятностей, показывающей все возможные входы и результаты с их связанными вероятностями. [4] : 119
Например, если задана модель с двумя переменными: «Болезнь» и «Тест» (для болезни), то таблица условных вероятностей будет иметь вид: [4] : 117
Согласно этой таблице, при отсутствии у пациента заболевания вероятность положительного результата теста составляет 12%.
Хотя это и поддается решению для небольших задач, по мере увеличения числа переменных и связанных с ними состояний таблица вероятностей (и связанное с ней время вычислений) увеличивается экспоненциально. [4] : 121
Байесовские сети используются в коммерческих целях в таких приложениях, как исправление ошибок в беспроводных данных и анализ ДНК. [4] : 122
Другая концептуализация причинности включает понятие инвариантных отношений. В случае идентификации рукописных цифр форма цифры контролирует значение, поэтому форма и значение являются инвариантами. Изменение формы меняет значение. Другие свойства этого не делают (например, цвет). Эта инвариантность должна переноситься на наборы данных, созданные в разных контекстах (неинвариантные свойства формируют контекст). Вместо обучения (оценки причинности) с использованием объединенных наборов данных, обучение на одном и тестирование на другом может помочь отличить вариантные свойства от инвариантных. [15]