Вероятностная причинность — это концепция в группе философских теорий, которые стремятся охарактеризовать связь между причиной и следствием с помощью инструментов теории вероятностей . Центральная идея этих теорий заключается в том, что причины повышают вероятность своих следствий, при прочих равных условиях .
Интерпретация причинности как детерминированного отношения означает, что если A вызывает B , то за A всегда должно следовать B. В этом смысле война не вызывает смертей, а курение не вызывает рак . В результате многие обращаются к понятию вероятностной причинности. Неформально, A вероятностно вызывает B, если возникновение A увеличивает вероятность B. Иногда это интерпретируется как отражение несовершенного знания детерминированной системы, но в других случаях интерпретируется как то, что изучаемая причинная система имеет изначально недетерминированную природу. ( Вероятность склонности — аналогичная идея, согласно которой вероятности имеют объективное существование и не являются просто ограничениями в знаниях субъекта).
Такие философы, как Хью Меллор [1] и Патрик Саппс [2], определили причинность в терминах причины, предшествующей и увеличивающей вероятность следствия. (Кроме того, Меллор утверждает, что причина и следствие являются фактами, а не событиями, поскольку даже несобытие, например, опоздание поезда, может вызвать следствия, например, мою поездку на автобусе. Саппс, напротив, опирается на события, определенные теоретико-множественными методами, и большая часть его рассуждений основана на этой терминологии.) [3]
Перл [4] утверждает, что все предприятие вероятностной причинности было ошибочным с самого начала, потому что центральное понятие, которое вызывает «повышение вероятности» их эффектов, не может быть выражено на языке теории вероятностей. В частности, неравенство Pr(эффект | причина) > Pr(эффект | ~причина) , которое философы использовали для определения причинности, а также его многочисленные вариации и нюансы, не в состоянии уловить интуицию, лежащую в основе «повышения вероятности», которая по своей сути является манипулятивным или контрфактуальным понятием. Правильная формулировка, по мнению Перла, должна выглядеть так:
где do(C) обозначает внешнее вмешательство, которое заставляет истинность C . Условная вероятность Pr(E | C) , напротив, представляет собой вероятность, возникающую в результате пассивного наблюдения за C , и редко совпадает с Pr(E | do(C)) . Действительно, наблюдение за падением барометра увеличивает вероятность наступления шторма, но не «вызывает» шторм; если бы действие манипулирования барометром изменяло вероятность штормов, падающий барометр квалифицировался бы как причина штормов. В целом, формулирование понятия «повышения вероятности» в исчислении do -операторов [4] разрешает трудности, с которыми вероятностная причинность столкнулась за последние полвека, [2] [5] [6] среди них печально известный парадокс Симпсона , и проясняет, какие именно отношения существуют между вероятностями и причинностью.
Установление причины и следствия, даже при таком расслабленном прочтении, печально известно, что выражено в широко распространенном утверждении « Корреляция не подразумевает причинно-следственную связь ». Например, наблюдение, что у курильщиков резко возрос уровень рака легких, не устанавливает, что курение должно быть причиной этого повышенного уровня рака: возможно, существует определенный генетический дефект, который вызывает как рак, так и тягу к никотину; или даже, возможно, тяга к никотину является симптомом рака легких на очень ранней стадии, который иным образом не обнаруживается. Ученые всегда ищут точные механизмы, посредством которых событие A производит событие B. Но ученые также с комфортом делают заявление вроде «Курение, вероятно, вызывает рак», когда статистическая корреляция между ними, согласно теории вероятности, намного больше, чем случайность. В этом двойном подходе ученые принимают как детерминированную, так и вероятностную причинно-следственную связь в своей терминологии.
В статистике , как правило, принято считать, что наблюдательные исследования (например, подсчет случаев рака среди курящих и некурящих и последующее сравнение этих двух) могут дать подсказки, но никогда не могут установить причину и следствие. Часто, однако, качественные причинные предположения (например, отсутствие причинно-следственной связи между некоторыми переменными) могут позволить вывести последовательные оценки причинно-следственной связи из наблюдательных исследований. [4]
Золотым стандартом причинно-следственной связи здесь является рандомизированный эксперимент : возьмите большое количество людей, случайным образом разделите их на две группы, заставьте одну группу курить и запретите другой группе курить, затем определите, разовьется ли у одной группы значительно более высокий уровень рака легких. Случайное распределение играет решающую роль в выводе о причинно-следственной связи, поскольку в долгосрочной перспективе оно делает две группы эквивалентными с точки зрения всех других возможных эффектов на результат (рак), так что любые изменения в результате будут отражать только манипуляцию (курение). Очевидно, что по этическим причинам этот эксперимент не может быть проведен, но метод широко применим для менее разрушительных экспериментов. Однако одним из ограничений экспериментов является то, что, хотя они хорошо справляются с проверкой наличия некоторого причинно-следственного эффекта, они хуже с оценкой размера этого эффекта в интересующей популяции. (Это распространенная критика исследований безопасности пищевых добавок, в которых используются дозы, намного превышающие те, которые люди, потребляющие продукт, фактически могли бы употребить.)
В закрытой системе данные могут предполагать, что причина A * B предшествует следствию C в определенном интервале времени τ . Это отношение может определять причинность с уверенностью, ограниченной τ . Однако это же отношение может не быть детерминированным с уверенностью в открытой системе, где неконтролируемые факторы могут влиять на результат. [7]
Примером может служить система A, B и C, где A, B и C известны. Характеристики приведены ниже и ограничены заданным временем (например, 50 мс или 50 часов). "^" означает "не", "*" означает "и":
^А * ^Б => ^С (99,9999998027%)
А * ^Б => ^С (99,9999998027%)
^А * В => ^С (99,9999998027%)
А * В => С (99,9999998027%)
Можно обоснованно утверждать, в пределах 6 стандартных отклонений , что A * B вызывает C, учитывая временные границы (например, 50 мс или 50 часов) , ЕСЛИ И ТОЛЬКО ЕСЛИ A, B и C являются единственными частями рассматриваемой системы. Любой результат за пределами этого может считаться отклонением.