stringtranslate.com

Причинно-следственная модель

Сравнение двух конкурирующих причинно-следственных моделей (DCM, GCM), используемых для интерпретации изображений фМРТ [1]

В метафизике каузальная модель (или структурная каузальная модель ) — это концептуальная модель , описывающая каузальные механизмы системы . При разработке каузальной модели могут использоваться несколько типов каузальных обозначений . Каузальные модели могут улучшить дизайн исследования, предоставляя четкие правила для принятия решения о том , какие независимые переменные необходимо включить/контролировать.

Они могут позволить получить ответы на некоторые вопросы на основе существующих наблюдательных данных без необходимости проведения интервенционного исследования, такого как рандомизированное контролируемое исследование . Некоторые интервенционные исследования нецелесообразны по этическим или практическим причинам, что означает, что без причинно-следственной модели некоторые гипотезы не могут быть проверены.

Причинно-следственные модели могут помочь с вопросом внешней валидности (применимы ли результаты одного исследования к неизученным популяциям). Причинно-следственные модели могут позволить объединить данные из нескольких исследований (в определенных обстоятельствах) для ответа на вопросы, на которые не может ответить ни один отдельный набор данных.

Причинно-следственные модели нашли применение в обработке сигналов , эпидемиологии и машинном обучении . [2]

Определение

Причинные модели — это математические модели, представляющие причинные связи в рамках отдельной системы или популяции. Они облегчают выводы о причинных связях из статистических данных. Они могут многому нас научить в области эпистемологии причинности и в отношении причинности и вероятности. Они также применялись к темам, представляющим интерес для философов, таким как логика контрфактуальностей, теория принятия решений и анализ фактической причинности. [3]

—  Стэнфордская энциклопедия философии

Джуда Перл определяет причинно-следственную модель как упорядоченную тройку , где U — набор экзогенных переменных , значения которых определяются факторами вне модели; V — набор эндогенных переменных, значения которых определяются факторами внутри модели; а E — набор структурных уравнений , которые выражают значение каждой эндогенной переменной как функцию значений других переменных в U и V. [2]

История

Аристотель определил таксономию причинности, включая материальные, формальные, эффективные и конечные причины. Юм отверг таксономию Аристотеля в пользу контрфактуальностей . В какой-то момент он отрицал, что объекты обладают «силами», которые делают один причиной, а другой следствием. Позже он принял «если бы не было первого объекта, то и второго никогда бы не существовало» (« but-for » причинность). [4]

В конце 19 века начала формироваться дисциплина статистики. После многолетних усилий по выявлению причинно-следственных правил для таких областей, как биологическое наследование, Гальтон ввел концепцию средней регрессии (олицетворенной спадом в спорте на втором курсе), которая позже привела его к непричинной концепции корреляции . [4]

Будучи позитивистом , Пирсон исключил понятие причинности из большей части науки как недоказуемый частный случай ассоциации и ввел коэффициент корреляции как метрику ассоциации. Он писал: «Сила как причина движения — это то же самое, что бог дерева как причина роста», и что причинность была всего лишь «фетишем среди непостижимых тайн современной науки». Пирсон основал Biometrika и Биометрическую лабораторию в Университетском колледже Лондона , которая стала мировым лидером в области статистики. [4]

В 1908 году Харди и Вайнберг решили проблему стабильности признаков , которая заставила Гальтона отказаться от причинности, возродив менделевское наследование . [4]

В 1921 году анализ путей Райта стал теоретическим предшественником причинного моделирования и причинных графов . [5] Он разработал этот подход, пытаясь распутать относительное влияние наследственности , развития и окружающей среды на рисунок шерсти морских свинок . Он подкрепил свои тогда еретические утверждения, показав, как такой анализ может объяснить связь между массой тела морской свинки при рождении, внутриутробным временем и размером помета. Противодействие этим идеям со стороны выдающихся статистиков привело к тому, что их игнорировали в течение следующих 40 лет (за исключением селекционеров животных). Вместо этого ученые полагались на корреляции, отчасти по просьбе критика Райта (и ведущего статистика) Фишера . [4] Одним из исключений была Беркс , студентка, которая в 1926 году первой применила диаграммы путей для представления опосредующего влияния ( медиатора ) и утверждала, что сохранение постоянного медиатора приводит к ошибкам. Она, возможно, изобрела диаграммы путей независимо. [4] : 304 

В 1923 году Нейман представил концепцию потенциального результата, но его работа не была переведена с польского на английский язык до 1990 года. [4] : 271 

В 1958 году Кокс предупредил, что контроль переменной Z допустим только в том случае, если крайне маловероятно, что на нее повлияют независимые переменные. [4] : 154 

В 1960-х годах Дункан , Блэлок , Голдбергер и другие заново открыли анализ путей. Читая работу Блэлока о диаграммах путей, Дункан вспомнил лекцию Огберна двадцатью годами ранее, в которой упоминалась статья Райта, в которой, в свою очередь, упоминался Беркс. [4] : 308 

Социологи изначально называли причинные модели структурным моделированием уравнений , но как только это стало механическим методом, оно утратило свою полезность, что привело к тому, что некоторые практики отвергли любую связь с причинностью. Экономисты приняли алгебраическую часть анализа пути, назвав ее одновременным моделированием уравнений. Однако экономисты по-прежнему избегали приписывать своим уравнениям причинное значение. [4]

Спустя шестьдесят лет после своей первой статьи Райт опубликовал статью, в которой изложил ее суть, после критики Карлина и др., которые возражали, что она рассматривает только линейные зависимости и что надежные, не основанные на моделях представления данных более показательны. [4]

В 1973 году Льюис выступил за замену корреляции на причинность (контрфактуальность). Он ссылался на способность людей представлять себе альтернативные миры, в которых причина произошла или не произошла, и в которых следствие появилось только после своей причины. [4] : 266  В 1974 году Рубин ввел понятие «потенциальных результатов» как языка для постановки причинных вопросов. [4] : 269 

В 1983 году Картрайт предложил, чтобы любой фактор, который «причинно связан» с эффектом, обусловливался, выходя за рамки простой вероятности как единственного ориентира. [4] : 48 

В 1986 году Барон и Кенни представили принципы обнаружения и оценки посредничества в системе линейных уравнений. По состоянию на 2014 год их статья была 33-й по частоте цитирования за все время. [4] : 324  В том же году Гринланд и Робинс представили подход «заменяемости» к обработке искажений путем рассмотрения контрфактуальности. Они предложили оценить, что бы произошло с группой лечения, если бы они не получили лечение, и сравнить этот результат с результатом контрольной группы. Если они совпадали, искажения считались отсутствующими. [4] : 154 

Лестница причинно-следственной связи

Причинная метамодель Перла включает в себя трехуровневую абстракцию, которую он называет лестницей причинности. Самый низкий уровень, Ассоциация (видение/наблюдение), подразумевает восприятие закономерностей или шаблонов во входных данных, выраженных в виде корреляций. Средний уровень, Вмешательство (действие), предсказывает последствия преднамеренных действий, выраженных в виде причинно-следственных связей. Самый высокий уровень, Контрфактуальность (воображение), включает в себя построение теории (части) мира, которая объясняет, почему определенные действия имеют определенные последствия и что происходит при отсутствии таких действий. [4]

Ассоциация

Один объект ассоциируется с другим, если наблюдение одного изменяет вероятность наблюдения другого. Пример: покупатели, которые покупают зубную пасту, с большей вероятностью купят также зубную нить. Математически:

или вероятность (покупки) зубной нити при (покупке) зубной пасты. Ассоциации также можно измерить, вычислив корреляцию двух событий. Ассоциации не имеют причинно-следственных связей. Одно событие может вызвать другое, может быть верным обратное, или оба события могут быть вызваны каким-то третьим событием (недовольный гигиенист стыдит покупателя, заставляя его лучше ухаживать за полостью рта). [4]

Вмешательство

Этот уровень утверждает конкретные причинно-следственные связи между событиями. Причинность оценивается путем экспериментального выполнения некоторого действия, которое влияет на одно из событий. Пример: после удвоения цены зубной пасты, какова будет новая вероятность покупки? Причинность не может быть установлена ​​путем изучения истории (изменений цен), поскольку изменение цены могло произойти по какой-то другой причине, которая сама по себе могла повлиять на второе событие (тариф, который увеличивает цену обоих товаров). Математически:

где do — оператор, который сигнализирует об экспериментальном вмешательстве (удвоении цены). [4] Оператор указывает на выполнение минимального изменения в мире, необходимого для создания желаемого эффекта, «мини-операцию» на модели с минимальными изменениями по сравнению с реальностью. [6]

Контрфактуальные факты

Самый высокий уровень, контрфактуальный, предполагает рассмотрение альтернативной версии прошлого события или того, что могло бы произойти при других обстоятельствах для той же экспериментальной единицы. Например, какова вероятность того, что если бы магазин удвоил цену на зубную нить, покупатель, покупающий зубную пасту, все равно купил бы ее?

Контрфактуальные утверждения могут указывать на существование причинно-следственной связи. Модели, которые могут отвечать контрфактуальным утверждениям, позволяют осуществлять точные вмешательства, последствия которых можно предсказать. В крайнем случае такие модели принимаются как физические законы (как в законах физики, например, инерции, которая гласит, что если сила не приложена к неподвижному объекту, он не будет двигаться). [4]

Причинность

Причинность против корреляции

Статистика вращается вокруг анализа взаимосвязей между несколькими переменными. Традиционно эти взаимосвязи описываются как корреляции , ассоциации без каких-либо подразумеваемых причинно-следственных связей. Причинно-следственные модели пытаются расширить эту структуру, добавляя понятие причинно-следственных связей, в которых изменения одной переменной вызывают изменения других. [2]

Определения причинности двадцатого века основывались исключительно на вероятностях/ассоциациях. Одно событие ( ) считалось причиной другого, если оно повышало вероятность другого ( ). Математически это выражается как:

.

Такие определения неадекватны, поскольку другие отношения (например, общая причина для и ) могут удовлетворять условию. Причинность имеет отношение ко второй ступени лестницы. Ассоциации находятся на первой ступени и предоставляют только доказательства для последней. [4]

Более позднее определение попыталось устранить эту неоднозначность, обуславливая фоновые факторы. Математически:

,

где — набор фоновых переменных, а представляет значения этих переменных в определенном контексте. Однако требуемый набор фоновых переменных неопределен (множественные наборы могут увеличить вероятность), пока вероятность является единственным критерием [ необходимо разъяснение ] . [4]

Другие попытки определить причинность включают причинность по Грейнджеру , статистическую проверку гипотезы о том, что причинностьэкономике ) можно оценить путем измерения способности предсказывать будущие значения одного временного ряда, используя предыдущие значения другого временного ряда. [4]

Типы

Причина может быть необходимой, достаточной, способствующей или их комбинацией. [7]

Необходимый

Для того, чтобы x был необходимой причиной y , наличие y должно подразумевать предшествующее возникновение x . Однако наличие x не подразумевает, что y произойдет. [8] Необходимые причины также известны как причины «но», например, y не произошло бы, если бы не возникновение x . [4] : 261 

Достаточные причины

Для того, чтобы x был достаточной причиной y , наличие x должно подразумевать последующее возникновение y . Однако другая причина z может независимо вызывать y . Таким образом, наличие y не требует предшествующего возникновения x . [8]

Сопутствующие причины

Для того, чтобы x был сопутствующей причиной y , наличие x должно увеличить вероятность y . Если вероятность составляет 100%, то x вместо этого называется достаточным. Также может быть необходима сопутствующая причина. [9]

Модель

Диаграмма причинно-следственных связей

Причинно-следственная диаграмма — это направленный граф , отображающий причинно-следственные связи между переменными в причинно-следственной модели. Причинно-следственная диаграмма включает в себя набор переменных (или узлов ). Каждый узел соединен стрелкой с одним или несколькими другими узлами, на которые он оказывает причинное влияние. Наконечник стрелки обозначает направление причинно-следственной связи, например, стрелка, соединяющая переменные , а наконечник стрелки указывает на то, что изменение в вызывает изменение в (с соответствующей вероятностью). Путь — это обход графа между двумя узлами, следующий за причинными стрелками. [4]

Причинно-следственные диаграммы включают в себя причинно-следственные диаграммы , направленные ациклические графы и диаграммы Ишикавы . [4]

Причинно-следственные диаграммы независимы от количественных вероятностей, которые их информируют. Изменения этих вероятностей (например, из-за технологических усовершенствований) не требуют изменений в модели. [4]

Элементы модели

Причинно-следственные модели имеют формальные структуры с элементами, обладающими определенными свойствами. [4]

Модели соединений

Три типа соединений трех узлов — это линейные цепи, разветвленные вилки и сливающиеся коллайдеры. [4]

Цепь

Цепи — это прямые линии связи со стрелками, указывающими от причины к следствию. В этой модели является посредником, поскольку он опосредует изменение, которое в противном случае имело бы место на . [4] : 113 

Вилка

В форках одна причина имеет несколько следствий. Два следствия имеют общую причину. Существует (непричинная) ложная корреляция между и , которая может быть устранена путем обусловливания (для определенного значения ). [4] : 114 

«Обусловливание » означает «задано » (т.е. задано значение ).

Разработка вилки является запутывающим фактором:

В таких моделях является общей причиной и (которая также вызывает ), что делает конфаундер [ необходимо разъяснение ] . [4] : 114 

Коллайдер

В коллайдерах несколько причин влияют на один результат. Обусловливание (для определенного значения ) часто выявляет некаузальную отрицательную корреляцию между и . Эта отрицательная корреляция была названа смещением коллайдера и эффектом «объяснения», поскольку объясняет корреляцию между и . [4] : 115  Корреляция может быть положительной в случае, когда вклады от обоих и необходимы для влияния на . [4] : 197 

Типы узлов

Посредник

Узел-посредник изменяет влияние других причин на результат (в отличие от простого влияния на результат). [4] : 113  Например, в приведенном выше примере цепочки является посредником, поскольку он изменяет влияние (косвенной причины ) на (результат).

Смутитель

Узел-конфаундер влияет на несколько результатов, создавая положительную корреляцию между ними. [4] : 114 

Инструментальная переменная

Инструментальная переменная – это та, которая: [4] : 246 

Коэффициенты регрессии могут служить оценками причинного эффекта инструментальной переменной на результат, пока этот эффект не является смешанным. Таким образом, инструментальные переменные позволяют количественно оценить причинные факторы без данных о смешанных факторах. [4] : 249 

Например, если взять модель:

является инструментальной переменной, поскольку она имеет путь к результату и не смешана, например, с помощью .

В приведенном выше примере, если и принимают двоичные значения, то предположение, что не выполняется, называется монотонностью [ необходимо разъяснение ] . [4] : 253 

Усовершенствования техники [ требуется разъяснение ] включают создание инструмента [ требуется разъяснение ] путем создания условий для другой переменной [ требуется разъяснение ] для блокировки [ требуется разъяснение ] путей [ требуется разъяснение ] между инструментом и фактором, вызывающим затруднение [ требуется разъяснение ] и объединения нескольких переменных для формирования единого инструмента [ требуется разъяснение ] . [4] : 257 

Менделевская рандомизация

Определение: Менделевская рандомизация использует измеренные вариации в генах с известной функцией для изучения причинно-следственной связи модифицируемого воздействия с заболеванием в наблюдательных исследованиях . [10] [11]

Поскольку гены изменяются случайным образом в разных популяциях, наличие гена обычно квалифицируется как инструментальная переменная, подразумевая, что во многих случаях причинно-следственную связь можно количественно оценить с помощью регрессии в наблюдательном исследовании. [4] : 255 

Ассоциации

Условия независимости

Условия независимости — это правила для принятия решения о том, являются ли две переменные независимыми друг от друга. Переменные независимы, если значения одной из них не влияют напрямую на значения другой. Несколько причинно-следственных моделей могут разделять условия независимости. Например, модели

и

имеют одинаковые условия независимости, поскольку обусловленность на листьях и независима. Однако эти две модели не имеют одинакового значения и могут быть фальсифицированы на основе данных (то есть, если данные наблюдений показывают связь между и после обусловленности на , то обе модели неверны). И наоборот, данные не могут показать, какая из этих двух моделей верна, поскольку они имеют одинаковые условия независимости.

Обусловливание переменной — это механизм проведения гипотетических экспериментов. Обусловливание переменной включает анализ значений других переменных для заданного значения условной переменной. В первом примере обусловливание подразумевает, что наблюдения для заданного значения не должны показывать никакой зависимости между и . Если такая зависимость существует, то модель неверна. Некаузальные модели не могут делать такие различия, потому что они не делают каузальных утверждений. [4] : 129–130 

Конфаундер/деконфаундер

Существенным элементом дизайна корреляционного исследования является выявление потенциально искажающих влияний на изучаемую переменную, например, демографических. Эти переменные контролируются для устранения этих влияний. Однако правильный список искажающих переменных не может быть определен априори . Таким образом, возможно, что исследование может контролировать нерелевантные переменные или даже (косвенно) изучаемую переменную. [4] : 139 

Причинно-следственные модели предлагают надежный метод для определения соответствующих смешивающих переменных. Формально Z является смешивающим фактором, если «Y связан с Z через пути, не проходящие через X». Их часто можно определить с использованием данных, собранных для других исследований. Математически, если

X и Y смешаны (из-за некоторой переменной-конфаундера Z). [4] : 151 

Ранее, предположительно, неверные определения фактора, вызывающего сомнение, включали: [4] : 152 

Последнее имеет недостаток, поскольку в модели:

Z соответствует определению, но является посредником, а не фактором, искажающим результаты, и является примером контроля результата.

В модели

Традиционно B считался фактором, мешающим, поскольку он связан с X и Y, но не находится на причинно-следственной связи и не является потомком чего-либо на причинно-следственной связи. Контроль B приводит к тому, что он становится фактором, мешающим. Это известно как M-смещение. [4] : 161 

Регулировка задней двери

Для анализа причинного эффекта X на Y в причинной модели все переменные-конфаундеры должны быть рассмотрены (деконфаундинг). Чтобы определить набор конфаундеров, (1) каждый некаузальный путь между X и Y должен быть заблокирован этим набором; (2) без нарушения каких-либо причинных путей; и (3) без создания каких-либо ложных путей. [4] : 158 

Определение : бэкдор-путь от переменной X к Y — это любой путь от X к Y, который начинается со стрелки, указывающей на X. [4] : 158 

Определение : Для заданной упорядоченной пары переменных (X,Y) в модели набор переменных-конфаундеров Z удовлетворяет критерию бэкдора, если (1) ни одна переменная-конфаундер Z не является потомком X и (2) все пути бэкдора между X и Y блокируются набором переменных-конфаундеров.

Если критерий бэкдора выполняется для (X,Y), X и Y деконфаундируются набором переменных-конфаундеров. Нет необходимости контролировать какие-либо переменные, кроме конфаундеров. [4] : 158  Критерий бэкдора является достаточным, но не необходимым условием для нахождения набора переменных Z для деконфаундирования анализа причинного эффекта X на y.

Когда причинно-следственная модель является правдоподобным представлением реальности и критерий бэкдора выполняется, то частичные коэффициенты регрессии могут использоваться как (причинно-следственные) коэффициенты пути (для линейных отношений). [4] : 223  [12]

[4] : 227 

Регулировка передней двери

Если элементы блокирующего пути не поддаются наблюдению, бэкдор-путь не поддается вычислению, но если все прямые пути из имеют элементы , которые не соединяются открытыми путями , то , множество всех s, может измерять . Фактически, существуют условия, при которых может выступать в качестве прокси для .

Определение : путь входа — это прямой причинный путь, для которого доступны данные для всех , [4] : ​​226  перехватывает все направленные пути к , нет незаблокированных путей от к , и все пути входа от к заблокированы . [13]

Следующий пример преобразует выражение do в выражение do-free, обуславливая переменные по пути «входной двери». [4] : 226 

Предполагая, что данные для этих наблюдаемых вероятностей доступны, окончательную вероятность можно вычислить без эксперимента, независимо от существования других мешающих путей и без подстройки под бэкдор. [4] : 226 

Вмешательства

Запросы

Запросы — это вопросы, задаваемые на основе определенной модели. Обычно на них отвечают путем проведения экспериментов (вмешательств). Вмешательства принимают форму фиксации значения одной переменной в модели и наблюдения за результатом. Математически такие запросы имеют вид (из примера): [4] : 8 

где оператор do указывает, что эксперимент явно изменил цену зубной пасты. Графически это блокирует любые причинные факторы, которые в противном случае могли бы повлиять на эту переменную. Диаграммно это стирает все причинные стрелки, указывающие на экспериментальную переменную. [4] : 40 

Возможны более сложные запросы, в которых оператор do применяется (значение фиксируется) к нескольким переменным.

Интервенционное распределение

Делать исчисления

Исчисление do — это набор манипуляций, доступных для преобразования одного выражения в другое, с общей целью преобразования выражений, содержащих оператор do, в выражения, которые его не содержат. Выражения, не содержащие оператор do, можно оценить только на основе наблюдательных данных, без необходимости экспериментального вмешательства, которое может быть дорогим, длительным или даже неэтичным (например, попросить субъектов начать курить). [4] : 231  Набор правил является полным (его можно использовать для вывода каждого истинного утверждения в этой системе). [4] : 237  Алгоритм может определить, вычислимо ли решение для данной модели за полиномиальное время . [4] : 238 

Правила

Исчисление включает три правила преобразования выражений условной вероятности с использованием оператора do.

Правило 1

Правило 1 разрешает добавлять или удалять наблюдения.: [4] : 235 

в случае, если набор переменных Z блокирует все пути от W до Y и все стрелки, ведущие в X, были удалены. [4] : 234 

Правило 2

Правило 2 разрешает замену вмешательства наблюдением и наоборот.: [4] : 235 

в случае, если Z удовлетворяет критерию бэкдора. [4] : 234 

Правило 3

Правило 3 разрешает удаление или добавление вмешательств.: [4]

в случае, когда нет причинно-следственных связей между X и Y. [4] : 234  : 235 

Расширения

Правила не подразумевают, что любой запрос может иметь удаленные операторы do. В таких случаях может быть возможно заменить переменную, которая является объектом манипуляции (например, диета), на ту, которая не является таковой (например, холестерин в крови), которую затем можно преобразовать для удаления do. Пример:

Контрфактуальные факты

Контрфактуальные предположения рассматривают возможности, которые не встречаются в данных, например, развился бы рак у некурящего, если бы он был заядлым курильщиком. Они являются высшей ступенью на лестнице причинности Перла.

Возможный результат

Определение: Потенциальный результат для переменной Y — это «значение, которое Y принял бы для отдельного [ необходимо разъяснение ] u , если бы X было присвоено значение x». Математически: [4] : 270 

или .

Потенциальный результат определяется на уровне отдельного человека . [4] : 270 

Традиционный подход к потенциальным результатам основан на данных, а не на моделях, что ограничивает его способность распутывать причинно-следственные связи. Он рассматривает причинно-следственные вопросы как проблемы отсутствия данных и дает неправильные ответы даже на стандартные сценарии. [4] : 275 

Причинно-следственный вывод

В контексте причинно-следственных моделей потенциальные результаты интерпретируются причинно, а не статистически.

Первый закон причинно-следственной связи гласит, что потенциальный результат

можно вычислить, изменив причинно-следственную модель M (удалив стрелки в X) и вычислив результат для некоторого x . Формально: [4] : 280 

Проведение контрфактуального

Исследование контрфактуального факта с использованием причинной модели включает три шага. [14] Подход действителен независимо от формы модельных отношений, линейных или иных. Когда модельные отношения полностью определены, можно вычислить точечные значения. В других случаях (например, когда доступны только вероятности) можно вычислить утверждение интервала вероятности, например, что некурящий x будет иметь 10-20% шанс заболеть раком. [4] : 279 

Учитывая модель:

можно применять уравнения для расчета значений A и C, полученные из регрессионного анализа или другого метода, подставляя известные значения из наблюдения и фиксируя значения других переменных (контрфактуальные). [4] : 278 

Похищать

Применить абдуктивное рассуждение ( логический вывод , который использует наблюдение для поиска наиболее простого/вероятного объяснения) для оценки u , заместителя ненаблюдаемых переменных для конкретного наблюдения, которое поддерживает контрфактуальное утверждение. [4] : 278  Вычислить вероятность u с учетом пропозициональных доказательств.

Действовать

Для конкретного наблюдения используйте оператор do, чтобы установить контрфактуальность (например, m = 0), изменив уравнения соответствующим образом. [4] : 278 

Предсказывать

Рассчитайте значения выходных данных ( y ), используя модифицированные уравнения. [4] : 278 

Медиация

Прямые и косвенные (опосредованные) причины можно различить только посредством проведения контрфактуальных исследований. [4] : 301  Понимание посредничества требует сохранения постоянного посредника при вмешательстве в прямую причину. В модели

M опосредует влияние X на Y, в то время как X также оказывает непосредственное влияние на Y. Таким образом, M остается постоянным, в то время как do(X) вычисляется.

Ошибка посредничества вместо этого подразумевает обусловленность посредника, если посредник и результат перепутаны, как в вышеприведенной модели.

Для линейных моделей косвенный эффект может быть вычислен путем умножения всех коэффициентов пути вдоль опосредованного пути. Общий косвенный эффект вычисляется путем суммирования отдельных косвенных эффектов. Для линейных моделей опосредование указывается, когда коэффициенты уравнения, подобранного без включения посредника, значительно отличаются от уравнения, включающего его. [4] : 324 

Прямой эффект

В экспериментах на такой модели контролируемый прямой эффект (CDE) вычисляется путем принудительного задания значения медиатора M (do(M = 0)) и случайного назначения некоторых субъектов каждому из значений X (do(X=0), do(X=1), ...) и наблюдения за полученными значениями Y. [4] : 317 

Каждому значению медиатора соответствует CDE.

Однако лучшим экспериментом будет вычисление естественного прямого эффекта (NDE). Это эффект, определяемый путем оставления связи между X и M нетронутой и вмешательства в связь между X и Y. [4] : 318 

Например, рассмотрим прямой эффект увеличения количества визитов к стоматологу-гигиенисту (X) с одного раза в два года до одного раза в год, что стимулирует использование зубной нити (M). Десны (Y) становятся здоровее либо из-за гигиениста (прямое), либо из-за использования зубной нити (опосредованное/косвенное). Эксперимент заключается в том, чтобы продолжать использовать зубную нить, пропуская визит к гигиенисту.

Косвенный эффект

Косвенное влияние X на Y — это «увеличение, которое мы увидим в Y, сохраняя X постоянным и увеличивая M до любого значения, которого M достигнет при единичном увеличении X». [4] : 328 

Косвенные эффекты нельзя «контролировать», поскольку прямой путь нельзя отключить, удерживая другую переменную постоянной. Естественный косвенный эффект (NIE) — это эффект на здоровье десен (Y) от использования зубной нити (M). NIE рассчитывается как сумма (случаев использования зубной нити и отсутствия зубной нити) разницы между вероятностью использования зубной нити с гигиенистом и без него, или: [4] : 321 

Вышеуказанный расчет NDE включает контрфактуальные индексы ( ). Для нелинейных моделей, казалось бы, очевидная эквивалентность [4] : 322 

не применяется из-за аномалий, таких как пороговые эффекты и двоичные значения. Однако,

работает для всех модельных отношений (линейных и нелинейных). Это позволяет затем рассчитывать NDE напрямую из данных наблюдений, без вмешательств или использования контрфактуальных индексов. [4] : 326 

Транспортабельность

Причинные модели предоставляют средство для интеграции данных между наборами данных, известное как транспорт, даже если причинные модели (и связанные с ними данные) различаются. Например, данные опроса могут быть объединены с рандомизированными контролируемыми данными испытаний. [4] : 352  Транспорт предлагает решение вопроса внешней валидности , то есть того, может ли исследование применяться в другом контексте.

Если две модели совпадают по всем соответствующим переменным, и известно, что данные из одной модели не предвзяты, данные из одной популяции могут быть использованы для вывода выводов о другой. В других случаях, когда известно, что данные предвзяты, повторное взвешивание может позволить переносить набор данных. В третьем случае выводы могут быть сделаны из неполного набора данных. В некоторых случаях данные из исследований нескольких популяций могут быть объединены (посредством переноса), чтобы сделать выводы о неизмеренной популяции. В некоторых случаях объединение оценок (например, P(W|X)) из нескольких исследований может повысить точность вывода. [4] : 355 

Do-calculus предоставляет общий критерий для переноса: целевая переменная может быть преобразована в другое выражение посредством серии do-операций, которые не включают никаких «производящих разницу» переменных (тех, которые различают две популяции). [4] : 355  Аналогичное правило применяется к исследованиям, в которых участвуют относительно разные участники. [4] : 356 

Байесовская сеть

Любая причинно-следственная модель может быть реализована как байесовская сеть. Байесовские сети могут использоваться для предоставления обратной вероятности события (при заданном результате, каковы вероятности конкретной причины). Для этого требуется подготовка таблицы условных вероятностей, показывающей все возможные входы и результаты с их связанными вероятностями. [4] : 119 

Например, если задана модель с двумя переменными: «Болезнь» и «Тест» (для болезни), то таблица условных вероятностей будет иметь вид: [4] : 117 

Согласно этой таблице, при отсутствии у пациента заболевания вероятность положительного результата теста составляет 12%.

Хотя это и поддается решению для небольших задач, по мере увеличения числа переменных и связанных с ними состояний таблица вероятностей (и связанное с ней время вычислений) увеличивается экспоненциально. [4] : 121 

Байесовские сети используются в коммерческих целях в таких приложениях, как исправление ошибок в беспроводных данных и анализ ДНК. [4] : 122 

Инварианты/контекст

Другая концептуализация причинности включает понятие инвариантных отношений. В случае идентификации рукописных цифр форма цифры контролирует значение, поэтому форма и значение являются инвариантами. Изменение формы меняет значение. Другие свойства этого не делают (например, цвет). Эта инвариантность должна переноситься на наборы данных, созданные в разных контекстах (неинвариантные свойства формируют контекст). Вместо обучения (оценки причинности) с использованием объединенных наборов данных, обучение на одном и тестирование на другом может помочь отличить вариантные свойства от инвариантных. [15]

Смотрите также

Ссылки

  1. ^ Карл Фристон (февраль 2009 г.). «Причинное моделирование и мозговая связность в функциональной магнитно-резонансной томографии». PLOS Biology . 7 (2): e1000033. doi : 10.1371/journal.pbio.1000033 . PMC  2642881. PMID  19226186 .
  2. ^ abc Pearl 2009.
  3. ^ Хичкок, Кристофер (2018), «Причинные модели», в Zalta, Edward N. (ред.), The Stanford Encyclopedia of Philosophy (ред. осень 2018 г.), Metaphysics Research Lab, Stanford University , получено 08.09.2018
  4. ^ abcdefghijklmnopqrstu vwxyz aa ab ac ad ae af ag ah ai aj ak al am an ao ap aq ar as at au av aw ax ay az ba bb bc bd be bf bg bh bi bj bk bl bm bn bo bp bq br bs bt bu bv bw bx by bz ca cb cc cd ce cf cg ch ci cj ck cl Pearl, Judea ; Mackenzie, Dana (2018-05-15). Книга «Почему?»: Новая наука о причине и следствии. Базовые книги. ISBN 9780465097616.
  5. ^ Окаша, Самир (2012-01-12). «Причинность в биологии». В Beebee, Helen; Hitchcock, Christopher; Menzies, Peter (ред.). Оксфордский справочник по причинности. Том 1. OUP Oxford. doi :10.1093/oxfordhb/9780199279739.001.0001. ISBN 9780191629464.
  6. ^ Pearl, Judea (2021). «Причинный и контрфактуальный вывод». В Knauff, Markus; Spohn, Wolfgang (ред.). Справочник по рациональности . MIT Press . doi : 10.7551/mitpress/11252.003.0044. ISBN 9780262366175.
  7. ^ Эпп, Сусанна С. (2004). Дискретная математика с приложениями. Томсон-Брукс/Коул. С. 25–26. ISBN 9780534359454.
  8. ^ ab "Причинное рассуждение". www.istarassessment.org . Получено 2 марта 2016 г. .
  9. ^ Ригельман, Р. (1979). «Сопутствующая причина: ненужная и недостаточная». Postgraduate Medicine . 66 (2): 177–179. doi :10.1080/00325481.1979.11715231. PMID  450828.
  10. ^ Катан МБ (март 1986). «Изоформы аполипопротеина E, сывороточный холестерин и рак». Lancet . 1 (8479): 507–8. doi :10.1016/s0140-6736(86)92972-7. PMID  2869248. S2CID  38327985.
  11. ^ Смит, Джордж Дэйви; Эбрахим, Шах (2008). Менделевская рандомизация: генетические варианты как инструменты для усиления причинно-следственных выводов в наблюдательных исследованиях. National Academies Press (США).
  12. ^ Pearl 2009, глава 3-3. Управление искажениями, вызывающими искажения.
  13. ^ Перл, Джудеа; Глимур, Маделин; Джуэлл, Николас П. (7 марта 2016 г.). Причинно-следственные выводы в статистике: Учебник . John Wiley & Sons. ISBN 978-1-119-18684-7.
  14. Перл 2009, стр. 207.
  15. ^ Хао, Карен (8 мая 2019 г.). «Глубокое обучение может раскрыть, почему мир устроен так, а не иначе». MIT Technology Review . Получено 10 февраля 2020 г.

Источники

Внешние ссылки

  1. ^ Изучение представлений с использованием каузальной инвариантности, ICLR, февраль 2020 г. , получено 10 февраля 2020 г.