stringtranslate.com

Причинная модель

Сравнение двух конкурирующих причинно-следственных моделей (DCM, GCM), используемых для интерпретации изображений фМРТ [1]

В философии науки причинная модель (или структурно-каузальная модель ) — это концептуальная модель , описывающая причинные механизмы системы . При разработке причинной модели можно использовать несколько типов причинных обозначений . Причинно-следственные модели могут улучшить дизайн исследования, предоставляя четкие правила для принятия решения о том, какие независимые переменные необходимо включать/контролировать.

Они могут позволить ответить на некоторые вопросы на основе существующих данных наблюдений без необходимости проведения интервенционного исследования, такого как рандомизированное контролируемое исследование . Некоторые интервенционные исследования неприемлемы по этическим или практическим причинам, а это означает, что без причинно-следственной модели некоторые гипотезы невозможно проверить.

Причинно-следственные модели могут помочь в вопросе внешней достоверности (применимы ли результаты одного исследования к неизученным группам населения). Причинно-следственные модели могут позволить объединить данные нескольких исследований (при определенных обстоятельствах) для ответа на вопросы, на которые не может ответить ни один отдельный набор данных.

Причинно-следственные модели нашли применение в обработке сигналов , эпидемиологии и машинном обучении . [2]

Определение

Причинные модели — это математические модели, представляющие причинно-следственные связи внутри отдельной системы или популяции. Они облегчают выводы о причинно-следственных связях на основе статистических данных. Они могут многому нас научить в области эпистемологии причинности и взаимосвязи между причинностью и вероятностью. Они также применялись к темам, интересующим философов, таким как логика контрфактов, теория принятия решений и анализ фактической причинно-следственной связи. [3]

-  Стэнфордская энциклопедия философии

Джудея Перл определяет причинную модель как упорядоченную тройку , где U — набор экзогенных переменных , значения которых определяются факторами вне модели; V — набор эндогенных переменных, значения которых определяются факторами модели; и E представляет собой набор структурных уравнений , которые выражают значение каждой эндогенной переменной как функцию значений других переменных в U и V. [2]

История

Аристотель определил таксономию причинности, включая материальные, формальные, действенные и конечные причины. Юм отверг таксономию Аристотеля в пользу контрфактов . В какой-то момент он отрицал, что объекты обладают «силами», которые делают один причиной, а другой — следствием. Позже он принял «если бы первого объекта не было, то и второго никогда не существовало» («причинность « но-для »). [4]

В конце 19 века начала формироваться статистика. После многолетних усилий по выявлению причинных правил для таких областей, как биологическая наследственность, Гальтон представил концепцию регрессии средних (воплощенную в спаде второкурсников в спорте), которая позже привела его к непричинной концепции корреляции . [4]

Будучи позитивистом , Пирсон исключил из большей части науки понятие причинности как недоказуемого частного случая ассоциации и ввел коэффициент корреляции в качестве показателя ассоциации. Он писал: «Сила как причина движения — это то же самое, что древесный бог как причина роста», и эта причинность была всего лишь «фетишем среди непостижимых тайн современной науки». Пирсон основал «Биометрику» и лабораторию биометрии в Университетском колледже Лондона , которые стали мировым лидером в области статистики. [4]

В 1908 году Харди и Вайнберг решили проблему стабильности признаков , которая заставила Гальтона отказаться от причинно-следственной связи, возродив менделевское наследование . [4]

В 1921 году анализ путей Райта стал теоретическим предшественником причинного моделирования и причинных графов . [5] Он разработал этот подход, пытаясь разобраться в относительном влиянии наследственности , развития и окружающей среды на рисунок шерсти морских свинок . Он подкрепил свои тогдашние еретические утверждения, показав, как такие анализы могут объяснить взаимосвязь между массой морских свинок при рождении, внутриутробным периодом и размером помета. Противодействие этим идеям со стороны видных статистиков привело к тому, что их игнорировали в течение следующих 40 лет (за исключением животноводов). Вместо этого ученые полагались на корреляции, отчасти по указанию критика Райта (и ведущего статистика) Фишера . [4] Единственным исключением был Беркс , студент, который в 1926 году первым применил диаграммы путей для представления посреднического влияния ( посредника ) и утверждал, что сохранение константы посредника приводит к ошибкам. Возможно, она самостоятельно изобрела диаграммы путей. [4] : 304 

В 1923 году Нейман представил концепцию потенциального результата, но его статья не переводилась с польского на английский до 1990 года. [4] : 271 

В 1958 году Кокс предупредил, что контроль над переменной Z действителен только в том случае, если на нее маловероятно влияние независимых переменных. [4] : 154 

В 1960-х годах Дункан , Блэлок , Голдбергер и другие заново открыли анализ путей. Читая работу Блэлока о диаграммах путей, Дункан вспомнил лекцию Огберна двадцатью годами ранее, в которой упоминалась статья Райта, в которой, в свою очередь, упоминался Бёркс. [4] : 308 

Социологи первоначально называли причинные модели моделированием структурных уравнений , но как только этот метод стал механическим, он потерял свою полезность, что заставило некоторых практиков отвергнуть любую связь с причинностью. Экономисты приняли алгебраическую часть путевого анализа, назвав ее моделированием одновременных уравнений. Однако экономисты по-прежнему избегали придавать своим уравнениям причинно-следственный смысл. [4]

Через шестьдесят лет после своей первой статьи Райт опубликовал статью, в которой она резюмировалась, после критики Карлина и др., которые возражали, что она касается только линейных отношений и что надежное, свободное от моделей представление данных более показательно. [4]

В 1973 году Льюис выступал за замену корреляции причинностью без причинности (контрфактическими утверждениями). Он упомянул о способности людей представлять себе альтернативные миры, в которых причина возникает или не возникает и в которых следствие появляется только вслед за своей причиной. [4] : 266  В 1974 году Рубин ввел понятие «потенциальных результатов» как язык для постановки причинно-следственных вопросов. [4] : 269 

В 1983 году Картрайт предложил обуславливать любой фактор, «каузально релевантный» эффекту, выходя за рамки простой вероятности как единственного ориентира. [4] : 48 

В 1986 году Бэрон и Кенни представили принципы обнаружения и оценки посредничества в системе линейных уравнений. По состоянию на 2014 год их статья была 33-й по цитируемости за все время. [4] : 324  В том же году Гренландия и Робинс представили подход «обменимости» к устранению путаницы, рассматривая контрфакты. Они предложили оценить, что случилось бы с группой лечения, если бы они не получили лечение, и сравнить этот результат с результатом контрольной группы. Если они совпадали, считалось, что смешение отсутствует. [4] : 154 

Лестница причинно-следственной связи

Причинная метамодель Перла включает трехуровневую абстракцию, которую он называет лестницей причинности. Самый низкий уровень, Ассоциация (видение/наблюдение), предполагает ощущение закономерностей или закономерностей во входных данных, выраженных в виде корреляций. Средний уровень, Вмешательство (действие), предсказывает последствия преднамеренных действий, выраженные в виде причинно-следственных связей. Самый высокий уровень, Контрфакты (воображение), включает в себя построение теории (части) мира, которая объясняет, почему определенные действия имеют определенные последствия и что происходит в отсутствие таких действий. [4]

Ассоциация

Один объект связан с другим, если наблюдение одного меняет вероятность наблюдения другого. Пример: покупатели, покупающие зубную пасту, с большей вероятностью покупают также зубную нить. Математически:

или вероятность (покупки) зубной нити при (покупке) зубной пасты. Ассоциации также можно измерить, вычислив корреляцию двух событий. Ассоциации не имеют причинно-следственной связи. Одно событие может вызвать другое, может быть наоборот, или оба события могут быть вызваны каким-то третьим событием (несчастный гигиенист стыдит покупателя, заставляя его лучше относиться к своей полости рта). [4]

Вмешательство

Этот уровень утверждает конкретные причинно-следственные связи между событиями. Причинно-следственная связь оценивается путем экспериментального выполнения какого-либо действия, влияющего на одно из событий. Пример: какова будет новая вероятность покупки после удвоения цены на зубную пасту? Причинно-следственную связь невозможно установить путем изучения истории (изменений цен), поскольку изменение цены могло произойти по какой-то другой причине, которая сама по себе могла повлиять на второе событие (тариф, который увеличивает цену обоих товаров). Математически:

где do — оператор, сигнализирующий об экспериментальном вмешательстве (удвоении цены). [4] Оператор указывает на выполнение минимального изменения в мире, необходимого для создания желаемого эффекта, «мини-операции» на модели с как можно меньшими отклонениями от реальности. [6]

Контрфакты

Самый высокий уровень, контрфактический, предполагает рассмотрение альтернативной версии прошлого события или того, что могло бы произойти при других обстоятельствах для одной и той же экспериментальной единицы. Например, какова вероятность того, что, если бы магазин удвоил цену на зубную нить, покупатель зубной пасты все равно купил бы ее?

Контрфакты могут указывать на наличие причинно-следственной связи. Модели, которые могут отвечать на противоречивые факты, позволяют проводить точные вмешательства, последствия которых можно предсказать. В крайнем случае, такие модели принимаются как физические законы (как в законах физики, например, инерции, которая гласит, что если к неподвижному объекту не приложена сила, он не будет двигаться). [4]

Причинность

Причинность против корреляции

Статистика вращается вокруг анализа взаимосвязей между несколькими переменными. Традиционно эти отношения описываются как корреляции , ассоциации без каких-либо подразумеваемых причинно-следственных связей. Причинно-следственные модели пытаются расширить эту структуру, добавляя понятие причинно-следственных связей, в которых изменения одной переменной вызывают изменения других. [2]

Определения причинности двадцатого века основывались исключительно на вероятностях/ассоциациях. Считалось, что одно событие ( ) вызывает другое, если оно увеличивает вероятность другого ( ). Математически это выражается так:

.

Такие определения неадекватны, поскольку другие отношения (например, общая причина для и ) могут удовлетворять условию. Причинность имеет отношение ко второй ступени лестницы. Ассоциации находятся на первом этапе и служат лишь доказательством последнего. [4]

В более позднем определении была предпринята попытка устранить эту двусмысленность, обуславливая фоновые факторы. Математически:

,

где — набор фоновых переменных и представляет значения этих переменных в определенном контексте. Однако требуемый набор фоновых переменных не определен (несколько наборов могут увеличить вероятность), пока вероятность является единственным критерием [ необходимы разъяснения ] . [4]

Другие попытки определить причинность включают причинность Грейнджерастатистическую проверку гипотезы о том, что причинностьэкономике ) можно оценить путем измерения способности предсказывать будущие значения одного временного ряда, используя предыдущие значения другого временного ряда. [4]

Типы

Причина может быть необходимой, достаточной, способствующей или какой-либо их комбинацией. [7]

Необходимый

Чтобы x был необходимой причиной y , наличие y должно подразумевать предшествующее возникновение x . Однако наличие x не означает, что произойдет y . [8] Необходимые причины также известны как причины «если бы не», поскольку y не произошло бы, если бы не появление x . [4] : 261 

Достаточные причины

Чтобы x было достаточной причиной y , наличие x должно подразумевать последующее появление y . Однако другая причина z может независимо вызывать y . Таким образом, наличие y не требует предварительного появления x . [8]

Сопутствующие причины

Чтобы x было причиной, способствующей y , наличие x должно увеличивать вероятность y . Если вероятность равна 100%, то x вместо этого называется достаточным. Также может потребоваться сопутствующая причина. [9]

Модель

Причинно-следственная диаграмма

Причинно-следственная диаграмма — это ориентированный граф , который отображает причинно-следственные связи между переменными в причинно-следственной модели. Причинно-следственная диаграмма включает в себя набор переменных (или узлов ). Каждый узел соединен стрелкой с одним или несколькими другими узлами, на которые он оказывает причинное влияние. Стрелка очерчивает направление причинно-следственной связи, например, стрелка, соединяющая переменные , а стрелка указывает на то, что изменение вызывает изменение (с соответствующей вероятностью). Путь это обход графа между двумя узлами по причинным стрелкам. [4]

Причинные диаграммы включают диаграммы причинных петель , направленные ациклические графы и диаграммы Исикавы . [4]

Причинно-следственные диаграммы не зависят от количественных вероятностей, которые их информируют. Изменения этих вероятностей (например, из-за технологических усовершенствований) не требуют изменений в модели. [4]

Элементы модели

Причинные модели имеют формальную структуру с элементами с определенными свойствами. [4]

Схемы соединений

Три типа соединений трех узлов — это линейные цепи, ветвящиеся вилки и сливающиеся коллайдеры. [4]

Цепь

Цепочки представляют собой прямые линии со стрелками, указывающими от причины к следствию. В этой модели является посредником, поскольку он опосредует изменения, которые в противном случае произошли бы в . [4] : 113 

Вилка

В форках одна причина имеет несколько последствий. Оба эффекта имеют общую причину. Существует (непричинная) ложная корреляция между и , которую можно устранить, установив условие (для конкретного значения ). [4] : 114 

«Условие » означает «заданное » (т. е. заданное значение ).

Разработка вилки является помехой:

В таких моделях частой причиной является и (что также вызывает ), создающее помеху [ необходимы пояснения ] . [4] : 114 

Коллайдер

В коллайдерах несколько причин влияют на один результат. Обуславливание (для конкретного значения ) часто выявляет непричинную отрицательную корреляцию между и . Эта отрицательная корреляция была названа предвзятостью коллайдера и эффектом «объяснения», поскольку он объясняет корреляцию между и . [4] : 115  Корреляция может быть положительной в том случае, когда для воздействия необходимы вклады обоих и . [4] : 197 

Типы узлов

Посредник

Узел-посредник изменяет влияние других причин на результат (в отличие от простого влияния на результат). [4] : 113  Например, в приведенном выше примере цепочки является посредником, поскольку он изменяет влияние (косвенной причины ) на (результат).

сбивающий с толку

Узел-конфаундер влияет на несколько результатов, создавая между ними положительную корреляцию. [4] : 114 

Инструментальная переменная

Инструментальная переменная – это такая, которая: [4] : 246 

Коэффициенты регрессии могут служить оценкой причинного влияния инструментальной переменной на результат, если этот эффект не смешивается. Таким образом, инструментальные переменные позволяют количественно оценить причинные факторы без данных о искажающих факторах. [4] : 249 

Например, учитывая модель:

является инструментальной переменной, поскольку она имеет путь к результату и не смешивается, например, с .

В приведенном выше примере, если и принимают двоичные значения, то допущение, которое не возникает, называется монотонностью [ необходимы пояснения ] . [4] : 253 

Усовершенствования метода [ необходимы пояснения ] включают создание инструмента [ необходимы пояснения ] путем обуславливания другой переменной [ необходимы пояснения ] для блокировки [ необходимы пояснения ] пути [ необходимы пояснения ] между инструментом и искажающим фактором [ необходимы пояснения ] и объединение нескольких переменные для формирования единого инструмента [ необходимы разъяснения ] . [4] : 257 

Менделевская рандомизация

Определение: Менделевская рандомизация использует измеренные вариации генов с известной функцией для изучения причинного влияния модифицируемого воздействия на заболевание в обсервационных исследованиях . [10] [11]

Поскольку гены варьируются случайным образом в разных популяциях, наличие гена обычно квалифицируется как инструментальная переменная, подразумевая, что во многих случаях причинно-следственную связь можно определить количественно с помощью регрессии в наблюдательном исследовании. [4] : 255 

Ассоциации

Условия независимости

Условия независимости — это правила, позволяющие решить, являются ли две переменные независимыми друг от друга. Переменные являются независимыми, если значения одной не влияют напрямую на значения другой. Множественные причинные модели могут иметь общие условия независимости. Например, модели

и

имеют одинаковые условия независимости, поскольку обуславливают листья и независимы. Однако эти две модели не имеют одинакового значения и могут быть фальсифицированы на основе данных (то есть, если данные наблюдений показывают связь между и после обусловливания , то обе модели неверны). И наоборот, данные не могут показать, какая из этих двух моделей верна, поскольку они имеют одинаковые условия независимости.

Обусловливание переменной — это механизм проведения гипотетических экспериментов. Кондиционирование переменной включает в себя анализ значений других переменных для заданного значения условной переменной. В первом примере условие on подразумевает, что наблюдения для данного значения не должны показывать зависимости между и . Если такая зависимость существует, то модель некорректна. Некаузальные модели не могут проводить такие различия, потому что они не делают причинных утверждений. [4] : 129–130 

Искажающий / опровергающий

Важным элементом дизайна корреляционного исследования является выявление потенциально мешающих влияний на изучаемую переменную, например демографию. Эти переменные контролируются для устранения этих влияний. Однако правильный список мешающих переменных не может быть определен априори . Таким образом, возможно, что исследование может контролировать нерелевантные переменные или даже (косвенно) изучаемую переменную. [4] : 139 

Причинно-следственные модели предлагают надежный метод выявления соответствующих мешающих переменных. Формально Z является искажающим фактором, если «Y связан с Z путями, не проходящими через X». Их часто можно определить, используя данные, собранные в ходе других исследований. Математически, если

X и Y смешиваются (из-за некоторой мешающей переменной Z). [4] : 151 

Ранее предположительно неверные определения конфаундера включали: [4] : 152. 

Последнее имеет недостаток в том, что в модели:

Z соответствует определению, но является посредником, а не помехой, и является примером контроля за результатом.

В модели

Традиционно B считался искажающим фактором, поскольку он связан с X и Y, но не находится на причинном пути и не является потомком чего-либо на причинном пути. Контроль за B приводит к тому, что он становится помехой. Это известно как М-смещение. [4] : 161 

Регулировка задней двери

Для анализа причинного влияния X на Y в причинной модели необходимо учитывать все мешающие переменные (деконфаундинг). Чтобы идентифицировать набор мешающих факторов, (1) каждый некаузальный путь между X и Y должен быть заблокирован этим набором; (2) без нарушения каких-либо причинно-следственных связей; и (3) без создания каких-либо ложных путей. [4] : 158 

Определение : черный путь от переменной X к Y — это любой путь от X к Y, который начинается со стрелки, указывающей на X. [4] : ​​158 

Определение : Учитывая упорядоченную пару переменных (X,Y) в модели, набор мешающих переменных Z удовлетворяет критерию бэкдора, если (1) ни одна искажающая переменная Z не является потомком X и (2) все бэкдорные пути между X и Y заблокированы набором искажающих факторов.

Если критерий бэкдора удовлетворен для (X,Y), X и Y устраняются с помощью набора переменных-конфаундеров. Нет необходимости контролировать какие-либо переменные, кроме искажающих факторов. [4] : 158  Критерий бэкдора является достаточным, но не необходимым условием для нахождения набора переменных Z, позволяющего исключить анализ причинного воздействия X на y.

Когда причинно-следственная модель является правдоподобным представлением реальности и бэкдор-критерий удовлетворен, тогда коэффициенты частичной регрессии можно использовать в качестве (причинно-следственных) коэффициентов пути (для линейных отношений). [4] : 223  [12]

[4] : 227 

Регулировка входной двери

Если все элементы блокирующего пути ненаблюдаемы, путь через черный ход не поддается вычислению, но если все прямые пути из имеют элементы , к которым не соединяются открытые пути , то набор всех s может измерить . Фактически, существуют условия, при которых он может выступать в качестве прокси для .

Определение : входной путь — это прямой причинный путь, для которого данные доступны для всех , [4] :226  перехватывает все направленные пути к , нет незаблокированных путей от до , а все бэкдорные пути от до блокируются . [13]

Следующее преобразует выражение do в выражение без выполнения действий путем обусловления переменных на пути к входной двери. [4] : 226 

Предполагая, что данные об этих наблюдаемых вероятностях доступны, окончательную вероятность можно вычислить без эксперимента, независимо от существования других мешающих путей и без скрытых корректировок. [4] : 226 

Вмешательства

Запросы

Запросы — это вопросы, задаваемые на основе конкретной модели. На них обычно отвечают путем проведения экспериментов (вмешательств). Вмешательства принимают форму фиксации значения одной переменной в модели и наблюдения за результатом. Математически такие запросы имеют вид (из примера): [4] : 8 

где оператор do указывает, что эксперимент явно изменил цену зубной пасты. Графически это блокирует любые причинные факторы, которые в противном случае могли бы повлиять на эту переменную. Схематически это стирает все причинные стрелки, указывающие на экспериментальную переменную. [4] : 40 

Возможны более сложные запросы, в которых оператор do применяется (значение фиксировано) к нескольким переменным.

Сделать расчет

Исчисление do — это набор манипуляций, доступных для преобразования одного выражения в другое, с общей целью преобразования выражений, содержащих оператор do, в выражения, которые его не содержат. Выражения, не включающие оператор do, можно оценить только на основе данных наблюдений, без необходимости экспериментального вмешательства, которое может быть дорогостоящим, длительным или даже неэтичным (например, предлагать испытуемым бросить курить). [4] : 231  Набор правил полон (его можно использовать для вывода каждого истинного утверждения в этой системе). [4] : 237  Алгоритм может определить, вычислимо ли для данной модели решение за полиномиальное время . [4] : 238 

Правила

Исчисление включает три правила преобразования выражений условной вероятности с использованием оператора do.

Правило 1

Правило 1 разрешает добавление или удаление наблюдений.: [4] : 235 

в случае, если набор переменных Z блокирует все пути из W в Y и все стрелки, ведущие в X, удалены. [4] : 234 

Правило 2

Правило 2 разрешает замену вмешательства наблюдением или наоборот: [4] : 235 

в случае, когда Z удовлетворяет критерию «черной двери». [4] : 234 

Правило 3

Правило 3 разрешает удаление или добавление вмешательств: [4]

в случае, когда никакие причинные пути не соединяют X и Y. [4] : 234  : 235 

Расширения

Правила не подразумевают, что из любого запроса можно удалить операторы do. В таких случаях можно заменить переменную, которой можно манипулировать (например, диета), на переменную, которая не подвергается манипуляциям (например, уровень холестерина в крови), которую затем можно преобразовать, чтобы удалить эту переменную. Пример:

Контрфакты

Контрфакты рассматривают возможности, которые не обнаруживаются в данных, например, развился ли бы рак у некурящего, если бы он вместо этого был заядлым курильщиком. Это высшая ступень причинно-следственной лестницы Перла.

Потенциальный результат

Определение: Потенциальный результат для переменной Y — это «значение Y, которое Y приняло бы для отдельного [ необходимо уточнение ] u , если бы X было присвоено значение x». Математически: [4] : 270 

или .

Потенциальный результат определяется на уровне индивида u. [4] : 270 

Традиционный подход к потенциальным результатам основан на данных, а не на моделях, что ограничивает его способность распутывать причинно-следственные связи. Он рассматривает причинно-следственные вопросы как проблемы отсутствия данных и дает неправильные ответы даже на стандартные сценарии. [4] : 275 

Причинно-следственный вывод

В контексте причинно-следственных моделей потенциальные результаты интерпретируются причинно, а не статистически.

Первый закон причинного вывода гласит, что потенциальный результат

можно вычислить, изменив причинную модель M (путем удаления стрелок из X) и вычислив результат для некоторого x . Формально: [4] : 280 

Проведение контрфактического

Исследование контрфактического явления с использованием причинно-следственной модели включает в себя три этапа. [14] Подход справедлив независимо от формы модельных связей, линейной или иной. Когда взаимосвязи модели полностью определены, можно вычислить значения точек. В других случаях (например, когда доступны только вероятности) можно вычислить утверждение о вероятностном интервале, например, что некурящий x будет иметь 10-20% вероятность заболевания раком. [4] : 279 

Учитывая модель:

можно применять уравнения для расчета значений A и C, полученные на основе регрессионного анализа или другого метода, заменяя известные значения из наблюдений и фиксируя значения других переменных (противфактические). [4] : 278 

Похитить

Примените абдуктивное рассуждение ( логический вывод , который использует наблюдение для поиска самого простого/наиболее вероятного объяснения), чтобы оценить u , прокси для ненаблюдаемых переменных в конкретном наблюдении, которое подтверждает обратное. [4] : 278  Вычислите вероятность u с учетом пропозициональных доказательств.

Действовать

Для конкретного наблюдения используйте оператор do, чтобы установить обратное (например, m =0), соответствующим образом изменив уравнения. [4] : 278 

Предсказывать

Вычислите значения выхода ( y ) с помощью модифицированных уравнений. [4] : 278 

Посредничество

Различить прямые и косвенные (опосредованные) причины можно только путем проведения контрфактических действий. [4] : 301  Понимание посредничества требует, чтобы посредник оставался постоянным, одновременно вмешиваясь в непосредственную причину. В модели

M опосредует влияние X на Y, в то время как X также оказывает непосредственное влияние на Y. Таким образом, M остается постоянным, а do(X) вычисляется.

Вместо этого ошибка посредничества предполагает обусловленность посредника, если посредник и результат путаются, как это происходит в приведенной выше модели.

Для линейных моделей косвенный эффект можно вычислить, взяв произведение всех коэффициентов пути вдоль опосредованного пути. Общий косвенный эффект рассчитывается как сумма отдельных косвенных эффектов. Для линейных моделей посредничество указывается, когда коэффициенты уравнения, подобранного без включения посредника, значительно отличаются от уравнения, которое его включает. [4] : 324 

Прямой эффект

В экспериментах по такой модели управляемый прямой эффект (CDE) вычисляется путем принудительного установления значения посредника M (do(M = 0)) и случайного назначения некоторым испытуемым каждого из значений X (do(X=0) ), do(X=1), ...) и наблюдая за результирующими значениями Y. [4] : 317 

Каждому значению посредника соответствует соответствующий CDE.

Однако лучший эксперимент — вычислить естественный прямой эффект. (NDE) Это эффект, определяемый тем, что отношения между X и M остаются нетронутыми, при этом вмешиваясь в отношения между X и Y. [4] : 318 

Например, рассмотрим прямой эффект увеличения числа посещений стоматолога-гигиениста (X) каждые два года из года в год, что поощряет использование зубной нити (M). Десны (Y) становятся здоровее либо благодаря гигиенисту (прямо), либо благодаря использованию зубной нити (медиатор/косвенно). Эксперимент состоит в том, чтобы продолжать пользоваться зубной нитью, пропуская визит к гигиенисту.

Косвенный эффект

Косвенное влияние X на Y - это «увеличение, которое мы увидели бы в Y, сохраняя X постоянным и увеличивая M до любого значения, которое M могло бы достичь при увеличении X на единицу». [4] : 328 

Косвенные эффекты нельзя «контролировать», поскольку прямой путь нельзя отключить, удерживая константу другой переменной. Естественный косвенный эффект (NIE) – это влияние на здоровье десен (Y) от использования зубной нити (M). NIE рассчитывается как сумма (в случаях использования зубной нити и отсутствия зубной нити) разницы между вероятностью использования зубной нити с учетом гигиениста и без него, или: [4] : 321 

Приведенный выше расчет NDE включает в себя контрфактические индексы ( ). Для нелинейных моделей кажущаяся очевидная эквивалентность [4] : 322 

не применяется из-за аномалий, таких как пороговые эффекты и двоичные значения. Однако,

работает для всех отношений модели (линейных и нелинейных). Это позволяет затем рассчитывать NDE непосредственно на основе данных наблюдений, без вмешательства или использования контрфактических индексов. [4] : 326 

Транспортабельность

Причинно-следственные модели предоставляют средство интеграции данных из разных наборов данных, известное как транспорт, даже несмотря на то, что причинно-следственные модели (и связанные с ними данные) различаются. Например, данные опроса можно объединить с данными рандомизированных контролируемых исследований. [4] : 352  Транспорт предлагает решение вопроса внешней валидности : можно ли исследование применить в другом контексте.

Если две модели совпадают по всем важным переменным и данные одной модели, как известно, являются несмещенными, данные одной совокупности можно использовать для того, чтобы сделать выводы о другой. В других случаях, когда известно, что данные необъективны, повторное взвешивание может позволить перенести набор данных. В третьем случае выводы можно сделать на основе неполного набора данных. В некоторых случаях данные исследований нескольких популяций можно объединить (посредством транспортировки), чтобы сделать выводы о неизмеренной популяции. В некоторых случаях объединение оценок (например, P(W|X)) из нескольких исследований может повысить точность вывода. [4] : 355 

Do-исчисление обеспечивает общий критерий переноса: целевая переменная может быть преобразована в другое выражение с помощью серии do-операций, которые не включают в себя какие-либо переменные, «производящие различия» (те, которые различают две совокупности). [4] : 355  Аналогичное правило применяется к исследованиям, в которых участвуют существенно разные участники. [4] : 356 

Байесовская сеть

Любая причинно-следственная модель может быть реализована как байесовская сеть. Байесовские сети можно использовать для определения обратной вероятности события (с учетом результата, каковы вероятности конкретной причины). Для этого требуется подготовить таблицу условной вероятности, показывающую все возможные входные данные и результаты с соответствующими вероятностями. [4] : 119 

Например, для модели с двумя переменными «Заболевание» и «Тест» (для заболевания) таблица условной вероятности принимает вид: [4] : 117. 

Согласно этой таблице, при отсутствии у пациента заболевания вероятность положительного результата теста составляет 12%.

Хотя это приемлемо для небольших задач, по мере увеличения количества переменных и связанных с ними состояний таблица вероятностей (и связанное с ней время вычислений) увеличивается экспоненциально. [4] : 121 

Байесовские сети используются в коммерческих целях в таких приложениях, как исправление ошибок беспроводных данных и анализ ДНК. [4] : 122 

Инварианты/контекст

Другая концептуализация причинности включает понятие инвариантных отношений. В случае идентификации рукописных цифр форма цифры контролирует значение, поэтому форма и значение являются инвариантами. Изменение формы меняет смысл. Другие свойства этого не делают (например, цвет). Эта инвариантность должна распространяться на наборы данных, созданные в разных контекстах (неинвариантные свойства формируют контекст). Вместо обучения (оценки причинно-следственной связи) с использованием объединенных наборов данных изучение одного и тестирование другого может помочь отличить варианты от инвариантных свойств. [15]

Смотрите также

Рекомендации

  1. ^ Карл Фристон (февраль 2009 г.). «Причинное моделирование и связь мозга в функциональной магнитно-резонансной томографии». ПЛОС Биология . 7 (2): e1000033. дои : 10.1371/journal.pbio.1000033 . ПМЦ  2642881 . ПМИД  19226186.
  2. ^ abc Перл 2009.
  3. ^ Хичкок, Кристофер (2018), «Причинные модели», в Залте, Эдвард Н. (редактор), Стэнфордская энциклопедия философии (изд. осени 2018 г.), Лаборатория метафизических исследований, Стэнфордский университет , получено 8 сентября 2018 г.
  4. ^ abcdefghijklmnopqrstu vwxyz aa ab ac ad ae af ag ah ai aj ak al am an ao ap aq ar as at au av aw ax ay az ba bb bc bd be bf bg bh bi bj bk bl bm bn bo bp bq br bs bt bu bv bw bx by bz ca cb cc cd ce cf cg ch ci cj ck cl Перл, Иудея ; Маккензи, Дана (15 мая 2018 г.). Книга «Почему: новая наука о причине и следствии». Основные книги. ISBN 9780465097616.
  5. ^ Окаша, Самир (12 января 2012 г.). «Причинность в биологии». В Биби, Хелен; Хичкок, Кристофер; Мензис, Питер (ред.). Оксфордский справочник причинно-следственной связи. Том. 1. ОУП Оксфорд. doi : 10.1093/oxfordhb/9780199279739.001.0001. ISBN 9780191629464.
  6. Перл, Иудея (29 октября 2019 г.). «Причинный и контрфактический вывод» (PDF) . Проверено 14 декабря 2020 г. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  7. ^ Эпп, Сюзанна С. (2004). Дискретная математика с приложениями. Томсон-Брукс/Коул. стр. 25–26. ISBN 9780534359454.
  8. ^ ab «Причинно-следственные рассуждения». www.istarassessment.org . Проверено 2 марта 2016 г.
  9. ^ Ригельман, Р. (1979). «Сопутствующая причина: ненужная и недостаточная». Последипломное образование по медицине . 66 (2): 177–179. дои : 10.1080/00325481.1979.11715231. ПМИД  450828.
  10. ^ Катан М.Б. (март 1986 г.). «Изоформы аполипопротеина Е, сывороточный холестерин и рак». Ланцет . 1 (8479): 507–8. дои : 10.1016/s0140-6736(86)92972-7. PMID  2869248. S2CID  38327985.
  11. ^ Смит, Джордж Дэйви; Ибрагим, Шах (2008). Менделевская рандомизация: генетические варианты как инструменты усиления причинно-следственных выводов в наблюдательных исследованиях. Издательство национальных академий (США).
  12. ^ Перл 2009, глава 3-3 «Контроль искажающей предвзятости».
  13. ^ Перл, Иудея; Глимур, Мэделин; Джуэлл, Николас П. (7 марта 2016 г.). Причинно-следственный вывод в статистике: учебник для начинающих . Джон Уайли и сыновья. ISBN 978-1-119-18684-7.
  14. ^ Перл 2009, с. 207.
  15. Хао, Карен (8 мая 2019 г.). «Глубокое обучение может раскрыть, почему мир устроен именно так». Обзор технологий Массачусетского технологического института . Проверено 10 февраля 2020 г.

Источники

Внешние ссылки

  1. ^ Изучение представлений с использованием причинной инвариантности, ICLR, февраль 2020 г. , получено 10 февраля 2020 г.