Причинно-следственный вывод

Причинный вывод — это процесс определения независимого фактического эффекта конкретного явления, которое является компонентом более крупной системы. Основное различие между причинным выводом и выводом ассоциации заключается в том, что причинный вывод анализирует реакцию переменной эффекта при изменении причины переменной эффекта. ^[1]^[2] Изучение того, почему что-то происходит, называется этиологией и может быть описано с использованием языка научных причинных обозначений . Говорят, что причинный вывод предоставляет доказательства причинности, теоретически обоснованной причинным рассуждением .

Причинно-следственный вывод широко изучается во всех науках. В последние десятилетия получили распространение несколько инноваций в разработке и внедрении методологии, предназначенной для определения причинно-следственной связи. Причинно-следственные выводы остаются особенно трудными там, где экспериментирование затруднено или невозможно, что характерно для большинства наук.

Подходы к причинному выводу широко применимы во всех типах научных дисциплин, и многие методы причинного вывода, разработанные для одних дисциплин, нашли применение в других дисциплинах. В этой статье описывается основной процесс причинного вывода и подробно описываются некоторые из наиболее традиционных тестов, используемых в различных дисциплинах; однако это не следует ошибочно воспринимать как предположение, что эти методы применимы только к этим дисциплинам, а просто что они наиболее часто используются в этой дисциплине.

Причинно-следственный вывод трудно выполнить, и среди ученых ведутся серьезные споры о том, как правильно определить причинно-следственную связь. Несмотря на другие нововведения, сохраняются опасения по поводу неправильного приписывания учеными корреляционных результатов как причинно-следственных связей, использования учеными неверных методологий и преднамеренного манипулирования учеными аналитическими результатами с целью получения статистически значимых оценок. Особую озабоченность вызывает использование регрессионных моделей, особенно моделей линейной регрессии.

Определение

Выявление причины чего-либо описывается как:

«...приведение к выводу, что что-то является или может быть причиной чего-то другого». ^[3]
«Идентификация причины или причин явления путем установления ковариации причины и следствия, временных отношений с причиной, предшествующей следствию, и устранения вероятных альтернативных причин». ^[4]

Методология

Общий

Причинно-следственный вывод проводится посредством изучения систем, в которых предполагается, что мера одной переменной влияет на меру другой. Причинно-следственный вывод проводится с учетом научного метода . Первым шагом причинно-следственного вывода является формулирование фальсифицируемой нулевой гипотезы , которая впоследствии проверяется статистическими методами . Статистический вывод по частоте — это использование статистических методов для определения вероятности того, что данные случайно возникают при нулевой гипотезе; Байесовский вывод используется для определения влияния независимой переменной. ^[5] Статистический вывод обычно используется для определения разницы между вариациями исходных данных, которые являются случайными вариациями или эффектом четко определенного причинного механизма. Примечательно, что корреляция не подразумевает причинно-следственную связь , поэтому изучение причинно-следственной связи связано как с изучением потенциальных причинных механизмов, так и с вариациями между данными. ^{[ нужна цитата ]} Часто востребованным стандартом причинно-следственной связи является эксперимент, в котором лечение назначается случайным образом, но все другие мешающие факторы остаются постоянными. Большинство усилий в области причинно-следственных выводов направлено на воспроизведение экспериментальных условий.

В эпидемиологических исследованиях используются разные эпидемиологические методы сбора и измерения данных о факторах риска и их эффекте, а также разные способы измерения связи между ними. Результаты обзора методов причинно-следственного вывода, проведенного в 2020 году, показали, что использование существующей литературы для программ клинической подготовки может быть затруднительным. Это связано с тем, что публикуемые статьи часто предполагают продвинутую техническую подготовку, они могут быть написаны с различных статистических, эпидемиологических, компьютерных или философских точек зрения, методологические подходы продолжают быстро расширяться, а многие аспекты причинно-следственных выводов получают ограниченное освещение. ^[6]

Общие рамки для причинного вывода включают модель причинного пирога (компонент-причина), структурную причинную модель Перла ( причинная диаграмма + до-исчисление ), моделирование структурными уравнениями и причинную модель Рубина (потенциальный результат), которые часто используются в таких областях, как как социальные науки и эпидемиология. ^[7]

Экспериментальный

Экспериментальная проверка причинных механизмов возможна с использованием экспериментальных методов. Основная мотивация эксперимента — поддерживать постоянными другие экспериментальные переменные, одновременно целенаправленно манипулируя интересующей переменной. Если эксперимент дает статистически значимые эффекты в результате манипулирования только переменной лечения, есть основания полагать, что причинный эффект может быть приписан переменной лечения, предполагая, что были соблюдены другие стандарты планирования эксперимента.

Квазиэкспериментальный

Квазиэкспериментальная проверка причинных механизмов проводится в тех случаях, когда традиционные экспериментальные методы недоступны. Это может быть результатом непомерно высоких затрат на проведение эксперимента или изначальной невозможности проведения эксперимента, особенно экспериментов, которые касаются крупных систем, таких как экономика избирательных систем, или методов лечения, которые, как считается, представляют опасность для здоровья человека. -быть испытуемыми. Квазиэксперименты также могут проводиться в тех случаях, когда информация скрывается по юридическим причинам.

Подходы в эпидемиологии

Эпидемиология изучает закономерности здоровья и болезней в определенных популяциях живых существ , чтобы сделать выводы о причинах и следствиях. Связь между воздействием предполагаемого фактора риска и заболеванием может наводить на размышления, но не эквивалентна причинно-следственной связи, поскольку корреляция не подразумевает причинно-следственную связь . Исторически постулаты Коха использовались с XIX века для определения того, является ли микроорганизм причиной заболевания. В 20 веке критерии Брэдфорда Хилла , описанные в 1965 году ^[8], использовались для оценки причинности переменных вне микробиологии, хотя даже эти критерии не являются исключительными способами определения причинности.

В молекулярной эпидемиологии изучаемые явления находятся на уровне молекулярной биологии , включая генетику, где биомаркеры являются свидетельством причины или следствия.

Недавняя тенденция ^{[ когда? Целью исследования} является выявление доказательств влияния воздействия на молекулярную патологию в пораженных тканях или клетках в развивающейся междисциплинарной области молекулярной патологической эпидемиологии (МПЭ). ^{[ необходим сторонний источник ]} Связь воздействия с молекулярными патологическими признаками заболевания может помочь оценить причинно-следственную связь. ^{[ необходим сторонний источник ]} Учитывая присущую природе гетерогенность данного заболевания, принцип уникальности заболевания, фенотипирование и подтипирование заболеваний являются тенденциями в биомедицинских науках и науках общественного здравоохранения , примером которых являются персонализированная медицина и точная медицина . ^{[ нужен сторонний источник ]}

Причинно-следственный вывод также использовался для оценки эффекта лечения. Предполагая, что набор наблюдаемых симптомов пациента ( X ) вызван набором скрытых причин ( Z ), мы можем решить, давать или не давать лечение t . Результатом проведения или невыполнения лечения является оценка эффекта y . Если нет гарантии, что лечение даст положительный эффект, то решение о том, следует ли применять лечение, зависит, в первую очередь, от экспертных знаний, охватывающих причинно-следственные связи. В случае новых заболеваний эти экспертные знания могут быть недоступны. В результате при принятии решений мы полагаемся исключительно на результаты прошлого лечения. Модифицированный вариационный автоэнкодер можно использовать для моделирования причинного графа, описанного выше. ^[9] Хотя описанный выше сценарий можно смоделировать без использования скрытого фактора, искажающего фактора (Z), мы утратим понимание того, что симптомы у пациента вместе с другими факторами влияют как на назначение лечения, так и на результат.

Подходы в информатике

Причинный вывод — важная концепция в области причинного искусственного интеллекта . Определение причины и следствия на основе совместных данных наблюдений для двух независимых от времени переменных, скажем, X и Y, решается с использованием асимметрии между данными для некоторой модели в направлениях X → Y и Y → X. Основные подходы основаны на алгоритмическом подходе. модели теории информации и модели шума. ^{[ нужна цитата ]}

Шумовые модели

Включите в модель независимый шумовой член, чтобы сравнить доказательства двух направлений.

Вот некоторые модели шума для гипотезы Y → X с шумом E:

Аддитивный шум: ^[10] $Y=F(X)+E$
Линейный шум: ^[11] $Y=pX+qE$
Пост-нелинейный: ^[12] $Y=G(F(X)+E)$
Гетероскедастический шум: $Y=F(X)+EG(X)$
Функциональный шум: ^[13] $Y=F(X,E)$

Общими предположениями в этих моделях являются:

Других причин Y нет.
X и E не имеют общих причин.
Распространение причины не зависит от причинных механизмов.

На интуитивном уровне идея состоит в том, что факторизация совместного распределения P(Причина, Следствие) в P(Причина)*P(Следствие | Причина) обычно дает модели меньшей общей сложности, чем факторизация в P(Следствие)*P. (Причина | Следствие). Хотя понятие «сложность» интуитивно привлекательно, неясно, как его следует точно определить. ^[13] Другое семейство методов пытается обнаружить причинно-следственные связи на основе больших объемов размеченных данных и позволяет прогнозировать более гибкие причинно-следственные связи. ^[14]

Подходы в социальных науках

Социальная наука

Социальные науки в целом все больше движутся к включению количественных рамок для оценки причинности. Во многом это было описано как средство придания большей строгости методологии социальных наук. На политологию значительное влияние оказала публикация Гэри Кинга, Роберта Кеохейна и Сидни Вербы в 1994 году «Проектирование социального исследования» . Кинг, Кеохейн и Верба рекомендуют исследователям применять как количественные, так и качественные методы и использовать язык статистических выводов для быть более четкими в отношении интересующих их предметов и единиц анализа. ^[15]^[16] Сторонники количественных методов также все чаще принимают структуру потенциальных результатов , разработанную Дональдом Рубином , в качестве стандарта для вывода причинно-следственной связи. ^{[ нужна цитата ]}

Хотя большая часть внимания по-прежнему остается на статистических выводах в структуре потенциальных результатов, методологи социальных наук разработали новые инструменты для проведения причинных выводов с использованием как качественных, так и количественных методов, иногда называемых подходом «смешанных методов». ^[17]^[18] Сторонники различных методологических подходов утверждают, что разные методологии лучше подходят для разных предметов исследования. Социолог Герберт Смит и политологи Джеймс Махони и Гэри Герц процитировали наблюдение Пола Холланда, статистика и автора статьи 1986 года «Статистика и причинный вывод», что статистический вывод наиболее подходит для оценки «следствий причин», а не для оценки «следствий причин». «причины следствий». ^[19]^[20] Качественные методологи утверждают, что формализованные модели причинно-следственной связи, включая отслеживание процессов и теорию нечетких множеств , предоставляют возможности сделать вывод о причинно-следственной связи посредством выявления критических факторов в рамках тематических исследований или посредством процесса сравнения нескольких тематических исследований. ^[16] Эти методологии также ценны для субъектов, в которых ограниченное количество потенциальных наблюдений или наличие мешающих переменных ограничивают применимость статистических выводов. ^{[ нужна цитата ]}

В более длительных временных масштабах исследования устойчивости используют причинно-следственные выводы, чтобы связать исторические события с более поздними политическими, экономическими и социальными результатами. ^[21]

Экономика и политология

В экономических и политических науках причинно-следственные выводы часто затруднены из-за реальной сложности экономических и политических реалий и неспособности воссоздать многие крупномасштабные явления в рамках контролируемых экспериментов. Причинный вывод в экономических и политических науках продолжает улучшаться в методологии и строгости благодаря повышению уровня технологий, доступных социологам, увеличению числа социологов и исследований, а также усовершенствованию методологий причинного вывода во всех социальных науках. ^[22]

Несмотря на трудности, присущие определению причинно-следственной связи в экономических системах, в этих областях существует несколько широко используемых методов.

Теоретические методы

Экономисты и политологи могут использовать теорию (часто изучаемую в рамках эконометрики, основанной на теории) для оценки величины предположительно причинно-следственных связей в тех случаях, когда они верят, что причинно-следственная связь существует. ^[23] Теоретики могут предположить механизм, который считается причинно-следственным, и описать последствия, используя анализ данных, чтобы обосновать предложенную ими теорию. Например, теоретики могут использовать логику для построения модели, например, предполагая, что дождь вызывает колебания экономической производительности, но обратное неверно. ^[24] Однако использование чисто теоретических утверждений, которые не дают каких-либо прогнозирующих идей, было названо «донаучным», поскольку нет возможности предсказать влияние предполагаемых причинных свойств. ^[5] Стоит еще раз подчеркнуть, что регрессионный анализ в социальных науках по своей сути не подразумевает причинно-следственной связи, поскольку многие явления могут коррелировать в краткосрочной перспективе или в определенных наборах данных, но не демонстрируют никакой корреляции в другие периоды времени или другие наборы данных. Таким образом, приписывание причинности коррелятивным свойствам является преждевременным в отсутствие четко определенного и обоснованного причинного механизма.

Инструментальные переменные

Метод инструментальных переменных (IV) — это метод определения причинно-следственной связи, который включает устранение корреляции между одной из объясняющих переменных модели и ошибкой модели. Этот метод предполагает, что если член ошибки модели изменяется аналогично изменению другой переменной, то член ошибки модели, вероятно, является эффектом изменения этой объясняющей переменной. Устранение этой корреляции путем введения новой инструментальной переменной уменьшает ошибку, присутствующую в модели в целом. ^[25]

Спецификация модели

Спецификация модели — это выбор модели, которая будет использоваться в анализе данных. Социологи (и, по сути, все ученые) должны определить правильную модель, которую следует использовать, поскольку разные модели хорошо подходят для оценки разных отношений. ^[26]

Спецификация модели может быть полезна при определении причинно-следственной связи, которая проявляется медленно, когда последствия действия в один период ощущаются только в более поздний период. Стоит помнить, что корреляции измеряют только то, имеют ли две переменные схожую дисперсию, а не влияют ли они друг на друга в определенном направлении; таким образом, нельзя определить направление причинной связи, основываясь только на корреляциях. Поскольку считается, что причинные действия предшествуют причинным следствиям, социологи могут использовать модель, которая специально рассматривает влияние одной переменной на другую в течение определенного периода времени. Это приводит к использованию переменных, представляющих явления, произошедшие ранее, в качестве эффектов лечения, когда эконометрические тесты используются для поиска более поздних изменений в данных, которые объясняются эффектом таких эффектов лечения, где значимая разница в результатах следует за значимой разницей в эффектах лечения. может указывать на причинно-следственную связь между эффектами лечения и измеряемыми эффектами (например, тесты причинно-следственной связи Грейнджера). Подобные исследования являются примерами анализа временных рядов . ^[27]

Анализ чувствительности

Другие переменные или регрессоры в регрессионном анализе либо включаются, либо не включаются в различные реализации одной и той же модели, чтобы гарантировать возможность более отдельного изучения различных источников вариаций друг от друга. Это форма анализа чувствительности: это исследование того, насколько чувствительна реализация модели к добавлению одной или нескольких новых переменных. ^[28]

Главной мотивирующей проблемой при использовании анализа чувствительности является стремление обнаружить мешающие переменные . Смешивающие переменные — это переменные, которые оказывают большое влияние на результаты статистического теста, но не являются той переменной, которую пытается изучить причинно-следственная связь. Смешивающие переменные могут привести к тому, что регрессор окажется значимым в одной реализации, но не в другой.

Мультиколлинеарность

Другой причиной использования анализа чувствительности является обнаружение мультиколлинеарности . Мультиколлинеарность – это явление, при котором корреляция между двумя переменными очень высока. Высокий уровень корреляции между двумя переменными может существенно повлиять на результат статистического анализа, когда небольшие изменения в сильно коррелированных данных могут перевернуть эффект переменной с положительного направления на отрицательное или наоборот. Это неотъемлемое свойство дисперсионного тестирования. Определение мультиколлинеарности полезно при анализе чувствительности, поскольку исключение сильно коррелирующих переменных в различных реализациях модели может предотвратить резкие изменения результатов, возникающие в результате включения таких переменных. ^[29]

Однако возможности анализа чувствительности предотвращать пагубные последствия мультиколлинеарности ограничены, особенно в социальных науках, где системы сложны. Поскольку теоретически невозможно включить или даже измерить все мешающие факторы в достаточно сложной системе, эконометрические модели подвержены ошибке общей причины, когда причинные эффекты ошибочно приписываются не той переменной, поскольку правильная переменная не была учтена в модели. исходные данные. Это пример неспособности учесть скрытую переменную . ^[30]

Эконометрика на основе дизайна

В последнее время усовершенствованная методология эконометрики, основанной на дизайне, популяризировала использование как естественных экспериментов, так и квазиэкспериментальных исследовательских планов для изучения причинных механизмов, которые, как полагают, выявляют такие эксперименты. ^[31]

Ошибка в причинно-следственной связи

Несмотря на достижения в разработке методологий, используемых для определения причинно-следственной связи, остаются значительные недостатки в определении причинно-следственной связи. Эти недостатки можно объяснить как присущими трудностью определения причинно-следственных связей в сложных системах, так и случаями научной халатности.

Помимо трудностей причинно-следственных выводов, среди некоторых крупных групп социологов существует мнение о том, что большое количество ученых, занимающихся общественными науками, используют ненаучную методологию. В этих областях распространена критика в адрес экономистов и социологов, выдающих описательные исследования за причинно-следственные. ^[5]

Научная халатность и ошибочная методология

В науках, особенно в социальных науках, ученые обеспокоены широко распространённой научной халатностью. Поскольку научное исследование является широкой темой, существует теоретически безграничное количество способов подорвать причинно-следственный вывод не по вине исследователя. Тем не менее, среди ученых по-прежнему сохраняется обеспокоенность тем, что большое количество исследователей не выполняют основные обязанности или не применяют достаточно разнообразные методы причинного вывода. ^[32]^[22]^[33]^{[ не удалось проверить ]}^[34]

Одним из ярких примеров распространенной непричинной методологии является ошибочное предположение о корреляционных свойствах как о причинных свойствах. В коррелирующих явлениях нет внутренней причинности. Регрессионные модели предназначены для измерения дисперсии данных относительно теоретической модели: нет ничего, что могло бы указывать на то, что данные, демонстрирующие высокий уровень ковариации, имеют какую-либо значимую взаимосвязь (при отсутствии предполагаемого причинного механизма с прогностическими свойствами или случайного назначения лечения). Утверждается, что использование ошибочной методологии широко распространено, причем частыми примерами такой халатности является чрезмерное использование корреляционных моделей, особенно чрезмерное использование моделей регрессии и особенно моделей линейной регрессии. ^[5] Предположение о том, что два коррелирующих явления по своей сути связаны, является логической ошибкой, известной как ложная корреляция . Некоторые социологи утверждают, что широкое использование методологии, приписывающей ложным корреляциям причинно-следственную связь, наносит ущерб целостности социальных наук, хотя были отмечены улучшения, связанные с более совершенными методологиями. ^[31]

Потенциальным эффектом научных исследований, которые ошибочно смешивают корреляцию с причинно-следственной связью, является увеличение количества научных открытий, результаты которых не могут быть воспроизведены третьими лицами. Такая невоспроизводимость является логическим следствием выводов о том, что корреляция лишь временно обобщается до механизмов, не имеющих внутренней связи, когда новые данные не содержат предыдущих, идиосинкразических корреляций исходных данных. Дебаты о влиянии врачебной ошибки по сравнению с эффектом, присущим трудностям поиска причинно-следственной связи, продолжаются. ^[35] Критики широко практикуемых методологий утверждают, что исследователи прибегают к статистическим манипуляциям для публикации статей, которые якобы демонстрируют доказательства причинной связи, но на самом деле являются примерами ложной корреляции, рекламируемой как доказательство причинной связи: такие попытки можно назвать P-хакингом . ^[36] Чтобы предотвратить это, некоторые выступают за то, чтобы исследователи предварительно регистрировали планы своих исследований до их проведения, чтобы они непреднамеренно не переоценивали невоспроизводимые результаты, которые не были первоначальным предметом исследования, но были признаны статистически значимыми в ходе анализа данных. . ^[37]

Смотрите также

Библиография

Эрнан, Массачусетс ; Робинс, Дж. М. (21 января 2020 г.). Причинно-следственный вывод: что если. Барнсли: Бока-Ратон: Чепмен и Холл/CRC.

Внешние ссылки

Викискладе есть медиафайлы, связанные с причинно-следственными выводами .

Семинар NIPS 2013 по причинно-следственной связи
Причинно-следственный вывод в Институте интеллектуальных систем Макса Планка в Тюбингене