Фраза « корреляция не подразумевает причинно-следственную связь » относится к неспособности законно вывести причинно-следственную связь между двумя событиями или переменными исключительно на основе наблюдаемой связи или корреляции между ними. [1] [2] Идея о том, что «корреляция подразумевает причинно-следственную связь», является примером логической ошибки сомнительной причины , при которой два события, происходящие вместе, считаются установленными причинно-следственной связью. Это заблуждение также известно под латинским выражением cum hoc ergo propter hoc («с этим, следовательно, из-за этого»). Это отличается от заблуждения, известного как post hoc ergo propter hoc («после этого, следовательно, из-за этого»), при котором событие, следующее за другим, рассматривается как необходимое следствие предыдущего события, и от смешения , ошибочного слияния двух событий. события, идеи, базы данных и т. д. в одном.
Как и в случае с любой логической ошибкой, выявление ошибочности рассуждений, лежащих в основе аргумента, не обязательно означает , что полученный в результате вывод ложен. Были предложены статистические методы, которые используют корреляцию в качестве основы для проверки гипотез на причинность, включая тест причинности Грейнджера и конвергентное перекрестное картирование . Критерии Брэдфорда Хилла , также известные как критерии причинно-следственной связи Хилла, представляют собой группу из девяти принципов, которые могут быть полезны при установлении эпидемиологических доказательств причинно-следственной связи.
В повседневном использовании слово «подразумевается» означает скорее « предполагает» , чем «требует» . Однако в логике техническое использование слова «подразумевается» означает «является достаточным условием для». [3] Именно это имеют в виду статистики, когда говорят, что причинно-следственная связь не определена. Действительно, p подразумевает, что q имеет технический смысл материального условного выражения : если p, то q, символизируемое как p → q . То есть «если обстоятельство p истинно, то следует и q ». В этом смысле всегда правильно сказать: «Корреляция не подразумевает причинно-следственную связь».
Слово « причина » (или «причинность») имеет в английском языке несколько значений. В философской терминологии «причина» может относиться к необходимым, достаточным или способствующим причинам. При изучении корреляции «причина» чаще всего используется для обозначения «одной способствующей причины» (но не обязательно единственной способствующей причины).
Если есть причинно-следственная связь, то есть корреляция, но также и временная последовательность от причины к следствию, вероятный механизм, а иногда и общие и промежуточные причины. Корреляция часто используется для вывода о причинно-следственной связи, поскольку она является необходимым условием: то есть, если A вызывает B, то A и B обязательно должны быть коррелированы. Однако это не является достаточным условием.
Обратная причинно-следственная связь или обратная причинно-следственная связь или неправильное направление — это неформальная ошибка сомнительной причины , когда причина и следствие меняются местами. Говорят, что причина является следствием и наоборот.
В этом примере корреляция (одновременность) между работой ветряных мельниц и скоростью ветра не означает, что ветер вызван ветряными мельницами. Скорее наоборот, о чем свидетельствует тот факт, что ветру не нужны ветряные мельницы, чтобы существовать, в то время как ветряным мельницам нужен ветер, чтобы вращаться. Ветер можно наблюдать там, где нет ветряных мельниц или невращающихся ветряных мельниц, и есть веские основания полагать, что ветер существовал до изобретения ветряных мельниц.
Все наоборот, поскольку такие заболевания, как рак, вызывают низкий уровень холестерина из-за множества факторов, таких как потеря веса и увеличение смертности. [6] То же самое наблюдается и у бывших курильщиков. Бывшие курильщики чаще умирают от рака легких, чем нынешние курильщики. [7] Когда курильщикам на протяжении всей жизни сообщают, что у них рак легких, многие бросают курить. Из-за этого изменения может сложиться впечатление, будто бывшие курильщики чаще умирают от рака легких, чем нынешние курильщики. Это также можно наблюдать у алкоголиков. Когда у алкоголиков диагностируют цирроз печени, многие бросают пить. Однако они также испытывают повышенный риск смертности. В этих случаях именно болезни вызывают повышенный риск смертности, но повышенная смертность объясняется положительными эффектами, которые следуют за диагнозом, в результате чего здоровые изменения выглядят нездоровыми.
Пример 3
В других случаях может быть просто неясно, что является причиной, а что следствием. Например:
Это легко могло быть наоборот; то есть жестокие дети любят смотреть больше телевизора, чем менее жестокие.
Пример 4
Корреляция между употреблением рекреационных наркотиков и психическими расстройствами может быть любой: возможно, наркотики вызывают расстройства, или, возможно, люди используют наркотики для самолечения уже существующих состояний. Теория «воротных наркотиков» может утверждать, что употребление марихуаны приводит к употреблению более сильных наркотиков, но употребление тяжелых наркотиков может привести к употреблению марихуаны (см. Также путаницу в обратном порядке ). Действительно, в социальных науках , где контролируемые эксперименты часто не могут быть использованы для выявления направления причинно-следственной связи, это заблуждение может подпитывать давние научные аргументы. Один из таких примеров можно найти в экономике образования , между моделями скрининга / сигнализации и человеческим капиталом : это может быть либо то, что наличие врожденных способностей позволяет человеку завершить образование, либо что завершение образования укрепляет его способности.
Пример 5
Историческим примером этого является то, что европейцы в средние века верили, что вши полезны для здоровья, поскольку у больных людей вши редко встречаются. Аргументация заключалась в том, что люди заболели, потому что вши ушли. Однако настоящая причина в том, что вши чрезвычайно чувствительны к температуре тела . Небольшое повышение температуры тела, например, при лихорадке , заставляет вшей искать другого хозяина. Медицинский термометр еще не был изобретен, поэтому повышение температуры наблюдалось редко. Заметные симптомы появились позже, что создавало впечатление, что вши ушли до того, как человек заболел. [8]
В других случаях каждое из двух явлений может быть частичной причиной другого; рассмотрите бедность и отсутствие образования или прокрастинацию и низкую самооценку. Однако тот, кто выдвигает аргумент, основанный на этих двух явлениях, должен быть осторожен, чтобы избежать ошибки круговой причины и следствия . Бедность является причиной отсутствия образования, но не единственной причиной , и наоборот.
Заблуждение третьей причины (также известное как игнорирование общей причины [9] или сомнительной причины [9] ) — это логическая ошибка, при которой ложную связь путают с причинно-следственной связью . Он утверждает, что X вызывает Y, тогда как на самом деле и X, и Y вызваны Z. Это разновидность ошибки post hoc ergo propter hoc и член группы заблуждений сомнительных причин .
Во всех этих примерах речь идет о скрытой переменной , которая представляет собой просто скрытую третью переменную, влияющую на обе причины корреляции. Трудность часто возникает и тогда, когда третий фактор, хотя и принципиально отличается от А и В, настолько тесно связан с А и/или В, что его можно спутать с ними или очень трудно отделить от них с научной точки зрения (см. пример 4).
Приведенный выше пример допускает ошибку «корреляция подразумевает причинно-следственную связь», поскольку из него преждевременно делается вывод о том, что сон в обуви вызывает головную боль. Более правдоподобное объяснение состоит в том, что оба они вызваны третьим фактором, в данном случае ложением спать пьяным , что, таким образом, приводит к корреляции. Так что вывод неверный.
Это научный пример, который стал результатом исследования в Медицинском центре Пенсильванского университета . Опубликованное в журнале Nature от 13 мая 1999 года [10] исследование получило в то время широкое освещение в популярной прессе . [11] Однако более позднее исследование, проведенное в Университете штата Огайо, не выявило, что младенцы , спящие при включенном свете, вызывают развитие близорукости. Они обнаружили сильную связь между близорукостью родителей и развитием близорукости у детей, а также отметили, что родители с близорукостью чаще оставляли свет включенным в спальне своих детей. [12] [13] [14] [15] В данном случае причиной обоих состояний является близорукость родителей, и приведенный выше вывод является ложным.
В этом примере не учитывается важность времени года и температуры для продаж мороженого. Мороженое продается в жаркие летние месяцы гораздо чаще, чем в холодное время, и именно в эти жаркие летние месяцы люди с большей вероятностью будут заниматься деятельностью, связанной с водой, например плаванием . Рост смертности от утопления вызван просто тем, что люди чаще занимаются водными видами спорта, а не мороженым. Изложенное заключение является ложным.
Однако, как было обнаружено во многих психологических исследованиях, была обнаружена еще одна переменная, «показатель застенчивости», которая имеет более резкую корреляцию (+,73) с застенчивостью. Это предполагает возможную проблему «третьей переменной», однако, когда обнаруживаются три таких тесно связанных показателя, это также предполагает, что каждый из них может иметь двунаправленные тенденции (см. «Двунаправленная переменная» выше), представляя собой кластер коррелирующих значений, каждое из которых влияет друг на друга. в некоторой степени. Следовательно, простой вывод, приведенный выше, может быть ошибочным.
Более богатые слои населения, как правило, едят больше еды и производят больше CO 2 .
Дальнейшие исследования [17] поставили этот вывод под сомнение. Вместо этого возможно, что другие основные факторы, такие как гены, диета и физические упражнения, влияют как на уровень ЛПВП, так и на вероятность сердечного приступа; вполне возможно, что лекарства могут влиять на непосредственно измеримый фактор — уровень ЛПВП, не влияя при этом на вероятность сердечного приступа.
Причинность не обязательно односторонняя; [ сомнительно ] в отношениях хищник-жертва численность хищников влияет на численность жертв, но численность жертв, то есть запасы пищи, также влияет на численность хищников. Другой хорошо известный пример: индекс массы тела у велосипедистов ниже , чем у людей, которые не ездят на велосипеде. Это часто объясняют предположением, что езда на велосипеде повышает уровень физической активности и, следовательно, снижает ИМТ. Поскольку результаты проспективных исследований с участием людей, которые чаще используют велосипеды, показывают меньшее влияние на ИМТ, чем перекрестные исследования, может существовать и некоторая обратная причинно-следственная связь. Например, люди с более низким ИМТ могут в первую очередь с большей вероятностью захотеть ездить на велосипеде. [18]
Эти две переменные вообще не связаны между собой, а коррелируют случайно. Чем больше вещей исследуется, тем больше вероятность того, что две несвязанные переменные окажутся связанными. Например:
Большая часть научных данных основана на корреляции переменных [19] , которые наблюдаются вместе. Ученые осторожно отмечают, что корреляция не обязательно означает причинно-следственную связь. Предположение о том, что А вызывает Б просто потому, что А коррелирует с Б, часто не принимается в качестве законной формы аргументации.
Однако иногда люди совершают противоположную ошибку, полностью игнорируя корреляцию. Это приведет к игнорированию большого количества важных научных данных. [19] Поскольку проведение контролируемых двойных слепых исследований может быть трудным или этически невозможным, корреляционные данные с нескольких разных точек зрения могут быть полезны для прогнозирования , несмотря на отсутствие доказательств причинно- следственной связи . Например, социальные работники могут быть заинтересованы в том, чтобы узнать, как жестокое обращение с детьми связано с успеваемостью. Хотя было бы неэтично проводить эксперимент, в котором детей случайным образом распределяли на тех, кто подвергался или не подвергался жестокому обращению, исследователи могут изучить существующие группы, используя неэкспериментальный корреляционный план. Если на самом деле существует отрицательная корреляция между жестоким обращением и успеваемостью, исследователи потенциально могли бы использовать эти знания о статистической корреляции, чтобы делать прогнозы о детях, не участвовавших в исследовании, которые подвергаются жестокому обращению, даже несмотря на то, что исследование не смогло предоставить причинно-следственных доказательств того, что жестокое обращение снижает успеваемость. [20] Сочетание ограниченных доступных методологий с ошибкой игнорирования корреляции иногда использовалось для противодействия научным открытиям. Например, табачная промышленность исторически полагалась на отрицание корреляционных данных, чтобы отвергнуть связь между табачным дымом и раком легких [21] , как это делал биолог и статистик Рональд Фишер (часто от имени табачной промышленности). [список 1]
Корреляция — это ценный тип научных данных в таких областях, как медицина, психология и социология. Сначала необходимо подтвердить реальность корреляций, а затем систематически исследовать все возможные причинные связи. В конце концов, корреляция сама по себе не может использоваться в качестве доказательства причинно-следственной связи между лечением и пользой, фактором риска и заболеванием или социальным или экономическим фактором и различными исходами. Это один из видов доказательств, которым чаще всего злоупотребляют, поскольку легко и даже соблазнительно прийти к преждевременным выводам, основанным на предварительном появлении корреляции. [21]