stringtranslate.com

Корреляция не подразумевает причинно-следственную связь

Фраза « корреляция не подразумевает причинно-следственную связь » относится к неспособности обоснованно вывести причинно-следственную связь между двумя событиями или переменными исключительно на основе наблюдаемой ассоциации или корреляции между ними. [1] [2] Идея о том, что «корреляция подразумевает причинно-следственную связь», является примером логической ошибки сомнительной причины , в которой два события, происходящие вместе, считаются установившими причинно-следственную связь. Эта ошибка также известна по латинской фразе cum hoc ergo propter hoc («с этим, следовательно, из-за этого»). Это отличается от ошибки, известной как post hoc ergo propter hoc («после этого, следовательно, из-за этого»), в которой событие, следующее за другим, рассматривается как необходимое следствие предыдущего события, и от conflation , ошибочного слияния двух событий, идей, баз данных и т. д. в одно.

Как и в случае с любой логической ошибкой, выявление того, что рассуждения, лежащие в основе аргумента, ошибочны , не обязательно означает , что полученный вывод является ложным. Были предложены статистические методы, которые используют корреляцию в качестве основы для проверки гипотез на причинность, включая тест на причинность Грейнджера и конвергентное перекрестное отображение . Критерии Брэдфорда-Хилла , также известные как критерии Хилла на причинность, представляют собой группу из девяти принципов, которые могут быть полезны при установлении эпидемиологических доказательств причинной связи.

Использование и значение терминов

"Подразумевать"

В повседневном использовании слово «подразумевает» в широком смысле означает предполагает , а не требует . Однако в логике техническое использование слова «подразумевает» означает «является достаточным условием для». [3] Именно это значение подразумевают статистики, когда говорят, что причинно-следственная связь не является определенной. Действительно, p подразумевает q имеет техническое значение материального условного предложения : если p, то q обозначается как p → q . То есть, «если обстоятельство p истинно, то q следует». В этом смысле всегда правильно говорить «Корреляция не подразумевает причинно-следственную связь».

"Причина"

Слово « cause » (или «causation») имеет несколько значений в английском языке. В философской терминологии «cause» может относиться к необходимым, достаточным или способствующим причинам. При изучении корреляции «cause» чаще всего используется в значении «одна способствующая причина» (но не обязательно единственная способствующая причина).

Неграмотность и вымирание динозавров могут быть взаимосвязаны, но это не означает, что между переменными существует причинно-следственная связь.

Причинно-следственный анализ

Причинный анализ — это область экспериментального проектирования и статистики, относящаяся к установлению причины и следствия. [4] Обычно он включает установление четырех элементов: корреляции , последовательности во времени (то есть причины должны возникнуть до их предполагаемого следствия), правдоподобного физического или информационно-теоретического механизма для наблюдаемого следствия из возможной причины и исключения возможности общих и альтернативных («особых») причин . Такой анализ обычно включает один или несколько искусственных или естественных экспериментов. [5]

Примеры нелогичного вывода причинно-следственной связи из корреляции

B вызывает A (обратная причинно-следственная связь)

Обратная причинность или обратная причинность или неправильное направление — это неформальное заблуждение сомнительной причины , где причина и следствие меняются местами. Причина считается следствием и наоборот.

Пример 1
Чем быстрее вращаются ветряные мельницы, тем сильнее наблюдается ветер.
Таким образом, ветер возникает в результате вращения ветряных мельниц. (Или, проще говоря, ветряные мельницы, как следует из их названия, — это машины, используемые для производства ветра.)

В этом примере корреляция (одновременность) между активностью ветряных мельниц и скоростью ветра не означает, что ветер вызван ветряными мельницами. Скорее наоборот, как предполагает тот факт, что ветру не нужны ветряные мельницы для существования, в то время как ветряным мельницам нужен ветер для вращения. Ветер можно наблюдать в местах, где нет ветряных мельниц или есть невращающиеся ветряные мельницы, и есть веские основания полагать, что ветер существовал до изобретения ветряных мельниц.

Пример 2
Низкий уровень холестерина связан с ростом смертности.
Таким образом, низкий уровень холестерина увеличивает риск смертности.

Причинно-следственная связь на самом деле обратная, поскольку некоторые заболевания, такие как рак, вызывают низкий уровень холестерина из-за множества факторов, таких как потеря веса, и они также вызывают увеличение смертности. [6] Это также можно увидеть у алкоголиков. [ требуется цитата ] Когда у алкоголиков диагностируют цирроз печени, многие бросают пить. Однако они также подвергаются повышенному риску смертности. В этих случаях именно заболевания вызывают повышенный риск смертности, но повышенная смертность объясняется полезными эффектами, которые следуют за диагнозом, заставляя здоровые изменения выглядеть нездоровыми.

Пример 3

В других случаях может быть просто неясно, что является причиной, а что следствием. Например:

Дети, которые много смотрят телевизор , самые жестокие. Очевидно, что телевизор делает детей более жестокими .

Все может быть наоборот: дети, склонные к насилию, любят смотреть телевизор больше, чем менее агрессивные.

Пример 4

Корреляция между употреблением наркотиков в рекреационных целях и психическими расстройствами может быть обратной: возможно, наркотики вызывают расстройства, или, возможно, люди используют наркотики для самолечения уже существующих состояний. Теория наркотиков Gateway может утверждать, что употребление марихуаны приводит к употреблению более сильных наркотиков, но употребление тяжелых наркотиков может привести к употреблению марихуаны (см. также путаницу обратного ). Действительно, в социальных науках , где контролируемые эксперименты часто не могут быть использованы для определения направления причинно-следственной связи, это заблуждение может подпитывать давние научные споры. Один из таких примеров можно найти в экономике образования , между моделями скрининга / сигнализации и человеческого капитала : может быть либо то, что наличие врожденных способностей позволяет человеку завершить образование, либо то, что завершение образования развивает его способности.

Пример 5

Историческим примером этого является то, что европейцы в Средние века считали, что вши полезны для здоровья, поскольку на больных людях вши редко появлялись. Обоснование заключалось в том, что люди заболевали, потому что вши уходили. Однако настоящая причина заключается в том, что вши чрезвычайно чувствительны к температуре тела . Небольшое повышение температуры тела, например, при лихорадке , заставляет вшей искать другого хозяина. Медицинский термометр еще не был изобретен, поэтому повышение температуры редко замечалось. Заметные симптомы появлялись позже, что создавало впечатление, что вши ушли до того, как человек заболел. [7]

В других случаях два явления могут быть частичной причиной друг друга; рассмотрим бедность и недостаток образования или прокрастинацию и низкую самооценку. Тот, кто выдвигает аргумент, основанный на этих двух явлениях, должен, однако, быть осторожен, чтобы избежать ошибки круговой причины и следствия . Бедность является причиной недостатка образования, но она не является единственной причиной, и наоборот.

Третий фактор C (общая причинно-следственная переменная) вызывает как A, так и B

Ошибка третьей причины (также известная как игнорирование общей причины [8] или сомнительной причины [8] ) — это логическая ошибка , в которой ложная связь путается с причинно-следственной связью . Она утверждает, что X вызывает Y, когда на самом деле и X, и Y вызваны Z. Это разновидность ошибки post hoc ergo propter hoc и член группы ошибок сомнительной причины .

Все эти примеры имеют дело со скрытой переменной , которая является просто скрытой третьей переменной, которая влияет на обе переменные, наблюдаемые как коррелированные. Эта третья переменная также известна как смешивающая переменная, с небольшим отличием, что смешивающие переменные не должны быть скрыты и, таким образом, могут быть скорректированы в анализе. Обратите внимание, что ссылка Википедии на скрытую переменную перенаправляет на смешивающую. Трудность часто возникает также, когда третий фактор, хотя и принципиально отличается от A и B, настолько тесно связан с A и/или B, что его можно спутать с ними или очень трудно научно отделить от них (см. Пример 4).

Пример 1
Сон в обуви тесно связан с пробуждением с головной болью.
Поэтому сон в обуви вызывает головную боль.

Приведенный выше пример допускает ошибку корреляции-подразумевает-причинность, поскольку преждевременно делает вывод, что сон в обуви вызывает головную боль. Более правдоподобное объяснение состоит в том, что оба эти фактора вызваны третьим фактором, в данном случае отходом ко сну пьяным , что, таким образом, приводит к корреляции. Поэтому вывод ложный.

Пример 2
У маленьких детей, которые спят при включенном свете, гораздо выше риск развития близорукости в более позднем возрасте.
Таким образом, сон при включенном свете приводит к близорукости.

Это научный пример, полученный в результате исследования в Медицинском центре Университета Пенсильвании . Опубликованное в выпуске Nature от 13 мая 1999 года [9] , исследование получило широкое освещение в то время в популярной прессе. [10] Однако более позднее исследование в Университете штата Огайо не обнаружило, что сон младенцев при включенном свете вызывает развитие миопии. Оно обнаружило сильную связь между родительской миопией и развитием детской миопии, также отметив, что миопичные родители с большей вероятностью оставляли включенным свет в спальне своих детей. [11] [12] [13] [14] В этом случае причиной обоих состояний является родительская миопия, и вышеуказанный вывод является ложным.

Пример 3
По мере роста продаж мороженого резко увеличивается количество случаев утопления.
Таким образом, употребление мороженого приводит к утоплению.

Этот пример не учитывает важность времени года и температуры для продаж мороженого. Мороженое продается в жаркие летние месяцы гораздо чаще, чем в холодное время, и именно в эти жаркие летние месяцы люди с большей вероятностью занимаются водными видами деятельности, такими как плавание . Рост числа смертей от утопления просто вызван более частыми занятиями в воде, а не мороженым. Заявленный вывод является ложным.

Пример 4
Гипотетическое исследование показывает связь между результатами тестовой тревожности и показателями застенчивости со статистическим значением r (сила корреляции) +.59. [15]
Таким образом, можно сделать простой вывод, что застенчивость в какой-то степени является причиной тревожности во время экзамена.

Однако, как и во многих психологических исследованиях, обнаруживается другая переменная, «оценка самосознания», которая имеет более резкую корреляцию (+.73) с застенчивостью. Это предполагает возможную проблему «третьей переменной», однако, когда обнаруживаются три таких тесно связанных показателя, это дополнительно предполагает, что каждый из них может иметь двунаправленные тенденции (см. «двунаправленная переменная» выше), являясь кластером коррелированных значений, каждое из которых в некоторой степени влияет друг на друга. Поэтому простой вывод выше может быть ложным.

Пример 5
С 1950-х годов резко возросли как уровень CO2 в атмосфере , так и уровень ожирения .
Таким образом, атмосферный CO2 вызывает ожирение.

Более богатое население, как правило, потребляет больше пищи и производит больше CO2 .

Пример 6
Уровень холестерина ЛПВП («хорошего») отрицательно коррелирует с частотой сердечного приступа.
Таким образом, прием лекарств для повышения уровня ЛПВП снижает вероятность сердечного приступа.

Дальнейшие исследования [16] поставили этот вывод под сомнение. Вместо этого, возможно, другие основные факторы, такие как гены, диета и физические упражнения, влияют как на уровень ЛПВП, так и на вероятность сердечного приступа; возможно, что лекарства могут влиять на непосредственно измеряемый фактор, уровень ЛПВП, не влияя на вероятность сердечного приступа.

Двунаправленная причинно-следственная связь: А вызывает Б, а Б вызывает А

Причинно-следственная связь не обязательно односторонняя; [ сомнительнообсудить ] в отношениях хищник-жертва численность хищников влияет на численность жертвы, но численность жертвы, т. е. запасы пищи, также влияют на численность хищников. Другой известный пример – велосипедисты имеют более низкий индекс массы тела, чем люди, которые не ездят на велосипеде. Это часто объясняется предположением, что езда на велосипеде повышает уровень физической активности и, следовательно, снижает ИМТ. Поскольку результаты проспективных исследований людей, которые увеличивают использование велосипеда, показывают меньшее влияние на ИМТ, чем поперечные исследования, может быть и некоторая обратная причинно-следственная связь. Например, люди с более низким ИМТ могут быть более склонны изначально ездить на велосипеде. [17]

Связь между А и В является случайной

Эти две переменные вообще не связаны, но коррелируют случайно. Чем больше вещей исследуется, тем больше вероятность того, что две несвязанные переменные окажутся связанными. Например:

Использование корреляции в качестве научного доказательства

Большая часть научных доказательств основана на корреляции переменных [18] , которые наблюдаются вместе. Ученые тщательно подчеркивают, что корреляция не обязательно означает причинно-следственную связь. Предположение, что A вызывает B просто потому, что A коррелирует с B, не принимается как законная форма аргумента.

Однако иногда люди совершают противоположную ошибку, полностью отвергая корреляцию. Это отвергло бы большую часть важных научных доказательств. [18] Поскольку может быть сложно или этически невозможно проводить контролируемые двойные слепые исследования для решения определенных вопросов, корреляционные доказательства с нескольких разных точек зрения могут быть полезны для прогнозирования, несмотря на отсутствие доказательств причинно-следственной связи . Например, социальные работники могут быть заинтересованы в том, чтобы узнать, как насилие над детьми связано с успеваемостью. Хотя было бы неэтично проводить эксперимент, в котором дети случайным образом распределяются на получение или отсутствие насилия, исследователи могут рассмотреть существующие группы, используя неэкспериментальный корреляционный дизайн. Если на самом деле существует отрицательная корреляция между насилием и успеваемостью, исследователи потенциально могли бы использовать это знание статистической корреляции, чтобы делать прогнозы о детях вне исследования, которые подвергаются насилию, даже если исследование не предоставило причинно-следственных доказательств того, что насилие снижает успеваемость. [19] Сочетание ограниченных доступных методологий с ошибкой отрицания корреляции иногда использовалось для опровержения научного открытия. Например, табачная промышленность исторически опиралась на игнорирование корреляционных доказательств, чтобы отвергнуть связь между табачным дымом и раком легких , [20] как это делал биолог и статистик Рональд Фишер (часто от имени промышленности). [список 1]

Корреляция — это ценный тип научных доказательств в таких областях, как медицина, психология и социология. Сначала необходимо подтвердить реальность корреляций, а затем систематически исследовать каждую возможную причинно-следственную связь. В конце концов, корреляция сама по себе не может использоваться в качестве доказательства причинно-следственной связи между лечением и выгодой, фактором риска и заболеванием или социальным или экономическим фактором и различными результатами. Это один из наиболее часто используемых типов доказательств, поскольку легко и даже заманчиво прийти к преждевременным выводам, основанным на предварительном проявлении корреляции. [20]

Смотрите также

Ссылки

  1. ^ Тафте 2006, стр. 5
  2. ^ Олдрич, Джон (1995). «Истинные и ложные корреляции у Пирсона и Юла» (PDF) . Статистическая наука . 10 (4): 364–376. doi : 10.1214/ss/1177009870 . JSTOR  2246135.
  3. ^ "Достаточно". Wolfram . 2019-12-02 . Получено 2019-12-03 .
  4. ^ Ролфинг, Инго; Шнайдер, Карстен К. (2018). «Унифицированная структура для каузального анализа в теоретико-множественном многометодном исследовании» (PDF) . Социологические методы и исследования . 47 (1): 37–63. doi :10.1177/0049124115626170. S2CID  124804330 . Получено 29 февраля 2020 г. .
  5. ^ Брэди, Генри Э. (7 июля 2011 г.). «Причинность и объяснение в социальных науках». Оксфордский справочник по политическим наукам . doi :10.1093/oxfordhb/9780199604456.013.0049 . Получено 29 февраля 2020 г. .
  6. ^ Навид Саттар; Дэвид Прейсс (13 июня 2017 г.). «Обратная причинность в сердечно-сосудистых эпидемиологических исследованиях». Циркуляция . 135 (24): 2369–2372. doi : 10.1161/CIRCULATIONAHA.117.028307 . PMID  28606949.
  7. ^ Уиллингем, Эмили. «О вшах и людях: зудящая история». Scientific American Blog Network . Получено 26.02.2019 .
  8. ^ ab Labossiere, MC, Страницы философии доктора ЛаБоссьера, архив 2009-05-22 в Wayback Machine
  9. ^ Куинн, Грэм Э.; Шин, Чай Х.; Магуайр, Морин Г.; Стоун, Ричард А. (май 1999). «Миопия и окружающее освещение ночью». Nature . 399 (6732): 113–114. Bibcode :1999Natur.399..113Q. doi :10.1038/20094. PMID  10335839. S2CID  4419645.
  10. CNN , 13 мая 1999 г. Ночной свет может привести к близорукости.
  11. ^ Новости исследований Университета штата Огайо , 9 марта 2000 г. Ночное освещение не приводит к близорукости, показывают исследования Архивировано 01.09.2006 в Wayback Machine
  12. ^ Задник, Карла; Джонс, Лиза А.; Ирвин, Бретт К.; Кляйнштейн, Роберт Н.; Мэнни, Рут Э.; Шин, Джули А.; Мутти, Дональд О. (2000). «Зрение: миопия и окружающее ночное освещение». Nature . 404 (6774): 143–144. Bibcode :2000Natur.404..143Z. doi :10.1038/35004661. PMID  10724157. S2CID  4399332.
  13. ^ Gwiazda, J.; Ong, E.; Held, R.; Thorn, F. (2000). "Vision: Myopia and ambient night-time lighting". Nature . 404 (6774): 144. Bibcode :2000Natur.404..144G. doi : 10.1038/35004663 . PMID  10724158.
  14. ^ Стоун, Ричард А.; Магуайр, Морин Г.; Куинн, Грэм Э. (2000). «Зрение: ответ: миопия и окружающее ночное освещение». Nature . 404 (6774): 144. Bibcode :2000Natur.404..144S. doi : 10.1038/35004665 . PMID  10724158.
  15. ^ Кардуччи, Бернардо Дж. (2009). Психология личности: точки зрения, исследования и приложения (2-е изд.). John Wiley & Sons. ISBN 978-1-4051-3635-8.
  16. ^ Орниш, Дин. «Холестерин: хорошее, плохое и правда» [1] (получено 3 июня 2011 г.)
  17. ^ Донс, Э. (2018). «Выбор способа передвижения и индекс массы тела: поперечные и продольные данные общеевропейского исследования» (PDF) . Environment International . 119 (119): 109–116. doi :10.1016/j.envint.2018.06.023. hdl : 10044/1/61061 . PMID  29957352. S2CID  49607716.
  18. ^ ab Novella (18 ноября 2009 г.). «Доказательства в медицине: корреляция и причинно-следственная связь». Наука и медицина . Научно-обоснованная медицина.
  19. ^ Нильсен, Майкл (2012-01-23). ​​«Если корреляция не подразумевает причинно-следственную связь, то что же ее подразумевает? | DDI». Michaelnielsen.org . Получено 2017-10-08 .
  20. ^ ab "Доказательства в медицине: корреляция и причинно-следственная связь – научно обоснованная медицина". Sciencebasedmedicine.org. 2009-11-18 . Получено 2017-10-08 .
  21. ^ Сильвер, Нейт (2015), Сигнал и шум: почему так много предсказаний не сбываются, а некоторые нет (2-е изд.), Нью-Йорк : Penguin Books , стр. 254–255
  22. Фишер, Рональд (6 июля 1957 г.), «Опасности курения сигарет», The British Medical Journal , 2 (5035), Лондон : British Medical Association : 43, doi : 10.1136/bmj.2.5035.43, JSTOR  25383068, PMC 1961750 
  23. Фишер, Рональд (3 августа 1957 г.), «Опасности курения сигарет», The British Medical Journal , 2 (5039), Лондон : British Medical Association : 297–298, doi : 10.1136/bmj.2.5039.297-b, JSTOR  25383439, PMC 1961712 
  24. ^ Фишер, Рональд (1958), «Сигареты, рак и статистика» (PDF) , The Centennial Review of Arts & Science , 2 , Ист-Лансинг, Мичиган : Michigan State University Press : 151–166, архивировано (PDF) из оригинала 2022-10-09
  25. ^ Фишер, Рональд (1958), «Природа вероятности» (PDF) , The Centennial Review of Arts & Science , 2 , Ист-Лансинг, Мичиган : Michigan State University Press : 261–274, архивировано (PDF) из оригинала 2022-10-09
  26. ^ Фишер, Рональд (12 июля 1958 г.), «Рак легких и сигареты» (PDF) , Nature , 182 (4628), Лондон : Nature Publishing Group : 108, Bibcode : 1958Natur.182..108F, doi : 10.1038/182108a0 , PMID  13566198, архивировано (PDF) из оригинала 2022-10-09
  27. ^ Фишер, Рональд (30 августа 1958 г.), «Рак и курение» (PDF) , Nature , 182 (4635), Лондон : Nature Publishing Group : 596, Bibcode : 1958Natur.182..596F, doi : 10.1038/182596a0 , PMID  13577916, архивировано (PDF) из оригинала 2022-10-09
Связанные ссылки
  1. ^ [21] [22] [23] [24] [25] [26] [27]

Библиография