stringtranslate.com

Корреляция не подразумевает причинно-следственную связь

Фраза « корреляция не подразумевает причинно-следственную связь » относится к неспособности законно вывести причинно-следственную связь между двумя событиями или переменными исключительно на основе наблюдаемой связи или корреляции между ними. [1] [2] Идея о том, что «корреляция подразумевает причинно-следственную связь», является примером логической ошибки сомнительной причины , при которой два события, происходящие вместе, считаются установленными причинно-следственной связью. Это заблуждение также известно под латинским выражением cum hoc ergo propter hoc («с этим, следовательно, из-за этого»). Это отличается от заблуждения, известного как post hoc ergo propter hoc («после этого, следовательно, из-за этого»), при котором событие, следующее за другим, рассматривается как необходимое следствие предыдущего события, и от смешения , ошибочного слияния двух событий. события, идеи, базы данных и т. д. в одном.

Как и в случае с любой логической ошибкой, выявление ошибочности рассуждений, лежащих в основе аргумента, не обязательно означает , что полученный в результате вывод ложен. Были предложены статистические методы, которые используют корреляцию в качестве основы для проверки гипотез на причинность, включая тест причинности Грейнджера и конвергентное перекрестное картирование . Критерии Брэдфорда Хилла , также известные как критерии причинно-следственной связи Хилла, представляют собой группу из девяти принципов, которые могут быть полезны при установлении эпидемиологических доказательств причинно-следственной связи.

Использование и значение терминов

"Подразумевать"

В повседневном использовании слово «подразумевается» означает скорее « предполагает» , чем «требует» . Однако в логике техническое использование слова «подразумевается» означает «является достаточным условием для». [3] Именно это имеют в виду статистики, когда говорят, что причинно-следственная связь не определена. Действительно, p подразумевает, что q имеет технический смысл материального условного выражения : если p, то q, символизируемое как p → q . То есть «если обстоятельство p истинно, то следует и q ». В этом смысле всегда правильно сказать: «Корреляция не подразумевает причинно-следственную связь».

"Причина"

Слово « причина » (или «причинность») имеет в английском языке несколько значений. В философской терминологии «причина» может относиться к необходимым, достаточным или способствующим причинам. При изучении корреляции «причина» чаще всего используется для обозначения «одной способствующей причины» (но не обязательно единственной способствующей причины).

Если есть причинно-следственная связь, то есть корреляция, но также и временная последовательность от причины к следствию, вероятный механизм, а иногда и общие и промежуточные причины. Корреляция часто используется для вывода о причинно-следственной связи, поскольку она является необходимым условием: то есть, если A вызывает B, то A и B обязательно должны быть коррелированы. Однако это не является достаточным условием.

Неграмотность динозавров и их вымирание могут быть связаны, но это не означает, что переменные имеют причинно-следственную связь.

Причинно-следственный анализ

Причинный анализ - это область планирования эксперимента и статистики , относящаяся к установлению причины и следствия. [4] Обычно он включает в себя установление четырех элементов: корреляции , последовательности во времени (т. е. причины должны возникать до предполагаемого следствия), правдоподобного физического или теоретико-информационного механизма, позволяющего наблюдаемому эффекту следовать из возможной причины, и устранение возможность общих и альтернативных («особых») причин . Такой анализ обычно включает один или несколько искусственных или естественных экспериментов. [5]

Примеры нелогичного вывода причинно-следственной связи из корреляции

B вызывает A (обратная причинность или обратная причинность)

Обратная причинно-следственная связь или обратная причинно-следственная связь или неправильное направление — это неформальная ошибка сомнительной причины , когда причина и следствие меняются местами. Говорят, что причина является следствием и наоборот.

Пример 1
Чем быстрее вращаются ветряные мельницы, тем сильнее наблюдается ветер.
Следовательно, ветер возникает из-за вращения ветряных мельниц. (Или, проще говоря: ветряные мельницы, как следует из их названия, представляют собой машины, используемые для производства ветра.)

В этом примере корреляция (одновременность) между работой ветряных мельниц и скоростью ветра не означает, что ветер вызван ветряными мельницами. Скорее наоборот, о чем свидетельствует тот факт, что ветру не нужны ветряные мельницы, чтобы существовать, в то время как ветряным мельницам нужен ветер, чтобы вращаться. Ветер можно наблюдать там, где нет ветряных мельниц или невращающихся ветряных мельниц, и есть веские основания полагать, что ветер существовал до изобретения ветряных мельниц.

Пример 2
Субъекты с низким уровнем холестерина коррелируют с увеличением смертности.
Таким образом, низкий уровень холестерина увеличивает риск смертности.

Все наоборот, поскольку такие заболевания, как рак, вызывают низкий уровень холестерина из-за множества факторов, таких как потеря веса и увеличение смертности. [6] То же самое наблюдается и у бывших курильщиков. Бывшие курильщики чаще умирают от рака легких, чем нынешние курильщики. [7] Когда курильщикам на протяжении всей жизни сообщают, что у них рак легких, многие бросают курить. Из-за этого изменения может сложиться впечатление, будто бывшие курильщики чаще умирают от рака легких, чем нынешние курильщики. Это также можно наблюдать у алкоголиков. Когда у алкоголиков диагностируют цирроз печени, многие бросают пить. Однако они также испытывают повышенный риск смертности. В этих случаях именно болезни вызывают повышенный риск смертности, но повышенная смертность объясняется положительными эффектами, которые следуют за диагнозом, в результате чего здоровые изменения выглядят нездоровыми.

Пример 3

В других случаях может быть просто неясно, что является причиной, а что следствием. Например:

Дети, которые много смотрят телевизор , самые жестокие. Очевидно, что телевидение делает детей более жестокими .

Это легко могло быть наоборот; то есть жестокие дети любят смотреть больше телевизора, чем менее жестокие.

Пример 4

Корреляция между употреблением рекреационных наркотиков и психическими расстройствами может быть любой: возможно, наркотики вызывают расстройства, или, возможно, люди используют наркотики для самолечения уже существующих состояний. Теория «воротных наркотиков» может утверждать, что употребление марихуаны приводит к употреблению более сильных наркотиков, но употребление тяжелых наркотиков может привести к употреблению марихуаны (см. Также путаницу в обратном порядке ). Действительно, в социальных науках , где контролируемые эксперименты часто не могут быть использованы для выявления направления причинно-следственной связи, это заблуждение может подпитывать давние научные аргументы. Один из таких примеров можно найти в экономике образования , между моделями скрининга / сигнализации и человеческим капиталом : это может быть либо то, что наличие врожденных способностей позволяет человеку завершить образование, либо что завершение образования укрепляет его способности.

Пример 5

Историческим примером этого является то, что европейцы в средние века верили, что вши полезны для здоровья, поскольку у больных людей вши редко встречаются. Аргументация заключалась в том, что люди заболели, потому что вши ушли. Однако настоящая причина в том, что вши чрезвычайно чувствительны к температуре тела . Небольшое повышение температуры тела, например, при лихорадке , заставляет вшей искать другого хозяина. Медицинский термометр еще не был изобретен, поэтому повышение температуры наблюдалось редко. Заметные симптомы появились позже, что создавало впечатление, что вши ушли до того, как человек заболел. [8]

В других случаях каждое из двух явлений может быть частичной причиной другого; рассмотрите бедность и отсутствие образования или прокрастинацию и низкую самооценку. Однако тот, кто выдвигает аргумент, основанный на этих двух явлениях, должен быть осторожен, чтобы избежать ошибки круговой причины и следствия . Бедность является причиной отсутствия образования, но не единственной причиной , и наоборот.

Третий фактор C (общая причинная переменная) вызывает как A, так и B.

Заблуждение третьей причины (также известное как игнорирование общей причины [9] или сомнительной причины [9] ) — это логическая ошибка, при которой ложную связь путают с причинно-следственной связью . Он утверждает, что X вызывает Y, тогда как на самом деле и X, и Y вызваны Z. Это разновидность ошибки post hoc ergo propter hoc и член группы заблуждений сомнительных причин .

Во всех этих примерах речь идет о скрытой переменной , которая представляет собой просто скрытую третью переменную, влияющую на обе причины корреляции. Трудность часто возникает и тогда, когда третий фактор, хотя и принципиально отличается от А и В, настолько тесно связан с А и/или В, что его можно спутать с ними или очень трудно отделить от них с научной точки зрения (см. пример 4).

Пример 1
Сон в обуви тесно связан с пробуждением с головной болью.
Поэтому сон в обуви вызывает головную боль.

Приведенный выше пример допускает ошибку «корреляция подразумевает причинно-следственную связь», поскольку из него преждевременно делается вывод о том, что сон в обуви вызывает головную боль. Более правдоподобное объяснение состоит в том, что оба они вызваны третьим фактором, в данном случае ложением спать пьяным , что, таким образом, приводит к корреляции. Так что вывод неверный.

Пример 2
У маленьких детей, которые спят с включенным светом , в дальнейшей жизни гораздо чаще развивается близорукость .
Следовательно, сон с включенным светом вызывает близорукость.

Это научный пример, который стал результатом исследования в Медицинском центре Пенсильванского университета . Опубликованное в журнале Nature от 13 мая 1999 года [10] исследование получило в то время широкое освещение в популярной прессе . [11] Однако более позднее исследование, проведенное в Университете штата Огайо, не выявило, что младенцы , спящие при включенном свете, вызывают развитие близорукости. Они обнаружили сильную связь между близорукостью родителей и развитием близорукости у детей, а также отметили, что родители с близорукостью чаще оставляли свет включенным в спальне своих детей. [12] [13] [14] [15] В данном случае причиной обоих состояний является близорукость родителей, и приведенный выше вывод является ложным.

Пример 3
По мере увеличения продаж мороженого резко возрастает количество смертей от утопления.
Таким образом, употребление мороженого приводит к утоплению.

В этом примере не учитывается важность времени года и температуры для продаж мороженого. Мороженое продается в жаркие летние месяцы гораздо чаще, чем в холодное время, и именно в эти жаркие летние месяцы люди с большей вероятностью будут заниматься деятельностью, связанной с водой, например плаванием . Рост смертности от утопления вызван просто тем, что люди чаще занимаются водными видами спорта, а не мороженым. Изложенное заключение является ложным.

Пример 4
Гипотетическое исследование показывает взаимосвязь между показателями тревожности и застенчивости со статистическим значением r (сила корреляции) +,59. [16]
Таким образом, можно просто заключить, что застенчивость в некоторой степени причинно влияет на тестовую тревожность.

Однако, как было обнаружено во многих психологических исследованиях, была обнаружена еще одна переменная, «показатель застенчивости», которая имеет более резкую корреляцию (+,73) с застенчивостью. Это предполагает возможную проблему «третьей переменной», однако, когда обнаруживаются три таких тесно связанных показателя, это также предполагает, что каждый из них может иметь двунаправленные тенденции (см. «Двунаправленная переменная» выше), представляя собой кластер коррелирующих значений, каждое из которых влияет друг на друга. в некоторой степени. Следовательно, простой вывод, приведенный выше, может быть ошибочным.

Пример 5
С 1950-х годов резко возросли как уровень CO 2 в атмосфере, так и уровень ожирения .
Следовательно, атмосферный CO 2 вызывает ожирение.

Более богатые слои населения, как правило, едят больше еды и производят больше CO 2 .

Пример 6
Холестерин ЛПВП («хороший») отрицательно коррелирует с частотой сердечных приступов.
Таким образом, прием лекарств для повышения уровня ЛПВП снижает вероятность сердечного приступа.

Дальнейшие исследования [17] поставили этот вывод под сомнение. Вместо этого возможно, что другие основные факторы, такие как гены, диета и физические упражнения, влияют как на уровень ЛПВП, так и на вероятность сердечного приступа; вполне возможно, что лекарства могут влиять на непосредственно измеримый фактор — уровень ЛПВП, не влияя при этом на вероятность сердечного приступа.

Двунаправленная причинно-следственная связь: А вызывает Б, а Б вызывает А.

Причинность не обязательно односторонняя; [ сомнительно ] в отношениях хищник-жертва численность хищников влияет на численность жертв, но численность жертв, то есть запасы пищи, также влияет на численность хищников. Другой хорошо известный пример: индекс массы тела у велосипедистов ниже , чем у людей, которые не ездят на велосипеде. Это часто объясняют предположением, что езда на велосипеде повышает уровень физической активности и, следовательно, снижает ИМТ. Поскольку результаты проспективных исследований с участием людей, которые чаще используют велосипеды, показывают меньшее влияние на ИМТ, чем перекрестные исследования, может существовать и некоторая обратная причинно-следственная связь. Например, люди с более низким ИМТ могут в первую очередь с большей вероятностью захотеть ездить на велосипеде. [18]

Отношения между А и Б случайны.

Эти две переменные вообще не связаны между собой, а коррелируют случайно. Чем больше вещей исследуется, тем больше вероятность того, что две несвязанные переменные окажутся связанными. Например:

Использование корреляции в качестве научного доказательства

Большая часть научных данных основана на корреляции переменных [19] , которые наблюдаются вместе. Ученые осторожно отмечают, что корреляция не обязательно означает причинно-следственную связь. Предположение о том, что А вызывает Б просто потому, что А коррелирует с Б, часто не принимается в качестве законной формы аргументации.

Однако иногда люди совершают противоположную ошибку, полностью игнорируя корреляцию. Это приведет к игнорированию большого количества важных научных данных. [19] Поскольку проведение контролируемых двойных слепых исследований может быть трудным или этически невозможным, корреляционные данные с нескольких разных точек зрения могут быть полезны для прогнозирования , несмотря на отсутствие доказательств причинно- следственной связи . Например, социальные работники могут быть заинтересованы в том, чтобы узнать, как жестокое обращение с детьми связано с успеваемостью. Хотя было бы неэтично проводить эксперимент, в котором детей случайным образом распределяли на тех, кто подвергался или не подвергался жестокому обращению, исследователи могут изучить существующие группы, используя неэкспериментальный корреляционный план. Если на самом деле существует отрицательная корреляция между жестоким обращением и успеваемостью, исследователи потенциально могли бы использовать эти знания о статистической корреляции, чтобы делать прогнозы о детях, не участвовавших в исследовании, которые подвергаются жестокому обращению, даже несмотря на то, что исследование не смогло предоставить причинно-следственных доказательств того, что жестокое обращение снижает успеваемость. [20] Сочетание ограниченных доступных методологий с ошибкой игнорирования корреляции иногда использовалось для противодействия научным открытиям. Например, табачная промышленность исторически полагалась на отрицание корреляционных данных, чтобы отвергнуть связь между табачным дымом и раком легких [21] , как это делал биолог и статистик Рональд Фишер (часто от имени табачной промышленности). [список 1]

Корреляция — это ценный тип научных данных в таких областях, как медицина, психология и социология. Сначала необходимо подтвердить реальность корреляций, а затем систематически исследовать все возможные причинные связи. В конце концов, корреляция сама по себе не может использоваться в качестве доказательства причинно-следственной связи между лечением и пользой, фактором риска и заболеванием или социальным или экономическим фактором и различными исходами. Это один из видов доказательств, которым чаще всего злоупотребляют, поскольку легко и даже соблазнительно прийти к преждевременным выводам, основанным на предварительном появлении корреляции. [21]

Смотрите также

Рекомендации

  1. ^ Тафте 2006, с. 5
  2. ^ Олдрич, Джон (1995). «Подлинные и ложные корреляции у Пирсона и Юла». Статистическая наука . 10 (4): 364–376. дои : 10.1214/ss/1177009870 . JSTOR  2246135.
  3. ^ «Достаточно». Вольфрам . 2019-12-02 . Проверено 3 декабря 2019 г.
  4. ^ Ролфинг, Инго; Шнайдер, Карстен К. (2018). «Объединяющая структура причинного анализа в теоретико-множественных многометодных исследованиях» (PDF) . Социологические методы и исследования . 47 (1): 37–63. дои : 10.1177/0049124115626170. S2CID  124804330 . Проверено 29 февраля 2020 г.
  5. ^ Брэди, Генри Э. (7 июля 2011 г.). «Причинность и объяснение в социальных науках». Оксфордский справочник по политологии . дои : 10.1093/oxfordhb/9780199604456.013.0049 . Проверено 29 февраля 2020 г.
  6. ^ Навид Саттар; Дэвид Прейсс (13 июня 2017 г.). «Обратная причинно-следственная связь в сердечно-сосудистых эпидемиологических исследованиях». Тираж . 135 (24): 2369–2372. doi : 10.1161/CIRCULATIONAHA.117.028307 . ПМИД  28606949.
  7. ^ Ричард Долл; Ричард Пето; Джиллиан Борэм; Изабель Сазерленд (24 июня 2004 г.). «Смертность, связанная с курением: 50-летние наблюдения за британскими врачами-мужчинами». БМЖ . 328 (7455): 1239–49. дои : 10.1136/bmj.38142.554479.AE. ПМЦ 437139 . ПМИД  15213107. 
  8. ^ Уиллингем, Эмили. «О вшах и людях: зудящая история». Сеть блогов Scientific American . Проверено 26 февраля 2019 г.
  9. ^ ab Labossiere, MC, Страницы философии доктора ЛаБоссьера, заархивированные 22 мая 2009 г. в Wayback Machine.
  10. ^ Куинн, Грэм Э.; Шин, Чай Х.; Магуайр, Морин Г.; Стоун, Ричард А. (май 1999 г.). «Близорукость и окружающее освещение в ночное время». Природа . 399 (6732): 113–114. Бибкод : 1999Natur.399..113Q. дои : 10.1038/20094. PMID  10335839. S2CID  4419645.
  11. CNN , 13 мая 1999 г. Ночник может привести к близорукости.
  12. ^ Новости исследований Университета штата Огайо , 9 марта 2000 г. Ночное освещение не приводит к близорукости, показывают исследования. Архивировано 1 сентября 2006 г. в Wayback Machine.
  13. ^ Задник, Карла; Джонс, Лиза А.; Ирвин, Бретт С.; Кляйнштейн, Роберт Н.; Мэнни, Рут Э.; Шин, Джули А.; Мутти, Дональд О. (2000). «Зрение: близорукость и окружающее ночное освещение». Природа . 404 (6774): 143–144. Бибкод : 2000Natur.404..143Z. дои : 10.1038/35004661. PMID  10724157. S2CID  4399332.
  14. ^ Гвязда, Дж.; Онг, Э.; Хелд, Р.; Торн, Ф. (2000). «Зрение: близорукость и окружающее ночное освещение». Природа . 404 (6774): 144. Бибкод : 2000Natur.404..144G. дои : 10.1038/35004663 . ПМИД  10724158.
  15. ^ Стоун, Ричард А.; Магуайр, Морин Г.; Куинн, Грэм Э. (2000). «Зрение: ответ: близорукость и ночное освещение». Природа . 404 (6774): 144. Бибкод : 2000Natur.404..144S. дои : 10.1038/35004665 . ПМИД  10724158.
  16. ^ Кардуччи, Бернардо Дж. (2009). Психология личности: точки зрения, исследования и приложения (2-е изд.). Джон Уайли и сыновья. ISBN 978-1-4051-3635-8.
  17. ^ Орниш, Дин. «Холестерин: хорошее, плохое и правда» [1] (получено 3 июня 2011 г.)
  18. ^ Донс, Э (2018). «Выбор режима транспорта и индекс массы тела: перекрестные и продольные данные общеевропейского исследования» (PDF) . Интернационал окружающей среды . 119 (119): 109–116. doi :10.1016/j.envint.2018.06.023. hdl : 10044/1/61061 . PMID  29957352. S2CID  49607716.
  19. ^ ab Novella (18 ноября 2009 г.). «Доказательства в медицине: корреляция и причинно-следственная связь». Наука и медицина . Научная медицина.
  20. ^ Нильсен, Майкл (23 января 2012 г.). «Если корреляция не подразумевает причинно-следственную связь, то что тогда? | DDI». Michaelnielsen.org . Проверено 8 октября 2017 г.
  21. ^ ab «Доказательства в медицине: корреляция и причинно-следственная связь - научная медицина». Sciencebasedmedicine.org. 18 ноября 2009 г. Проверено 8 октября 2017 г.
  22. ^ Сильвер, Нейт (2015), Сигнал и шум: почему так много прогнозов не работают, а некоторые нет (2-е изд.), Нью-Йорк : Penguin Books , стр. 254–255
  23. ^ Фишер, Рональд (6 июля 1957 г.), «Опасности курения сигарет», Британский медицинский журнал , Лондон : Британская медицинская ассоциация , 2 (5035): 43, doi : 10.1136/bmj.2.5035.43, JSTOR  25383068, ЧВК 1961750 
  24. ^ Фишер, Рональд (3 августа 1957 г.), «Опасности курения сигарет», Британский медицинский журнал , Лондон : Британская медицинская ассоциация , 2 (5039): 297–298, doi : 10.1136/bmj.2.5039.297-b , JSTOR  25383439, ЧВК 1961712 
  25. ^ Фишер, Рональд (1958), «Сигареты, рак и статистика» (PDF) , The Centennial Review of Arts & Science , Ист-Лансинг, Мичиган : Издательство Мичиганского государственного университета , 2 : 151–166, в архиве (PDF) из оригинал от 09.10.2022
  26. ^ Фишер, Рональд (1958), «Природа вероятности» (PDF) , The Centennial Review of Arts & Science , Ист-Лансинг, Мичиган : Издательство Мичиганского государственного университета , 2 : 261–274, в архиве (PDF) с оригинала на 09.10.2022
  27. ^ Фишер, Рональд (12 июля 1958 г.), «Рак легких и сигареты» (PDF) , Nature , Лондон : Nature Publishing Group , 182 (4628): 108, Бибкод : 1958Natur.182..108F, doi : 10.1038/182108a0 , PMID  13566198, заархивировано (PDF) из оригинала 9 октября 2022 г.
  28. ^ Фишер, Рональд (30 августа 1958 г.), «Рак и курение» (PDF) , Nature , Лондон : Nature Publishing Group , 182 (4635): 596, Бибкод : 1958Natur.182..596F, doi : 10.1038/182596a0 , PMID  13577916, заархивировано (PDF) из оригинала 9 октября 2022 г.
Ссылки в комплекте
  1. ^ [22] [23] [24 ] [25] [26 ] [27] [28]

Библиография