stringtranslate.com

Парадокс Симпсона

Парадокс Симпсона для количественных данных: положительная тенденция ( , ) проявляется для двух отдельных групп, тогда как отрицательная тенденция ( ) появляется при объединении групп.
Визуализация парадокса Симпсона на данных, напоминающих изменчивость в реальном мире, указывает на то, что риск неправильной оценки истинной причинно-следственной связи может быть трудно обнаружить.

Парадокс Симпсона — это явление в теории вероятности и статистике , при котором тенденция появляется в нескольких группах данных, но исчезает или меняется на противоположную при объединении групп. Этот результат часто встречается в статистике социальных и медицинских наук, [1] [2] [3] и является особенно проблематичным, когда данным о частоте необоснованно дается причинно-следственная интерпретация. [4] Парадокс можно разрешить, если смешивающие переменные и причинно-следственные связи соответствующим образом учитываются в статистическом моделировании [4] [5] (например, посредством кластерного анализа [6] ).

Парадокс Симпсона использовался для иллюстрации того, какие вводящие в заблуждение результаты может привести к неправильному использованию статистики . [7] [8]

Эдвард Х. Симпсон впервые описал это явление в технической статье в 1951 году [9] , но статистики Карл Пирсон (в 1899 году [10] ) и Удни Юл (в 1903 году [11] ) упоминали подобные эффекты ранее. Название « парадокс Симпсона» было введено Колином Р. Блитом в 1972 году. [12] Его также называют обращением Симпсона , эффектом Юла-Симпсона , парадоксом слияния или парадоксом разворота . [13]

Математик Джордан Элленберг утверждает, что парадокс Симпсона ошибочно назван тем, что «здесь нет никакого противоречия, есть только два разных способа думать об одних и тех же данных», и предполагает, что его урок «на самом деле не в том, чтобы сказать нам, какую точку зрения принять, а в том, чтобы настаивать на том, чтобы мы придерживались и части, и целое в уме одновременно». [14]

Примеры

Гендерная предвзятость Калифорнийского университета в Беркли

Один из самых известных примеров парадокса Симпсона связан с исследованием гендерных предубеждений среди поступающих в аспирантуру Калифорнийского университета в Беркли . Данные о приеме на осень 1973 года показали, что мужчины, подавшие заявления, были приняты с большей вероятностью, чем женщины, и разница была настолько велика, что вряд ли она была случайной. [15] [16]

Однако при учете информации о факультетах, на которые подаются заявления, разный процент отказов свидетельствует о разной сложности поступления на факультет, и в то же время это показало, что женщины, как правило, обращались на более конкурентоспособные факультеты с более низкими показателями приема. даже среди квалифицированных абитуриентов (например, на факультете английского языка), тогда как мужчины, как правило, подавались на менее конкурентоспособные факультеты с более высокими показателями поступления (например, на инженерный факультет). Объединенные и скорректированные данные показали «небольшую, но статистически значимую предвзятость в пользу женщин». [16]

Данные шести крупнейших ведомств приведены ниже:

Все данные показали, что в общей сложности 4 из 85 департаментов имеют значительную предвзятость по отношению к женщинам, а 6 - к мужчинам (не все представлены в приведенной выше таблице «шесть крупнейших департаментов»). Примечательно, что основанием для такого вывода было не количество предвзятых факультетов, а, скорее, гендерные показатели приема, объединенные по всем факультетам, с учетом процента отказов каждого факультета среди всех его претендентов. [16]

Лечение камней в почках

Другой пример взят из реального медицинского исследования [17], в котором сравнивались показатели успеха двух методов лечения камней в почках . [18] В таблице ниже показаны показатели успеха (термин « показатель успеха» здесь фактически означает долю успеха) и количество курсов лечения как небольших, так и крупных камней в почках, где лечение А включает открытые хирургические процедуры, а лечение Б включает закрытые хирургические процедуры. . Цифры в скобках указывают количество успешных случаев по отношению к общему размеру группы.

Парадоксальный вывод заключается в том, что метод А более эффективен при использовании для камней небольшого размера, а также при использовании для камней большого размера, однако метод Б оказывается более эффективным при одновременном рассмотрении обоих размеров. В этом примере «скрытой» переменной (или мешающей переменной ), вызывающей парадокс, является размер камней, который ранее не был известен исследователям как важный, пока не были учтены его эффекты.

Какое лечение считается лучшим, определяется тем, какой коэффициент успеха (успехов/общее количество) выше. Изменение неравенства между двумя соотношениями при рассмотрении объединенных данных, что создает парадокс Симпсона, происходит потому, что два эффекта происходят одновременно:

  1. Размеры групп, которые объединяются при игнорировании скрытой переменной, сильно различаются. Врачи склонны назначать пациентам с крупными камнями лучшее лечение А, а случаям с мелкими камнями — худшее лечение B. Таким образом, в общих показателях преобладают группы 3 и 2, а не две гораздо меньшие группы 1 и 4.
  2. Скрытая переменная, размер камня, оказывает большое влияние на соотношение; т.е. на вероятность успеха больше влияет тяжесть случая, чем выбор лечения. Таким образом, группа пациентов с крупными камнями, использующая лечение А (группа 3), чувствует себя хуже, чем группа с мелкими камнями, даже если последние использовали худшее лечение Б (группа 2).

На основе этих эффектов видно, что возникает парадоксальный результат, поскольку влияние размера камней превосходит преимущества лучшего лечения (А). Короче говоря, менее эффективное лечение B оказалось более эффективным, поскольку его чаще применяли к случаям небольших камней, которые легче лечить. [18]

Средние показатели ударов

Типичным примером парадокса Симпсона являются средние показатели ударов игроков в профессиональном бейсболе . Один игрок может иметь более высокий средний показатель результативности, чем другой игрок, каждый год в течение ряда лет, но иметь более низкий средний показатель за все эти годы. Это явление может возникнуть, когда существуют большие различия в численности летучих мышей в разные годы. Математик Кен Росс продемонстрировал это, используя средние показатели двух бейсболистов, Дерека Джетера и Дэвида Джастиса , в 1995 и 1996 годах: [19] [20]

И в 1995, и в 1996 году у Джастиса был более высокий средний показатель (выделено жирным шрифтом), чем у Джетера. Однако, если объединить два бейсбольных сезона, Джетер показывает более высокий средний показатель, чем Джастис. По словам Росса, такое явление среди возможных пар игроков будет наблюдаться примерно раз в год. [19]

Векторная интерпретация

Векторная интерпретация парадокса Симпсона

Парадокс Симпсона также можно проиллюстрировать с помощью двумерного векторного пространства . [21] Вероятность успеха (т. е. успехов/попыток ) может быть представлена ​​вектором с наклоном . Тогда более крутой вектор означает более высокий уровень успеха. Если две скорости и объединяются, как в примерах, приведенных выше, результат может быть представлен суммой векторов и , что согласно правилу параллелограмма является вектором , с наклоном .

Парадокс Симпсона гласит, что даже если вектор (оранжевый на рисунке) имеет меньший наклон, чем другой вектор (синий), и имеет наклон меньший, чем , сумма двух векторов потенциально все равно может иметь больший наклон, чем сумма два вектора , как показано в примере. Чтобы это произошло, один из оранжевых векторов должен иметь больший наклон, чем один из синих векторов (здесь и ), и они обычно будут длиннее, чем векторы с альтернативными индексами, что будет доминировать в общем сравнении.

Корреляция между переменными

Разворот Симпсона может также возникнуть в корреляциях , в которых две переменные кажутся имеющими (скажем) положительную корреляцию друг с другом, хотя на самом деле они имеют отрицательную корреляцию, причем разворот был вызван «скрытым» искажающим фактором. Берман и др. [22] приводят пример из экономики, где набор данных предполагает, что общий спрос положительно коррелирует с ценой (то есть, более высокие цены приводят к большему спросу), что противоречит ожиданиям. Анализ показывает, что время является смешанной переменной: отображение цены и спроса в зависимости от времени показывает ожидаемую отрицательную корреляцию за различные периоды, которая затем меняется на обратную и становится положительной, если влияние времени игнорируется путем простого построения графика спроса в зависимости от цены.

Психология

Психологический интерес к парадоксу Симпсона направлен на объяснение того, почему люди поначалу считают изменение знака невозможным, оскорбляясь идеей о том, что действие, предпочитаемое как при одном условии, так и при его отрицании, должно быть отвергнуто, когда условие неизвестно. Вопрос в том, откуда у людей такая сильная интуиция и как она закодирована в сознании .

Парадокс Симпсона демонстрирует, что эту интуицию нельзя вывести ни из классической логики , ни из исчисления вероятностей , и, таким образом, побудил философов предположить, что она поддерживается врожденной причинной логикой, которая направляет людей в рассуждениях о действиях и их последствиях. [4] Принцип уверенности Сэвиджа [12] является примером того, что может повлечь за собой такая логика. Уточненная версия принципа уверенности Сэвиджа действительно может быть выведена из do -исчисления Перла [4] и гласит: «Действие А , которое увеличивает вероятность события B в каждой субпопуляции C i из C , должно также увеличивать вероятность события B в каждой субпопуляции C i из C. население в целом, при условии, что действие не меняет распределение субпопуляций». Это говорит о том, что знания о действиях и последствиях хранятся в форме, напоминающей причинные байесовские сети .

Вероятность

В статье Павлидеса и Перлмана Хаджикостаса представлено доказательство того, что в случайной таблице 2 × 2 × 2 с равномерным распределением парадокс Симпсона произойдет с вероятностью ровно 160 . [23] Исследование Кока предполагает, что вероятность того, что парадокс Симпсона возникнет случайным образом в моделях путей (т. е. моделях, созданных путем анализа путей ) с двумя предикторами и одной критериальной переменной, составляет примерно 12,8 процента; немного выше, чем 1 случай на 8-путевые модели. [24]

Второй парадокс Симпсона

Второй, менее известный парадокс также обсуждался в статье Симпсона 1951 года. Это может произойти, когда «разумная интерпретация» не обязательно находится в отдельных данных, как в примере с камнями в почках, а вместо этого может находиться в объединенных данных. Следует ли использовать секционированную или комбинированную форму данных, зависит от процесса, в результате которого возникли данные, а это означает, что правильную интерпретацию данных не всегда можно определить, просто наблюдая за таблицами. [25]

Джудея Перл показала, что для того, чтобы разделенные данные представляли правильные причинно-следственные связи между любыми двумя переменными и переменные разделения должны удовлетворять графическому условию, называемому «критерием черного хода»: [26] [27]

  1. Они должны блокировать все ложные пути между и
  2. Никакая переменная не может быть затронута

Этот критерий обеспечивает алгоритмическое решение второго парадокса Симпсона и объясняет, почему правильная интерпретация не может быть определена только на основе данных; два разных графика, оба совместимых с данными, могут диктовать два разных критерия «черного хода».

Когда критерию «черной двери» удовлетворяет набор Z ковариат, формула корректировки (см. « Смешение ») дает правильное причинное влияние X на Y. Если такого набора не существует, можно использовать do -исчисление Перла, чтобы найти другие способы оценки причинного эффекта. [4] [28] Полнота do -исчисления [29] [28] может рассматриваться как полное разрешение парадокса Симпсона.

Критика

Одна из критических замечаний заключается в том, что этот парадокс на самом деле вовсе не парадокс, а скорее неспособность должным образом объяснить смешивающие переменные или рассмотреть причинно-следственные связи между переменными. [30]

Другая критика очевидного парадокса Симпсона заключается в том, что он может быть результатом особого способа стратификации или группировки данных. Это явление может исчезнуть или даже обратить вспять, если данные стратифицированы по-другому или если учитывать разные мешающие переменные. Пример Симпсона фактически высветил явление, называемое неколлапсируемостью, [31] которое возникает, когда подгруппы с высокими пропорциями не дают простых средних значений при объединении. Это говорит о том, что парадокс может быть не универсальным явлением, а скорее конкретным примером более общей статистической проблемы.

Критики очевидного парадокса Симпсона также утверждают, что внимание к парадоксу может отвлечь от более важных статистических проблем, таких как необходимость тщательного рассмотрения мешающих переменных и причинно-следственных связей при интерпретации данных. [32]

Несмотря на эту критику, очевидный парадокс Симпсона остается популярной и интригующей темой в статистике и анализе данных. Его продолжают изучать и обсуждать исследователи и практики в самых разных областях, и он служит ценным напоминанием о важности тщательного статистического анализа и потенциальных ошибках упрощенной интерпретации данных.

Смотрите также

Рекомендации

  1. ^ Клиффорд Х. Вагнер (февраль 1982 г.). «Парадокс Симпсона в реальной жизни». Американский статистик . 36 (1): 46–48. дои : 10.2307/2684093. JSTOR  2684093.
  2. ^ Холт, Великобритания (2016). Потенциальный парадокс Симпсона в многоцентровом исследовании внутрибрюшинной химиотерапии рака яичников. Журнал клинической онкологии, 34 (9), 1016–1016.
  3. ^ Фрэнкс, Александр; Айролди, Эдоардо ; Славов, Николай (2017). «Посттранскрипционная регуляция в тканях человека». PLOS Вычислительная биология . 13 (5): e1005535. arXiv : 1506.00219 . Бибкод : 2017PLSCB..13E5535F. дои : 10.1371/journal.pcbi.1005535 . ISSN  1553-7358. ПМК 5440056 . ПМИД  28481885. 
  4. ^ abcde Иудея Перл . Причинность: модели, рассуждения и выводы , Cambridge University Press (2000, 2-е издание, 2009 г.). ISBN 0-521-77362-8
  5. ^ Кок, Н., и Гаскинс, Л. (2016). Парадокс Симпсона, умеренность и появление квадратичных отношений в моделях путей: иллюстрация информационных систем. Международный журнал прикладной нелинейной науки, 2 (3), 200–234.
  6. ^ Рожье А. Киевит, Виллем Э. Франкенхейс, Лоренс Дж. Уолдорп и Денни Борсбум, Парадокс Симпсона в психологической науке: практическое руководство https://doi.org/10.3389/fpsyg.2013.00513
  7. ^ Роберт Л. Уордроп (февраль 1995 г.). «Парадокс Симпсона и горячая рука в баскетболе». Американский статистик , 49 (1) : стр. 24–28.
  8. ^ Алан Агрести (2002). «Категорный анализ данных» (второе издание). ISBN Джона Уайли и сыновей 0-471-36093-7 
  9. ^ Симпсон, Эдвард Х. (1951). «Интерпретация взаимодействия в таблицах сопряженности». Журнал Королевского статистического общества, серия B. 13 : 238–241.
  10. ^ Пирсон, Карл ; Ли, Алиса; Брэмли-Мур, Лесли (1899). «Генетический (репродуктивный) отбор: наследование фертильности у человека и плодовитости у чистокровных скаковых лошадей». Философские труды Королевского общества А. 192 : 257–330. дои : 10.1098/rsta.1899.0006 .
  11. ^ ГУ Юл (1903). «Заметки по теории ассоциации атрибутов в статистике». Биометрика . 2 (2): 121–134. дои : 10.1093/биомет/2.2.121.
  12. ^ ab Колин Р. Блит (июнь 1972 г.). «О парадоксе Симпсона и принципе уверенности». Журнал Американской статистической ассоциации . 67 (338): 364–366. дои : 10.2307/2284382. JSTOR  2284382.
  13. ^ И. Дж. Гуд , Ю. Миттал (июнь 1987 г.). «Объединение и геометрия таблиц сопряженности два на два». Анналы статистики . 15 (2): 694–711. дои : 10.1214/aos/1176350369 . ISSN  0090-5364. JSTOR  2241334.
  14. Элленберг, Иордания (25 мая 2021 г.). Форма: скрытая геометрия информации, биологии, стратегии, демократии и всего остального. Нью-Йорк: Пингвин Пресс . п. 228. ИСБН 978-1-9848-7905-9. ОСЛК  1226171979.
  15. ^ Дэвид Фридман , Роберт Пизани и Роджер Первс (2007), Статистика (4-е издание), WW Norton . ISBN 0-393-92972-8
  16. ^ abc PJ Bickel , EA Hammel и JW O'Connell (1975). «Половая предвзятость при поступлении в аспирантуру: данные Беркли» (PDF) . Наука . 187 (4175): 398–404. Бибкод : 1975Sci...187..398B. дои : 10.1126/science.187.4175.398. PMID  17835295. S2CID  15278703. Архивировано (PDF) из оригинала 4 июня 2016 г.
  17. ^ CR Чариг; Д.Р. Уэбб; С.Р. Пейн; Дж. Э. Уикхэм (29 марта 1986 г.). «Сравнение лечения камней в почках открытым хирургическим путем, чрескожной нефролитотомией и экстракорпоральной ударно-волновой литотрипсией». Br Med J (Clin Res Ed) . 292 (6524): 879–882. дои : 10.1136/bmj.292.6524.879. ПМЦ 1339981 . ПМИД  3083922. 
  18. ^ аб Стивен А. Джулиус; Марк А. Малли (3 декабря 1994 г.). «Смешение и парадокс Симпсона». БМЖ . 309 (6967): 1480–1481. дои : 10.1136/bmj.309.6967.1480. ПМК 2541623 . ПМИД  7804052. 
  19. ^ аб Кен Росс. « Математик на стадионе: шансы и вероятности для любителей бейсбола (мягкая обложка) » Pi Press, 2004. ISBN 0-13-147990-3 . 12–13 
  20. ^ Статистические данные доступны на сайте Baseball-Reference.com : данные по Дереку Джетеру; Данные для Дэвида Джастиса.
  21. ^ Коцик Ежи (2001). «Доказательства без слов: парадокс Симпсона» (PDF) . Журнал «Математика» . 74 (5): 399. дои : 10.2307/2691038. JSTOR  2691038. Архивировано (PDF) из оригинала 12 июня 2010 г.
  22. ^ Берман, С. ДаллеМул, Л. Грин, М., Лакер, Дж. (2012), «Парадокс Симпсона: поучительная история в области расширенной аналитики. Архивировано 10 мая 2020 г. в Wayback Machine », Значение .
  23. ^ Мариос Г. Павлидес и Майкл Д. Перлман (август 2009 г.). «Насколько вероятен парадокс Симпсона?». Американский статистик . 63 (3): 226–233. дои : 10.1198/tast.2009.09007. S2CID  17481510.
  24. ^ Кок, Н. (2015). Насколько вероятен парадокс Симпсона в моделях путей? Международный журнал электронного сотрудничества, 11 (1), 1–7.
  25. ^ Нортон, Х. Джеймс; Дивайн, Джордж (август 2015 г.). «Парадокс Симпсона... и как его избежать». Значение . 12 (4): 40–43. дои : 10.1111/j.1740-9713.2015.00844.x .
  26. ^ Перл, Иудея (2014). «Понимание парадокса Симпсона». Американский статистик . 68 (1): 8–13. дои : 10.2139/ssrn.2343788. S2CID  2626833.
  27. ^ Перл, Иудея (1993). «Графические модели, причинно-следственная связь и вмешательство». Статистическая наука . 8 (3): 266–269. дои : 10.1214/ss/1177010894 .
  28. ^ Аб Перл, Дж.; Маккензи, Д. (2018). Книга «Почему: новая наука о причине и следствии» . Нью-Йорк, штат Нью-Йорк: Основные книги.
  29. ^ Шпицер, И.; Перл, Дж. (2006). Дектер, Р.; Ричардсон, Т.С. (ред.). «Идентификация условных интервенционных распределений». Материалы двадцать второй конференции по неопределенности в искусственном интеллекте . Корваллис, Орегон: AUAI Press: 437–444.
  30. ^ Блит, Колин Р. (июнь 1972 г.). «О парадоксе Симпсона и принципе уверенности». Журнал Американской статистической ассоциации . 67 (338): 364–366. дои : 10.1080/01621459.1972.10482387. ISSN  0162-1459.
  31. ^ Гренландия, Сандер (01 ноября 2021 г.). «Неколлапсируемость, путаница и предвзятость из-за разреженных данных. Часть 2: Что следует делать исследователям из постоянных споров по поводу отношения шансов?». Журнал клинической эпидемиологии . 139 : 264–268. дои : 10.1016/j.jclinepi.2021.06.004 . ISSN  0895-4356. ПМИД  34119647.
  32. ^ Эрнан, Мигель А.; Клейтон, Дэвид; Кейдинг, Нильс (июнь 2011 г.). «Парадокс Симпсонов раскрыт». Международный журнал эпидемиологии . 40 (3): 780–785. дои : 10.1093/ije/dyr041. ISSN  1464-3685. ПМК 3147074 . ПМИД  21454324. 

Библиография

Внешние ссылки