Направленный граф, моделирующий причинно-следственные связи между переменными
В статистике, эконометрике, эпидемиологии, генетике и смежных дисциплинах причинно-следственные графы (также известные как диаграммы путей , причинно-следственные байесовские сети или DAG ) представляют собой вероятностные графические модели, используемые для кодирования предположений о процессе генерации данных.
Причинно-следственные графы могут использоваться для коммуникации и вывода. Они дополняют другие формы причинно-следственной аргументации, например, с использованием нотации причинно-следственного равенства. Как средства коммуникации, графы обеспечивают формальное и прозрачное представление причинно-следственных предположений, которые исследователи могут захотеть передать и защитить. Как инструменты вывода, графы позволяют исследователям оценивать размеры эффекта из неэкспериментальных данных, [1] [2] [3] [4] [5] выводить проверяемые следствия закодированных предположений, [1] [6] [7] [8] проверять внешнюю валидность, [9] и управлять отсутствующими данными [10] и смещением отбора. [11]
Причинно-следственные графы были впервые использованы генетиком Сьюэллом Райтом [12] под рубрикой «диаграммы путей». Позднее они были приняты социологами [13] [14] [15] [16] [17] и, в меньшей степени, экономистами. [18] Первоначально эти модели были ограничены линейными уравнениями с фиксированными параметрами. Современные разработки расширили графические модели до непараметрического анализа и, таким образом, достигли общности и гибкости, которые преобразили причинно-следственный анализ в компьютерной науке, эпидемиологии [19] и социальных науках. [20] Недавние достижения включают разработку крупномасштабных причинно-следственных графов, таких как CauseNet, который компилирует более 11 миллионов причинно-следственных связей, извлеченных из веб-источников, для поддержки ответов на причинные вопросы и рассуждений. [21]
Конструкция и терминология
Причинно-следственный граф можно нарисовать следующим образом. Каждая переменная в модели имеет соответствующую вершину или узел, и стрелка рисуется от переменной X к переменной Y всякий раз, когда Y оценивается как реагирующая на изменения X, когда все остальные переменные остаются постоянными. Переменные, связанные с Y посредством прямых стрелок , называются родителями Y или «прямыми причинами Y » и обозначаются как Pa(Y) .
Причинные модели часто включают «ошибочные члены» или «пропущенные факторы», которые представляют все неизмеренные факторы, которые влияют на переменную Y , когда Pa(Y) сохраняется постоянным. В большинстве случаев ошибочные члены исключаются из графика. Однако, если автор графика подозревает, что ошибочные члены любых двух переменных являются зависимыми (например, две переменные имеют ненаблюдаемую или скрытую общую причину), то между ними рисуется двунаправленная дуга. Таким образом, наличие скрытых переменных учитывается посредством корреляций, которые они вызывают между ошибочными членами, как представлено двунаправленными дугами.
Фундаментальные инструменты
Фундаментальным инструментом в графическом анализе является d-разделение , которое позволяет исследователям определить, путем проверки, подразумевает ли каузальная структура, что два набора переменных независимы, учитывая третий набор. В рекурсивных моделях без коррелированных членов ошибок (иногда называемых марковскими ), эти условные независимости представляют все проверяемые импликации модели. [22]
Пример
Предположим, мы хотим оценить влияние посещения элитного колледжа на будущие доходы. Простая регрессия доходов на рейтинг колледжа не даст беспристрастной оценки целевого эффекта, поскольку элитные колледжи очень избирательны, и посещающие их студенты, скорее всего, имели квалификацию для высокооплачиваемой работы до поступления в школу. Предполагая, что причинно-следственные связи линейны, эти фоновые знания можно выразить в следующей спецификации модели структурного уравнения (SEM).
Модель 1
где представляет квалификацию человека до поступления в колледж, представляет квалификацию после окончания колледжа, содержит атрибуты, представляющие качество обучения в колледже, и зарплату человека.
Рисунок 1 представляет собой причинно-следственный граф, представляющий эту спецификацию модели. Каждая переменная в модели имеет соответствующий узел или вершину в графе. Кроме того, для каждого уравнения стрелки рисуются от независимых переменных к зависимым переменным. Эти стрелки отражают направление причинно-следственной связи. В некоторых случаях мы можем пометить стрелку соответствующим ей структурным коэффициентом, как на рисунке 1.
Если и являются ненаблюдаемыми или скрытыми переменными, их влияние на и можно отнести к их ошибкам. Удалив их, мы получаем следующую спецификацию модели:
Модель 2
Исходная информация, указанная в модели 1, подразумевает, что ошибка члена , , коррелирует с ошибкой члена C . В результате мы добавляем двунаправленную дугу между S и C , как показано на рисунке 2.
Поскольку коррелирует с и, следовательно, , является эндогенным и не определяется в Модели 2. Однако, если мы включим силу заявления индивидуума о поступлении в колледж, , как показано на Рисунке 3, мы получим следующую модель:
Модель 3
Удалив скрытые переменные из спецификации модели, получаем:
Модель 4
с коррелирует с .
Теперь, идентифицируется и может быть оценена с использованием регрессии на и . Это может быть проверено с использованием критерия одной двери , [1] [23] необходимое и достаточное графическое условие для идентификации структурных коэффициентов, таких как , с использованием регрессии.
^ Tian, Jin; Pearl, Judea (2002). "Общее условие идентификации причинных эффектов". Труды Восемнадцатой национальной конференции по искусственному интеллекту . ISBN978-0-262-51129-2.
^ Шпицер, Илья; Перл, Джудеа (2008). «Полные методы идентификации для причинной иерархии» (PDF) . Журнал исследований машинного обучения . 9 : 1941–1979.
^ Хуан, И.; Валторта, М. (2006). Идентифицируемость в каузальных байесовских сетях: надежный и полный алгоритм (PDF) .
^ Барейнбойм, Элиас; Перл, Джудеа (2012). «Причинно-следственный вывод с помощью суррогатных экспериментов: z-идентифицируемость». Труды Двадцать восьмой конференции по неопределенности в искусственном интеллекте . arXiv : 1210.4842 . Bibcode : 2012arXiv1210.4842B. ISBN978-0-9749039-8-9.
^ Tian, Jin; Pearl, Judea (2002). «О проверяемых следствиях причинных моделей со скрытыми переменными». Труды Восемнадцатой конференции по неопределенности в искусственном интеллекте . С. 519–27. arXiv : 1301.0608 . Bibcode :2013arXiv1301.0608T. ISBN978-1-55860-897-9.
^ Шпицер, Илья; Перл, Джудеа (2008). «Полные методы идентификации для причинной иерархии» (PDF) . Журнал исследований машинного обучения . 9 (64): 1941–1979. ISSN 1533-7928 . Получено 11 августа 2024 г. .
^ Чен, Брайант; Перл, Джудеа (2014). «Проверяемые следствия моделей линейных структурных уравнений». Труды конференции AAAI по искусственному интеллекту . 28. doi : 10.1609/aaai.v28i1.9065 . S2CID 1612893.
^ Bareinmboim, Elias; Pearl, Judea (2014). «Внешняя валидность: от do-calculus к переносимости между популяциями». Статистическая наука . 29 (4): 579–595. arXiv : 1503.01603 . doi : 10.1214/14-sts486. S2CID 5586184.
^ Мохан, Картика; Перл, Джудеа; Тиан, Джин (2013). «Графические модели для вывода с отсутствующими данными» (PDF) . Достижения в области нейронных систем обработки информации .
^ Барейнбойм, Элиас; Тянь, Цзинь; Перл, Джудеа (2014). «Восстановление после смещения отбора в причинно-следственном и статистическом выводе». Труды конференции AAAI по искусственному интеллекту . 28 . doi : 10.1609/aaai.v28i1.9074 .
^ Райт, С. (1921). «Корреляция и причинно-следственная связь». Журнал сельскохозяйственных исследований . 20 : 557–585.
^ Блэлок, Х. М. (1960). «Корреляционный анализ и причинные выводы». Американский антрополог . 62 (4): 624–631. doi : 10.1525/aa.1960.62.4.02a00060 .
^ Дункан, О. Д. (1966). «Анализ пути: социологические примеры». Американский журнал социологии . 72 : 1–16. doi : 10.1086/224256. S2CID 59428866.
^ Дункан, О. Д. (1976). «Введение в модели структурных уравнений». Американский журнал социологии . 82 (3): 731–733. doi :10.1086/226377.
^ Jöreskog, KG (1969). «Общий подход к подтверждающему анализу максимального фактора правдоподобия». Psychometrika . 34 (2): 183–202. doi :10.1007/bf02289343. S2CID 186236320.
^ Голдбергер, А.С. (1972). «Модели структурных уравнений в социальных науках». Econometrica . 40 (6): 979–1001. doi :10.2307/1913851. JSTOR 1913851.
^ Уайт, Халберт; Чалак, Карим; Лу, Сюнь (2011). "Связывание причинности Грейнджера и причинной модели Перла с устанавливаемыми системами" (PDF) . Причинность во временных рядах Проблемы машинного обучения . 5 .
^ Морган, С. Л.; Уиншип, К. (2007). Контрфактуальные утверждения и причинно-следственные выводы: Методы и принципы социальных исследований . Нью-Йорк: Cambridge University Press. doi : 10.1017/cbo9781107587991. ISBN978-1-107-06507-9.
^ Хайндорф, Стефан; Шолтен, Ян; Ваксмут, Хеннинг; Нгонга Нгомо, Аксель-Сирилл; Поттхаст, Мартин (2020). «CauseNet: на пути к графику причинности, извлеченному из Интернета». Труды 29-й Международной конференции ACM по управлению информацией и знаниями . CIKM. ACM.
^ Гейгер, Дэн; Перл, Джудеа (1993). «Логические и алгоритмические свойства условной независимости». Annals of Statistics . 21 (4): 2001–2021. CiteSeerX 10.1.1.295.2043 . doi :10.1214/aos/1176349407.
^ Чен, Б.; Перл, Дж. (2014). "Графические инструменты для моделирования линейных структурных уравнений" (PDF) . Технический отчет .