Графоид — это набор утверждений вида « X нерелевантно для Y, учитывая, что мы знаем Z » , где X , Y и Z — наборы переменных. Понятия «нерелевантности» и «при условии, что мы знаем» могут получать различные интерпретации, включая вероятностные , реляционные и корреляционные, в зависимости от приложения. Эти интерпретации имеют общие свойства, которые могут быть зафиксированы путями в графах (отсюда и название «графоид»). Теория графоидов характеризует эти свойства в конечном наборе аксиом , которые являются общими для информационной нерелевантности и ее графических представлений.
Judea Pearl и Azaria Paz [1] ввели термин «графоиды» после того, как обнаружили, что набор аксиом, управляющих условной независимостью в теории вероятностей, является общим для неориентированных графов . Переменные представлены в виде узлов в графе таким образом, что наборы переменных X и Y являются независимыми, обусловленными Z в распределении, когда набор узлов Z отделяет X от Y в графе. Аксиомы для условной независимости в вероятности были выведены ранее A. Philip Dawid [2] и Wolfgang Spohn [3] Соответствие между зависимостью и графами было позже распространено на направленные ациклические графы (DAG) [4] [5] [6] и на другие модели зависимости. [1] [7]
Модель зависимости M — это подмножество триплетов ( X , Z , Y ), для которых предикат I ( X , Z , Y ): X независим от Y при заданном Z является истинным. Графоид определяется как модель зависимости, которая замкнута при следующих пяти аксиомах:
Полуграфоид — это модель зависимости, закрытая относительно 1–4. Эти пять аксиом вместе известны как аксиомы графоида. [8] Интуитивно, свойства слабого объединения и сокращения означают, что нерелевантная информация не должна изменять статус релевантности других предложений в системе; то, что было релевантным, остается релевантным, а то, что было нерелевантным, остается нерелевантным. [8]
Условная независимость, определяемая как
является полуграфоидом, который становится полным графоидом, когда P строго положительно. [1] [7]
Модель зависимости представляет собой корреляционный графоид, если в некоторой функции вероятности мы имеем:
где — частная корреляция между x и y при заданном наборе Z.
Другими словами, линейная ошибка оценки переменных в X с использованием измерений Z не будет уменьшена путем добавления измерений переменных в Y , что делает Y нерелевантным для оценки X. Модели корреляционной и вероятностной зависимости совпадают для нормальных распределений. [1] [7]
Модель зависимости является реляционным графоидом, если она удовлетворяет
Другими словами, диапазон значений, разрешенных для X, не ограничивается выбором Y , если Z фиксировано. Независимые утверждения, принадлежащие этой модели, аналогичны встроенным многозначным зависимостям (EMVD) в базах данных. [1] [7]
Если существует неориентированный граф G такой, что
то графоид называется граф-индуцированным. Другими словами, существует неориентированный граф G , такой что каждое утверждение независимости в M отражается как разделение вершин в G и наоборот. Необходимым и достаточным условием для того, чтобы модель зависимости была граф-индуцированным графоидом, является то, что она удовлетворяет следующим аксиомам: симметрия, разложение, пересечение, сильное объединение и транзитивность.
Сильный профсоюз заявляет, что
Транзитивность утверждает, что
Аксиомы симметрии, разложения, пересечения, сильного объединения и транзитивности составляют полную характеристику неориентированных графов. [9]
Графоид называется DAG-индуцированным, если существует направленный ациклический граф D такой, что где обозначает d - разделение в D. d -разделение ( d -обозначает «направленный») расширяет понятие разделения вершин с ненаправленных графов на направленные ациклические графы. Это позволяет считывать условные независимости из структуры байесовских сетей . Однако условные независимости в DAG не могут быть полностью охарактеризованы конечным набором аксиом. [10]
Графоиды, индуцированные графом и DAG, оба содержатся в вероятностных графоидах. [11] Это означает, что для каждого графа G существует распределение вероятностей P, такое, что каждая условная независимость в P представлена в G , и наоборот. То же самое верно для DAG. Однако существуют вероятностные распределения, которые не являются графоидами, и, более того, не существует конечной аксиоматизации для вероятностных условных зависимостей. [12]
Томас Верма показал, что каждый полуграфоид имеет рекурсивный способ построения DAG, в котором каждое d -разделение является допустимым. [13] Конструкция похожа на ту, что используется в сетях Байеса , и выглядит следующим образом:
DAG, созданный этой конструкцией, будет представлять все условные независимости, которые следуют из тех, которые используются в конструкции. Более того, каждое d -разделение, показанное в DAG, будет действительной условной независимостью в графоиде, используемом в конструкции.