Обычно вероятностные графические модели используют представление на основе графов в качестве основы для кодирования распределения в многомерном пространстве и граф, который представляет собой компактное или факторизованное представление набора зависимостей, которые выполняются в конкретном распределении. Обычно используются две ветви графического представления распределений, а именно байесовские сети и марковские случайные поля . Оба семейства включают в себя свойства факторизации и независимости, но они различаются набором независимости, которую они могут кодировать, и факторизацией распределения, которую они вызывают. [1]
Неориентированная графическая модель
Неориентированный граф с четырьмя вершинами.
Показанный неориентированный граф может иметь одну из нескольких интерпретаций; общей чертой является то, что наличие ребра подразумевает некоторую зависимость между соответствующими случайными величинами. Из этого графика мы могли бы сделать вывод, что все они взаимно независимы, если они известны, или (что эквивалентно в данном случае), что
для некоторых неотрицательных функций .
Байесовская сеть
Пример ориентированного ациклического графа с четырьмя вершинами.
Если сетевая структура модели представляет собой ориентированный ациклический граф , модель представляет собой факторизацию совместной вероятности всех случайных величин. Точнее, если события происходят, то совместная вероятность удовлетворяет условию
где – множество родителей узла (узлов с ребрами, направленными в сторону ). Другими словами, совместное распределение факторов превращается в продукт условных распределений. Например, в ориентированном ациклическом графе, показанном на рисунке, эта факторизация будет иметь вид
.
Любые два узла условно независимы, учитывая значения их родителей. В общем, любые два набора узлов условно независимы с учетом третьего набора, если в графе выполняется критерий, называемый d -разделением . Локальная независимость и глобальная независимость эквивалентны в байесовских сетях.
Пример направленной циклической графической модели. Каждая стрелка указывает на зависимость. В этом примере: D зависит от A, B и C; и C зависит от B и D; тогда как A и B независимы.
На следующем рисунке изображена графическая модель с циклом. Это можно интерпретировать в терминах того, что каждая переменная каким-то образом «зависит» от значений ее родителей. Конкретный показанный график предполагает совместную плотность вероятности, которая учитывается как
Целевое байесовское сетевое обучение (TBNL)Модель TBNL для «набора данных загона»
Факторный граф — это неориентированный двудольный граф , соединяющий переменные и факторы. Каждый фактор представляет собой функцию над переменными, с которыми он связан. Это полезное представление для понимания и реализации распространения убеждений .
Цепной граф — это граф, который может иметь как направленные, так и ненаправленные ребра, но без каких-либо направленных циклов (т.е. если мы начинаем с любой вершины и двигаемся по графу, соблюдая направления любых стрелок, мы не можем вернуться к вершине, с которой начали, если мы прошли стрелку). Как ориентированные ациклические графы, так и неориентированные графы являются частными случаями цепных графов, которые, следовательно, могут обеспечить способ объединения и обобщения байесовских и марковских сетей. [3]
Родовой граф — это дальнейшее расширение, имеющее направленные, двунаправленные и неориентированные ребра. [4]
Марковское случайное поле , также известное как марковская сеть, представляет собой модель неориентированного графа . Графическая модель со многими повторяющимися субъединицами может быть представлена табличными обозначениями .
^ Аб Коллер, Д .; Фридман, Н. (2009). Вероятностные графические модели. Массачусетс: MIT Press. п. 1208. ИСБН 978-0-262-01319-2. Архивировано из оригинала 27 апреля 2014 г.
^ Ричардсон, Томас (1996). «Алгоритм открытия ориентированных циклических графов». Материалы двенадцатой конференции по неопределенности в искусственном интеллекте . ISBN978-1-55860-412-4.
^ Ричардсон, Томас; Спиртес, Питер (2002). «Марковские модели наследственного графа». Анналы статистики . 30 (4): 962–1030. CiteSeerX 10.1.1.33.4906 . дои : 10.1214/aos/1031689015. МР 1926166. Збл 1033.60008.
дальнейшее чтение
Книги и главы книг
Барбер, Дэвид (2012). Байесовское рассуждение и машинное обучение . Издательство Кембриджского университета. ISBN 978-0-521-51814-7.
Бишоп, Кристофер М. (2006). «Глава 8. Графические модели» (PDF) . Распознавание образов и машинное обучение. Спрингер. стр. 359–422. ISBN 978-0-387-31073-2. МР 2247587.
Коуэлл, Роберт Г.; Дэвид, А. Филип ; Лауритцен, Штеффен Л.; Шпигельхальтер, Дэвид Дж. (1999). Вероятностные сети и экспертные системы . Берлин: Шпрингер. ISBN 978-0-387-98767-5. МР 1697175.Более продвинутая и статистически ориентированная книга.
Дженсен, Финн (1996). Введение в байесовские сети . Берлин: Шпрингер. ISBN 978-0-387-91502-9.
Перл, Иудея (1988). Вероятностное рассуждение в интеллектуальных системах (2-е исправленное изд.). Сан-Матео, Калифорния: Морган Кауфманн . ISBN 978-1-55860-479-7. МР 0965765.Подход вычислительного рассуждения, при котором формально вводятся взаимосвязи между графиками и вероятностями.
Журнальная статья
Эдоардо М. Айрольди (2007). «Начало работы с вероятностными графическими моделями». PLOS Вычислительная биология . 3 (12): е252. arXiv : 0706.2040 . Бибкод : 2007PLSCB...3..252A. дои : 10.1371/journal.pcbi.0030252 . ПМК 2134967 . ПМИД 18069887.
Джордан, Мичиган (2004). «Графические модели». Статистическая наука . 19 : 140–155. дои : 10.1214/088342304000000026 .
Гахрамани, Зубин (май 2015 г.). «Вероятностное машинное обучение и искусственный интеллект». Природа . 521 (7553): 452–459. Бибкод : 2015Natur.521..452G. дои : 10.1038/nature14541 . PMID 26017444. S2CID 216356.
Другой
Учебное пособие по обучению байесовской сети Хекермана
Краткое введение в графические модели и байесовские сети
Слайды лекции Саргура Шрихари о вероятностных графических моделях
Внешние ссылки
Графические модели и условные случайные поля
Вероятностные графические модели, преподаемые Эриком Сином в CMU