stringtranslate.com

Элиминация переменной

Исключение переменных (VE) — это простой и общий точный алгоритм вывода в вероятностных графических моделях , таких как байесовские сети и марковские случайные поля . [1] Его можно использовать для вывода максимального апостериорного (MAP) состояния или оценки условных или предельных распределений по подмножеству переменных. Алгоритм имеет экспоненциальную временную сложность, но может быть эффективным на практике для графов с низкой шириной дерева , если используется правильный порядок исключения.

Факторы

Обеспечивая ключевое снижение алгоритмической сложности, фактор , также известный как потенциал, переменных, представляет собой отношение между каждым экземпляром переменных к неотрицательному числу, обычно обозначаемому как . [2] Фактор не обязательно имеет заданную интерпретацию. Можно выполнять операции над факторами различных представлений, такими как распределение вероятностей или условное распределение. [2] Совместные распределения часто становятся слишком большими для обработки, поскольку сложность этой операции экспоненциальна. Таким образом, исключение переменных становится более осуществимым при вычислении факторизованных сущностей.

Основные операции

Суммирование переменных

Алгоритм 1, называемый суммированием (SO) или маргинализацией, исключает одну переменную из набора факторов, [3] и возвращает результирующий набор факторов. Алгоритм collect-relevant просто возвращает эти факторы в включающей переменной .

Алгоритм 1 сумма-выход( , )

= собрать факторы, имеющие отношение к
= произведение всех факторов в


возвращаться

Пример

Здесь мы имеем совместное распределение вероятностей . Переменная может быть просуммирована между набором конкретизаций, где набор в минимуме должен согласовываться с остальными переменными. Значение не имеет значения, когда это переменная, которая должна быть просуммирована. [2]

После исключения его ссылка исключается, и у нас остается распределение только по оставшимся переменным и сумме каждого экземпляра.

Полученное распределение, которое следует за операцией суммирования, помогает отвечать только на запросы, в которых не упоминается . [2] Также стоит отметить, что операция суммирования является коммутативной.

Фактор умножения

Вычисление произведения между несколькими факторами приводит к фактору, совместимому с одной конкретизацией в каждом факторе. [2]

Алгоритм 2 многофакторный( , ) [2]

= Объединение всех переменных между произведениями факторов
= фактор, по которому для всех
Для каждого экземпляра
Для 1 к
инстанцирование переменных, соответствующих
возвращаться

Умножение множителей не только коммутативно, но и ассоциативно.

Вывод

Наиболее распространенный тип запроса имеет вид , где и являются непересекающимися подмножествами , и наблюдается принятие значения . Базовый алгоритм вычисления p(X|E = e) называется исключением переменной (VE), впервые предложенный в. [1]

Взятый из [1], этот алгоритм вычисляет из дискретной байесовской сети B. VE вызывает SO для исключения переменных по одной. Более конкретно, в алгоритме 2, — это набор C таблиц условной вероятности (далее «CPT») для B, — это список переменных запроса, — это список наблюдаемых переменных, — это соответствующий список наблюдаемых значений и — это порядок исключения для переменных , где обозначает .

Алгоритм исключения переменных VE( )

Умножить факторы на соответствующие CPT, пока σ не пусто
Удалить первую переменную из
= сумма-выход
= произведение всех факторов

возвращаться

Заказ

Поиск оптимального порядка, в котором следует исключать переменные, является NP-трудной задачей. Таким образом, существуют эвристики, которым можно следовать, чтобы лучше оптимизировать производительность по порядку:

  1. Минимальная степень : Исключить переменную, что приведет к построению наименьшего возможного фактора. [2]
  2. Минимальное заполнение: путем построения неориентированного графа, показывающего переменные связи, выраженные всеми CPT, исключите переменную, которая приведет к наименьшему количеству ребер, которые будут добавлены после исключения. [2]

Ссылки

  1. ^ abc Zhang, NL, Poole, D.: Простой подход к вычислениям байесовских сетей. В: 7-я Канадская конференция по искусственному интеллекту, стр. 171--178. Springer, Нью-Йорк (1994)
  2. ^ abcdefgh Дарвич, Аднан (2009-01-01). Моделирование и рассуждения с использованием байесовских сетей . doi :10.1017/cbo9780511811357. ISBN 9780511811357.
  3. ^ Коллер, Д., Фридман, Н.: Вероятностные графические модели: принципы и методы. MIT Press, Кембридж, Массачусетс (2009)