stringtranslate.com

Таблица условной вероятности

В статистике таблица условной вероятности (CPT) определяется для набора дискретных и взаимозависимых случайных величин для отображения условных вероятностей одной переменной по отношению к другим (т. е. вероятности каждого возможного значения одной переменной, если мы знаем значения, принимаемые другими переменными). Например, предположим, что есть три случайные переменные , каждая из которых имеет состояния. Затем таблица условной вероятности предоставляет значения условной вероятности (где вертикальная черта означает «при заданных значениях») для каждого из K возможных значений переменной и для каждой возможной комбинации значений. В этой таблице есть ячейки. В общем, для переменных с состояниями для каждой переменной CPT для любой из них имеет количество ячеек, равное произведению [1]

Таблицу условной вероятности можно представить в матричной форме. В качестве примера только с двумя переменными, значения которых k и j варьируются в пределах значений K , создают матрицу K × K. Эта матрица является стохастической матрицей , поскольку сумма столбцов равна 1; т.е. для всех j . Например, предположим, что две двоичные переменные x и y имеют совместное распределение вероятностей, указанное в этой таблице:

Каждая из четырех центральных ячеек показывает вероятность определенной комбинации значений x и y . Сумма первого столбца — это вероятность того, что x = 0 и y равно любому из возможных значений, то есть сумма столбца 6/9 — это предельная вероятность того, что x = 0. Если мы хотим найти вероятность того, что y = 0 при условии , что x = 0, мы вычисляем долю вероятностей в столбце x = 0, которые имеют значение y = 0, что составляет 4/9 ÷ 6/9 = 4/. 6. Аналогично, в том же столбце мы находим, что вероятность того, что y = 1 при условии, что x = 0, равна 2/9 ÷ 6/9 = 2/6. Таким же образом мы можем найти условные вероятности для y , равного 0 или 1, при условии, что x = 1. Объединение этих фрагментов информации дает нам следующую таблицу условных вероятностей для y :

При наличии более чем одной обусловливающей переменной в таблице все равно будет одна строка для каждого потенциального значения переменной, условные вероятности которой должны быть заданы, и будет один столбец для каждой возможной комбинации значений обусловливающих переменных.

Более того, количество столбцов в таблице можно было бы существенно расширить, чтобы отобразить вероятности интересующей переменной при условии конкретных значений только некоторых, а не всех других переменных.

Рекомендации

  1. ^ Мерфи, КП (2012). Машинное обучение: вероятностный взгляд . Массачусетский технологический институт Пресс.