stringtranslate.com

Алгоритм «изнутри-снаружи»

Для алгоритмов синтаксического анализа в информатике алгоритм «изнутри-снаружи» является способом переоценки вероятностей производства в вероятностной контекстно-свободной грамматике . Он был введен Джеймсом К. Бейкером в 1979 году как обобщение алгоритма «вперед-назад» для оценки параметров скрытых марковских моделей на стохастические контекстно-свободные грамматики . Он используется для вычисления ожиданий, например, как часть алгоритма максимизации ожидания (алгоритма обучения без учителя).

Внутренние и внешние вероятности

Внутренняя вероятность — это полная вероятность генерации слов , учитывая корневой нетерминал и грамматику : [1]

Вероятность снаружи — это полная вероятность начала со стартового символа и генерации нетерминала и всех слов снаружи , учитывая грамматику : [1]

Вычисление внутренних вероятностей

Базовый вариант:

Общий случай:

Предположим, что в грамматике есть правило , тогда вероятность генерации поддерева, начинающегося с корня, равна:

Внутренняя вероятность — это просто сумма по всем таким возможным правилам:

Вычисление внешних вероятностей

Базовый вариант:

Здесь начальный символ — .

Общий случай:

Предположим, что в грамматике есть правило , которое генерирует . Тогда левый вклад этого правила во внешнюю вероятность равен:

Теперь предположим, что в грамматике есть правило . Тогда правильный вклад этого правила во внешнюю вероятность :

Внешняя вероятность представляет собой сумму левых и правых вкладов по всем таким правилам:

Ссылки

  1. ^ аб Мэннинг, Кристофер Д.; Хинрих Шютце (1999). Основы статистической обработки естественного языка . Кембридж, Массачусетс, США: MIT Press. стр. 388–402. ISBN 0-262-13360-1.

Внешние ссылки