Метод оценки параметров для вероятностных контекстно-свободных грамматик
Для алгоритмов синтаксического анализа в информатике алгоритм «изнутри-снаружи» является способом переоценки вероятностей производства в вероятностной контекстно-свободной грамматике . Он был введен Джеймсом К. Бейкером в 1979 году как обобщение алгоритма «вперед-назад» для оценки параметров скрытых марковских моделей на стохастические контекстно-свободные грамматики . Он используется для вычисления ожиданий, например, как часть алгоритма максимизации ожидания (алгоритма обучения без учителя).
Внутренние и внешние вероятности
Внутренняя вероятность — это полная вероятность генерации слов , учитывая корневой нетерминал и грамматику : [1]
Вероятность снаружи — это полная вероятность начала со стартового символа и генерации нетерминала и всех слов снаружи , учитывая грамматику : [1]
Вычисление внутренних вероятностей
Базовый вариант:
Общий случай:
Предположим, что в грамматике есть правило , тогда вероятность генерации поддерева, начинающегося с корня, равна:
Внутренняя вероятность — это просто сумма по всем таким возможным правилам:
Вычисление внешних вероятностей
Базовый вариант:
Здесь начальный символ — .
Общий случай:
Предположим, что в грамматике есть правило , которое генерирует . Тогда левый вклад этого правила во внешнюю вероятность равен:
Теперь предположим, что в грамматике есть правило . Тогда правильный
вклад этого правила во внешнюю вероятность :
Внешняя вероятность представляет собой сумму левых и правых вкладов по всем таким правилам:
Ссылки
- ^ аб Мэннинг, Кристофер Д.; Хинрих Шютце (1999). Основы статистической обработки естественного языка . Кембридж, Массачусетс, США: MIT Press. стр. 388–402. ISBN 0-262-13360-1.
- J. Baker (1979): Обучаемые грамматики для распознавания речи. В JJ Wolf и DH Klatt, редакторы, Speech communication papers, представленные на 97-м заседании Акустического общества Америки , страницы 547–550, Кембридж, Массачусетс, июнь 1979. MIT.
- Карим Лари, Стив Дж. Янг (1990): Оценка стохастических контекстно-свободных грамматик с использованием алгоритма «внутри-снаружи». Компьютерная речь и язык , 4:35–56.
- Карим Лари, Стив Дж. Янг (1991): Применение стохастических контекстно-свободных грамматик с использованием алгоритма «изнутри-снаружи». Компьютерная речь и язык , 5:237–257.
- Фернандо Перейра, Ив Шабес (1992): Внутренне-внешняя переоценка на основе частично заключенных в скобки корпусов. Труды 30-го ежегодного заседания Ассоциации компьютерной лингвистики, Ассоциация компьютерной лингвистики , 128–135.
Внешние ссылки
- Алгоритм «изнутри-снаружи» — Фэй Ся
- Алгоритм «изнутри-снаружи» - Майкл Коллинз