Алгоритм Витерби

Алгоритм Витерби — это алгоритм динамического программирования для получения максимальной апостериорной оценки вероятности наиболее вероятной последовательности скрытых состояний, называемой путем Витерби , которая приводит к последовательности наблюдаемых событий. Это делается особенно в контексте источников марковской информации и скрытых марковских моделей (HMM).

Алгоритм нашел универсальное применение при декодировании сверточных кодов , используемых в цифровой сотовой связи CDMA и GSM , модемах коммутируемого доступа , спутниковой связи, связи в дальнем космосе и беспроводных локальных сетях 802.11 . В настоящее время он также широко используется в распознавании речи , синтезе речи , дневникизации , ^[1] обнаружении ключевых слов , компьютерной лингвистике и биоинформатике . Например, при преобразовании речи в текст (распознавании речи) акустический сигнал рассматривается как наблюдаемая последовательность событий, а строка текста считается «скрытой причиной» акустического сигнала. Алгоритм Витерби находит наиболее вероятную текстовую строку по акустическому сигналу.

История

Алгоритм Витерби назван в честь Эндрю Витерби , который предложил его в 1967 году в качестве алгоритма декодирования сверточных кодов по зашумленным цифровым каналам связи. ^[2] Тем не менее, он имеет историю многочисленных изобретений , по крайней мере, семи независимых открытий, в том числе Витерби, Нидлмана и Вунша , а также Вагнера и Фишера . ^[3] Он был представлен в обработке естественного языка как метод маркировки частей речи еще в 1987 году.

Путь Витерби и алгоритм Витерби стали стандартными терминами для применения алгоритмов динамического программирования к задачам максимизации, связанным с вероятностями. ^[3] Например, при статистическом анализе алгоритм динамического программирования может использоваться для обнаружения единственного наиболее вероятного контекстно-свободного вывода (анализа) строки, который обычно называют «анализом Витерби». ^[4]^[5]^[6] Другое применение — отслеживание целей , где вычисляется путь, который присваивает максимальную вероятность последовательности наблюдений. ^[7]

Расширения

Обобщение алгоритма Витерби, называемое алгоритмом максимальной суммы (или алгоритмом максимального произведения ), может использоваться для поиска наиболее вероятного назначения всех или некоторого подмножества скрытых переменных в большом количестве графических моделей , например, байесовских сетей , марковских сетей . случайные поля и условно случайные поля . Скрытые переменные, как правило, должны быть связаны способом, похожим на скрытую модель Маркова (СММ), с ограниченным количеством связей между переменными и некоторым типом линейной структуры среди переменных. Общий алгоритм включает передачу сообщений и по существу аналогичен алгоритму распространения доверия (который является обобщением алгоритма вперед-назад ).

С помощью алгоритма, называемого итеративным декодированием Витерби, можно найти подпоследовательность наблюдения, которая лучше всего (в среднем) соответствует заданной скрытой марковской модели. Этот алгоритм предложен Ци Ваном и др. разобраться с турбокодом . ^[8] Итеративное декодирование Витерби работает путем итеративного вызова модифицированного алгоритма Витерби, переоценивая оценку заполнителя до достижения сходимости.

Был предложен альтернативный алгоритм — алгоритм Ленивого Витерби. ^[9] Для многих приложений, представляющих практический интерес, при разумных условиях шума ленивый декодер (с использованием ленивого алгоритма Витерби) работает намного быстрее, чем исходный декодер Витерби (с использованием алгоритма Витерби). В то время как исходный алгоритм Витерби вычисляет каждый узел в решетке возможных результатов, алгоритм Ленивого Витерби поддерживает приоритетный список узлов для оценки по порядку, а количество необходимых вычислений обычно меньше (и никогда больше), чем обычный алгоритм Витерби для тот же результат. Однако распараллелить аппаратно не так-то просто ^{[ нужны пояснения ] .}

Псевдокод

Этот алгоритм генерирует путь , который представляет собой последовательность состояний , которые генерируют наблюдения с где – количество возможных наблюдений в пространстве наблюдения . $X=(x_{1},x_{2},\ldots ,x_{T})$ $x_{n}\in S=\{s_{1},s_{2},\dots ,s_{K}\}$ $Y=(y_{1},y_{2},\ldots ,y_{T})$ $y_{n}\in O=\{o_{1},o_{2},\dots ,o_{N}\}$ $N$ $O$

Строятся две двумерные таблицы размеров : $K\times T$

Каждый элемент хранит вероятность наиболее вероятного пути, который генерируется на данный момент . $T_{1}[i,j]$ $T_{1}$ ${\hat {X}}=({\hat {x}}_{1},{\hat {x}}_{2},\ldots ,{\hat {x}}_{j})$ ${\hat {x}}_{j}=s_{i}$ $Y=(y_{1},y_{2},\ldots ,y_{j})$
Каждый элемент магазинов наиболее вероятного пути на данный момент $T_{2}[i,j]$ $T_{2}$ ${\hat {x}}_{j-1}$ ${\hat {X}}=({\hat {x}}_{1},{\hat {x}}_{2},\ldots ,{\hat {x}}_{j-1},{\hat {x}}_{j}=s_{i})$ $\forall j,2\leq j\leq T$

Записи таблицы заполняются в порядке возрастания : $T_{1}[i,j],T_{2}[i,j]$ $K\cdot j+i$

T_{1}[i,j]=\max _{k}{(T_{1}[k,j-1]\cdot A_{ki}\cdot B_{iy_{j}})}

T_{2}[i,j]=\operatorname {argmax} _{k}{(T_{1}[k,j-1]\cdot A_{ki}\cdot B_{iy_{j}})}

с и как определено ниже. Обратите внимание, что это значение не обязательно должно присутствовать в последнем выражении, поскольку оно неотрицательно, независимо от и, следовательно, не влияет на argmax. $A_{ki}$ $B_{iy_{j}}$ $B_{iy_{j}}$ $k$

Вход

Наблюдательное пространство , $O=\{o_{1},o_{2},\dots ,o_{N}\}$
государственное пространство , $S=\{s_{1},s_{2},\dots ,s_{K}\}$
массив начальных вероятностей , в котором хранится вероятность того, что , $\Pi =(\pi _{1},\pi _{2},\dots ,\pi _{K})$ $\pi _{i}$ $x_{1}=s_{i}$
последовательность наблюдений такая, что если наблюдение в момент времени , $Y=(y_{1},y_{2},\ldots ,y_{T})$ $y_{t}=o_{i}$ $t$ $o_{i}$
матрица перехода такого размера , которая хранит вероятность перехода из состояния в состояние , $A$ $K\times K$ $A_{ij}$ $s_{i}$ $s_{j}$
матрица выбросов такого размера , которая хранит вероятность наблюдения из состояния . $B$ $K\times N$ $B_{ij}$ $o_{j}$ $s_{i}$

Выход

Наиболее вероятная последовательность скрытых состояний $X=(x_{1},x_{2},\ldots ,x_{T})$

функция  VITERBI для каждого состояния do end для каждого наблюдения do для каждого состояния do end for end for for do end for return end function $(O,S,\Pi ,Y,A,B):X$   $i=1,2,\ldots ,K$    $T_{1}[i,1]\leftarrow \pi _{i}\cdot B_{iy_{1}}$   $T_{2}[i,1]\leftarrow 0$    $j=2,3,\ldots ,T$    $i=1,2,\ldots ,K$    $T_{1}[i,j]\gets \max _{k}{(T_{1}[k,j-1]\cdot A_{ki}\cdot B_{iy_{j}})}$   $T_{2}[i,j]\gets \arg \max _{k}{(T_{1}[k,j-1]\cdot A_{ki}\cdot B_{iy_{j}})}$     $z_{T}\gets \arg \max _{k}{(T_{1}[k,T])}$   $x_{T}\leftarrow s_{z_{T}}$    $j=T,T-1,\ldots ,2$    $z_{j-1}\leftarrow T_{2}[z_{j},j]$   $x_{j-1}\leftarrow s_{z_{j-1}}$     $X$

Переформулировано в краткой форме, близкой к Python :

функция  viterbi Tm: матрица переходов Em: матрица выбросов Хранить вероятность каждого состояния с учетом каждого наблюдения Удерживать обратный указатель на лучшее предшествующее состояние для s in : Определить вероятность каждого скрытого состояния в момент времени 0… для o in : … и после, отслеживая каждое состояние наиболее вероятное предыдущее состояние, k для s in : Найти k наилучшего конечного состояния для o in : Возврат от последнего наблюдения Вставить предыдущее состояние на наиболее вероятный путь. Использовать обратный указатель для поиска наилучшего возврата предыдущего состояния. $(O,S,\Pi ,Tm,Em):best\_path$  $trellis\leftarrow matrix(length(S),length(O))$  $pointers\leftarrow matrix(length(S),length(O))$   $range(length(S))$  $trellis[s,0]\leftarrow \Pi [s]\cdot Em[s,O[0]]$    $range(1,length(O))$   $range(length(S))$  $k\leftarrow \arg \max(trellis[k,o-1]\cdot Tm[k,s]\cdot Em[s,o]\ {\mathsf {for}}\ k\ {\mathsf {in}}\ range(length(S)))$   $trellis[s,o]\leftarrow trellis[k,o-1]\cdot Tm[k,s]\cdot Em[s,o]$   $pointers[s,o]\leftarrow k$   $best\_path\leftarrow list()$   $k\leftarrow \arg \max(trellis[k,length(O)-1]\ {\mathsf {for}}\ k\ {\mathsf {in}}\ range(length(S)))$   $range(length(O)-1,-1,-1)$  $best\_path.insert(0,S[k])$  $k\leftarrow pointers[k,o]$   $best\_path$

Объяснение

Предположим, нам дана скрытая марковская модель (СММ) с пространством состояний , начальными вероятностями нахождения в скрытом состоянии и переходными вероятностями перехода из состояния в состояние . Допустим, мы наблюдаем результаты . Наиболее вероятная последовательность состояний , которая производит наблюдения, задается рекуррентными соотношениями ^[10] $S$ $\pi _{i}$ $i$ $a_{i,j}$ $i$ $j$ $y_{1},\dots ,y_{T}$ $x_{1},\dots ,x_{T}$

{\begin{aligned}V_{1,k}&=\mathrm {P} {\big (}y_{1}\ |\pi _{k}{\big )}\cdot \pi _{k},\\V_{t,k}&=\max _{x\in S}\left(\mathrm {P} {\big (}y_{t}\ |\pi _{k}{\big )}\cdot a_{x,k}\cdot V_{t-1,x}\right).\end{aligned}}

Вот вероятность наиболее вероятной последовательности состояний, ответственной за первые наблюдения, которые имеют свое конечное состояние. Путь Витерби можно получить, сохранив обратные указатели, которые запоминают, какое состояние использовалось во втором уравнении. Позвольте быть функцией, которая возвращает значение, используемое для вычисления if или if . Затем $V_{t,k}$ $\mathrm {P} {\big (}x_{1},\dots ,x_{t},y_{1},\dots ,y_{t}{\big )}$ $t$ $k$ $x$ $\mathrm {Ptr} (k,t)$ $x$ $V_{t,k}$ $t>1$ $k$ $t=1$

{\begin{aligned}x_{T}&=\arg \max _{x\in S}(V_{T,x}),\\x_{t-1}&=\mathrm {Ptr} (x_{t},t).\end{aligned}}

Здесь мы используем стандартное определение arg max .

Сложность этой реализации . Лучшая оценка существует, если вместо этого максимум во внутреннем цикле находится путем итерации только по состояниям, которые напрямую связаны с текущим состоянием (т. е. существует край от до ). Затем, используя амортизированный анализ, можно показать, что сложность равна , где – количество ребер в графе. $O(T\times \left|{S}\right|^{2})$ $k$ $j$ $O(T\times (\left|{S}\right|+\left|{E}\right|))$ $E$

Пример

Рассмотрим деревню, в которой все жители либо здоровы, либо имеют жар, и только деревенский врач может определить, есть ли у каждого из них жар. Врач диагностирует лихорадку, спрашивая пациентов, как они себя чувствуют. Жители деревни могут только ответить, что чувствуют себя нормально, кружится голова или холодно.

Врач считает, что состояние здоровья пациентов действует как дискретная цепь Маркова . Есть два состояния: «Здоровье» и «Лихорадка», но врач не может наблюдать их непосредственно; они скрыты от врача. Каждый день существует определенная вероятность того, что пациент скажет врачу: «Я чувствую себя нормально», «Мне холодно» или «У меня кружится голова», в зависимости от состояния здоровья пациента.

Наблюдения (норма, простуда, головокружение) вместе со скрытым состоянием (здоров, лихорадка) образуют скрытую марковскую модель (СММ) и могут быть представлены на языке программирования Python следующим образом :

obs  =  ( «нормальный» ,  «простуда» ,  «головокружение» ) States  =  ( «Здоровый» ,  «Лихорадка» ) start_p  =  { «Здоровый» :  0,6 ,  «Лихорадка» :  0,4 } trans_p  =  {  «Здоровый» :  { " Здоровый" :  0,7 ,  "Лихорадка" :  0,3 },  "Лихорадка" :  { "Здоровый" :  0,4 ,  "Лихорадка" :  0,6 }, } emit_p  =  {  "Здоровый" :  { "нормальный" :  0,5 ,  "простуда" :  0,4 ,  «головокружение» :  0,1 },  «лихорадка» :  { «нормальный» :  0,1 ,  «простуда» :  0,3 ,  «головокружение» :  0,6 }, }

В этом фрагменте кода start_pпредставляет мнение врача о том, в каком состоянии находится HMM при первом посещении пациента (все, что знает врач, это то, что пациент, как правило, здоров). Используемое здесь конкретное распределение вероятностей не является равновесным, которое (с учетом вероятностей перехода) составляет примерно {'Healthy': 0.57, 'Fever': 0.43}. Это trans_pпредставляет собой изменение состояния здоровья в основной цепи Маркова. В этом примере у пациента, который сегодня здоров, есть только 30% вероятность того, что завтра у него поднимется температура. Показывает emit_p, насколько вероятно каждое возможное наблюдение (нормальное, холодное или головокружение) с учетом основного состояния (здорового или лихорадочного). Здоровый пациент имеет 50%-ную вероятность чувствовать себя нормально; у того, у кого жар, вероятность головокружения составляет 60%.

Пациент приходит на прием три дня подряд, и врач обнаруживает, что в первый день пациент чувствует себя нормально, на второй день холодно, на третий день кружится голова. У врача возникает вопрос: какова наиболее вероятная последовательность состояний здоровья пациента, которая могла бы объяснить эти наблюдения? На этот вопрос отвечает алгоритм Витерби.

Def  Viterbi ( obs ,  States ,  start_p ,  trans_p ,  emite_p ): В  =  [{}] для  ул.  в  штатах : V [ 0 ]  [ st ]  =  { "prob" :  start_p [ st ]  *  emit_p [ st ]  [ obs [ 0 ]],  "prev" :  None } # Запускаем Витерби, когда t > 0 для  t  в  диапазоне ( 1 ,  len ( obs )): В. _ добавить ({}) для  ул.  в  штатах : max_tr_prob  =  V [ t  -  1 ]  [ states [ 0 ]]  [ "prob" ]  *  trans_p [ states [ 0 ]]  [ st ]  *  emit_p [ st ]  [ obs [ t ]] prev_st_selected  =  состояния [ 0 ] для  prev_st  в  состояниях [ 1 :]: tr_prob  =  V [ t  -  1 ]  [ prev_st ]  [ "prob" ]  *  trans_p [ prev_st ]  [ st ]  *  emit_p [ st ]  [ obs [ t ]] если  tr_prob  >  max_tr_prob : max_tr_prob  =  tr_prob prev_st_selected  =  prev_st max_prob  =  max_tr_prob V [ t ]  [ st ]  =  { "prob" :  max_prob ,  "prev" :  prev_st_selected } для  строки  в  dptable ( V ): печать ( строка ) выбор  =  [] макс_проб  =  0,0 best_st  =  Нет # Получить наиболее вероятное состояние и его возврат для  st данные  в V [ -1 ] . _  _ предметы ():  если  данные [ "prob" ]  >  max_prob : max_prob  =  данные [ "проб" ] best_st  =  ул опт . добавить ( best_st ) предыдущий  =  best_st # Следуем обратному пути до первого наблюдения для  t  в  диапазоне ( len ( V )  -  2 ,  - 1 ,  - 1 ): опт . вставить ( 0 ,  V [ t  +  1 ]  [ предыдущая ]  [ "предыдущая" ]) предыдущий  =  V [ t  +  1 ]  [ предыдущий ]  [ "предыдущий" ] print  ( "Шаги состояний: "  +  " " . join ( opt )  +  " с наибольшей вероятностью %s "  %  max_prob )защита  dptable ( V ): # Распечатываем таблицу шагов из словаря выход  " "  *  5  +  " " . join (( " %3d "  %  i )  для  i  в  диапазоне ( len ( V ))) для  состояния  в  V [ 0 ]: доходность  " %.7s : "  %  состояние  +  " " . join ( " %.7s "  %  ( " %lf "  %  v [ state ]  [ "prob" ])  for  v  в  V )

Функция viterbiпринимает следующие аргументы: obs— последовательность наблюдений, например ['normal', 'cold', 'dizzy']; states– набор скрытых состояний; start_p– вероятность старта; trans_p– вероятности перехода; и emit_p– вероятности выбросов. Для простоты кода мы предполагаем, что последовательность наблюдений obsнепуста и что trans_p[i] [j]и emit_p[i] [j]определена для всех состояний i,j.

В текущем примере алгоритм Форвард/Витерби используется следующим образом:

viterbi ( obs ,  states ,  start_p ,  trans_p ,  emit_p )

Результат работы скрипта

$ python  viterbi_example.py  0 1 2 Здоровый: 0,30000 0,08400 0,00588 Лихорадка: 0,04000 0,02700 0,01512 Шаги состояний: Здоровый Здоровый Лихорадка с наибольшей вероятностью 0,01512

Это показывает, что наблюдения, ['normal', 'cold', 'dizzy']скорее всего, были инициированы государствами ['Healthy', 'Healthy', 'Fever']. Другими словами, учитывая наблюдаемую активность, пациент, скорее всего, был здоров в первый день, а также на второй день (несмотря на то, что в этот день он чувствовал холод), и только на третий день у него поднялась температура.

Работу алгоритма Витерби можно визуализировать с помощью решетчатой диаграммы . Путь Витерби, по сути, является кратчайшим путем через эту решетку.

Алгоритм Витерби с мягким выводом

Алгоритм Витерби с мягким выходом ( SOVA ) — это вариант классического алгоритма Витерби.

SOVA отличается от классического алгоритма Витерби тем, что он использует модифицированную метрику пути, которая учитывает априорные вероятности входных символов и выдает мягкий вывод, указывающий на надежность решения.

Первым шагом в SOVA является выбор оставшегося пути, проходящего через один уникальный узел в каждый момент времени t . Поскольку каждый узел имеет 2 сходящиеся в нем ветви (при этом одна ветвь выбирается для формирования Пути Оставшегося в живых , а другая отбрасывается), разница в метриках ветвей (или стоимости ) между выбранной и отброшенной ветвями указывает на величину ошибки в выбор.

Эта стоимость накапливается по всему скользящему окну (обычно равна не менее пяти длинам ограничений), чтобы указать мягкую выходную меру надежности жесткого битового решения алгоритма Витерби.

Смотрите также

Общие ссылки

Витерби А.Дж. (апрель 1967 г.). «Границы ошибок для сверточных кодов и асимптотически оптимальный алгоритм декодирования». Транзакции IEEE по теории информации . 13 (2): 260–269. дои : 10.1109/TIT.1967.1054010.(примечание: алгоритм декодирования Витерби описан в разделе IV.) Требуется подписка.
Фельдман Дж., Абу-Файкаль И., Фриго М. (2002). «Быстрый декодер максимального правдоподобия для сверточных кодов». Материалы 56-й конференции IEEE по автомобильным технологиям . Том. 1. С. 371–375. CiteSeerX 10.1.1.114.1314 . doi :10.1109/VETECF.2002.1040367. ISBN 978-0-7803-7467-6. S2CID 9783963.
Форни Г.Д. (март 1973 г.). «Алгоритм Витерби». Труды IEEE . 61 (3): 268–278. дои : 10.1109/PROC.1973.9030.Требуется подписка.
Пресс, WH; Теукольский, С.А.; Феттерлинг, WT; Фланнери, BP (2007). «Раздел 16.2. Декодирование Витерби». Численные рецепты: искусство научных вычислений (3-е изд.). Нью-Йорк: Издательство Кембриджского университета. ISBN 978-0-521-88068-8.
Рабинер Л.Р. (февраль 1989 г.). «Учебное пособие по скрытым моделям Маркова и избранным приложениям для распознавания речи». Труды IEEE . 77 (2): 257–286. CiteSeerX 10.1.1.381.3454 . дои : 10.1109/5.18626. S2CID 13618539.(Описывает прямой алгоритм и алгоритм Витерби для HMM).
Шингхал Р. и Годфрид Т. Туссен , «Эксперименты по распознаванию текста с помощью модифицированного алгоритма Витерби», Транзакции IEEE по анализу шаблонов и машинному интеллекту , Vol. ПАМИ-1, апрель 1979 г., стр. 184–193.
Шингхал Р. и Годфрид Т. Туссен , «Чувствительность модифицированного алгоритма Витерби к исходной статистике», IEEE Transactions on Pattern Analysis and Machine Intelligence , vol. ПАМИ-2, март 1980 г., стр. 181–185.

Внешние ссылки

Реализации на Java, F#, Clojure, C# в Wikibooks
Учебник по сверточному кодированию с декодированием Витерби, Чип Флеминг
Учебное пособие по набору инструментов скрытой марковской модели (реализованному на C), содержащему описание алгоритма Витерби.
Алгоритм Витерби доктора Эндрю Дж. Витерби (scholarpedia.org).

Реализации

В Mathematica есть реализация как часть поддержки случайных процессов.
Платформа обработки сигналов Susa предоставляет здесь реализацию C++ для кодов прямого исправления ошибок и выравнивания каналов.
С++
С#
Джава
Ява 8
Юлия (HMMBase.jl)
Перл
Пролог
Хаскелл
Идти
SFIHMM включает код для декодирования Витерби.