Иерархическая скрытая марковская модель (HHMM) — это статистическая модель , полученная из скрытой марковской модели (HMM). В HHMM каждое состояние считается самодостаточной вероятностной моделью . Точнее, каждое состояние HHMM само по себе является HHMM.
HHMM и HMM полезны во многих областях, включая распознавание образов . [1] [2]
Иногда полезно использовать HMM в определенных структурах, чтобы облегчить обучение и обобщение. Например, даже если полностью связанная HMM всегда может быть использована, если доступно достаточно данных для обучения, часто бывает полезно ограничить модель, не допуская произвольных переходов состояний. Таким же образом может быть полезно встроить HMM в большую структуру; которая, теоретически, может не решить никаких других проблем, чем базовая HMM, но может решать некоторые проблемы более эффективно, когда дело доходит до объема требуемых данных для обучения.
В иерархической скрытой марковской модели (HHMM) каждое состояние считается самодостаточной вероятностной моделью. Точнее, каждое состояние HHMM само по себе является HHMM. Это подразумевает, что состояния HHMM испускают последовательности символов наблюдения, а не отдельные символы наблюдения, как в случае стандартных состояний HMM.
Когда состояние в HHMM активируется, оно активирует свою собственную вероятностную модель, т. е. оно активирует одно из состояний базового HHMM, которое в свою очередь может активировать его базовое HHMM и так далее. Процесс повторяется до тех пор, пока не активируется особое состояние, называемое производственным состоянием. Только производственные состояния испускают символы наблюдения в обычном смысле HMM. Когда производственное состояние испускает символ, управление возвращается в состояние, которое активировало производственное состояние. Состояния, которые напрямую не испускают символы наблюдения, называются внутренними состояниями. Активация состояния в HHMM при внутреннем состоянии называется вертикальным переходом . После завершения вертикального перехода происходит горизонтальный переход в состояние на том же уровне. Когда горизонтальный переход приводит к завершающему состоянию, управление возвращается в состояние в HHMM, расположенное выше в иерархии, которое произвело последний вертикальный переход.
Обратите внимание, что вертикальный переход может привести к большему количеству вертикальных переходов, прежде чем достичь последовательности состояний производства и, наконец, вернуться на верхний уровень. Таким образом, посещенные состояния производства порождают последовательность символов наблюдения, которая «производится» состоянием на верхнем уровне.
Методы оценки параметров HHMM и структуры модели более сложны, чем для параметров HMM, и заинтересованный читатель может обратиться к Fine et al. (1998).
HMM и HHMM принадлежат к одному и тому же классу классификаторов. То есть, они могут быть использованы для решения одного и того же набора проблем. Фактически, HHMM может быть преобразован в стандартный HMM. Однако HHMM использует свою структуру для более эффективного решения подмножества проблем.
Классические HHMM требуют предопределенной топологии, что означает, что количество и иерархическая структура подмоделей должны быть известны заранее. [1] Самко и др. (2010) использовали информацию о состояниях из пространства признаков (т. е. извне самой Марковской модели) для определения топологии для новой HHMM неконтролируемым способом. [2] Однако такие внешние данные, содержащие соответствующую информацию для построения HHMM, могут быть недоступны во всех контекстах, например, при обработке языка.