Модель скрытых переменных — это статистическая модель , которая связывает набор наблюдаемых переменных (также называемых явными переменными или индикаторами ) [1] с набором скрытых переменных . Модели скрытых переменных применяются в широком спектре областей, таких как биология, компьютерные науки и социальные науки. [2] Обычные случаи использования моделей скрытых переменных включают приложения в психометрии (например, обобщение ответов на набор вопросов опроса с моделью факторного анализа , постулирующей меньшее количество психологических атрибутов, таких как черта экстраверсии , которые предположительно вызывают ответы на вопросы опроса), [3] и обработку естественного языка (например, тематическая модель, обобщающая корпус текстов с несколькими «темами»). [4]
Предполагается, что ответы на индикаторы или явные переменные являются результатом позиции индивидуума по скрытой переменной(ым) и что явные переменные не имеют ничего общего после учета скрытой переменной ( локальная независимость ).
Различные типы моделей скрытых переменных можно сгруппировать в зависимости от того, являются ли явные и скрытые переменные категориальными или непрерывными: [5]
Модель Раша представляет собой простейшую форму теории ответов на вопросы. Смешанные модели играют центральную роль в анализе латентного профиля.
В факторном анализе и анализе скрытых признаков [примечание 1] скрытые переменные рассматриваются как непрерывные нормально распределенные переменные, а в анализе латентного профиля и анализе латентного класса — как из мультиномиального распределения . [7] Явные переменные в факторном анализе и анализе латентного профиля являются непрерывными, и в большинстве случаев их условное распределение с учетом скрытых переменных предполагается нормальным. В анализе латентных признаков и анализе латентного класса явные переменные являются дискретными. Эти переменные могут быть дихотомическими, порядковыми или номинальными переменными. Их условные распределения предполагаются биномиальными или мультиномиальными.