Непрерывная во времени цепь Маркова ( CTMC ) — это непрерывный стохастический процесс , в котором для каждого состояния процесс будет менять состояние в соответствии с экспоненциальной случайной величиной , а затем переходить в другое состояние, как указано вероятностями стохастической матрицы . Эквивалентная формулировка описывает процесс как изменяющееся состояние в соответствии с наименьшим значением набора экспоненциальных случайных величин, по одной для каждого возможного состояния, в которое он может перейти, с параметрами, определяемыми текущим состоянием.
Пример CTMC с тремя состояниями выглядит следующим образом: процесс совершает переход после промежутка времени, указанного временем удержания — экспоненциальной случайной величиной , где i — ее текущее состояние. Каждая случайная величина независима и такова, что , и . Когда необходимо совершить переход, процесс движется в соответствии с цепочкой скачков , дискретной по времени цепью Маркова со стохастической матрицей:
Эквивалентно, по свойству конкурирующих экспонент , этот CTMC изменяет состояние из состояния i в соответствии с минимумом двух случайных величин, которые являются независимыми и такими, что для где параметры заданы Q-матрицей
Каждый недиагональный элемент можно вычислить как вероятность того, что цепочка переходов перейдет из состояния i в состояние j , деленную на ожидаемое время удержания состояния i . Диагональные элементы выбираются так, чтобы сумма каждой строки равнялась 0.
CTMC удовлетворяет марковскому свойству , то есть его поведение зависит только от его текущего состояния, а не от его прошлого поведения из-за отсутствия памяти у экспоненциального распределения и дискретных по времени цепей Маркова.
Определение
Пусть будет вероятностным пространством, пусть будет счетным непустым множеством, и пусть ( для «времени»). Оснастим дискретной метрикой , так что мы можем понять правое непрерывность функций . Марковская цепь непрерывного времени определяется как: [1]
Вектор вероятности ( который ниже мы будем интерпретировать как начальное распределение цепи Маркова), и
для всех (Даже если бесконечно, эта сумма априори хорошо определена (возможно, равна ), поскольку каждый член, появляющийся в сумме, неотрицателен. Апостериори мы знаем, что сумма также должна быть конечной (не равной ), поскольку мы предполагаем, что она равна и мы предположили, что имеет действительное значение. Некоторые авторы вместо этого используют определение, которое слово в слово совпадает, за исключением измененного условия , и говорят, что является стабильным или полностью стабильным, чтобы означать , т. е. каждая запись имеет действительное значение.) [2] [3] [4]
Обратите внимание, что суммы строк равны 0: или, короче говоря, . Эта ситуация контрастирует с ситуацией для дискретных по времени цепей Маркова , где все суммы строк матрицы перехода равны единице.
Теперь пусть такой, что -измерим . Существует три эквивалентных способа определить бытие Марковым с начальным распределением и матрицей скоростей : через вероятности перехода или через цепочку скачков и времена удержания. [5]
В качестве прелюдии к определению вероятности перехода мы сначала мотивируем определение регулярной матрицы скорости . Мы будем использовать матрицу скорости перехода для указания динамики цепи Маркова посредством генерации набора матриц перехода на ( ), с помощью следующей теоремы.
Мы говорим, что является регулярным , имея в виду, что у нас есть уникальность для указанной выше системы, т. е. что существует ровно одно решение. [7] [8] Мы говорим , что является нерегулярным , имея в виду, что не является регулярным. Если является конечным, то существует ровно одно решение, а именно и, следовательно, является регулярным. В противном случае является бесконечным, и существуют нерегулярные матрицы переходных скоростей на . [a] Если является регулярным, то для единственного решения , для каждого , будет стохастической матрицей . [6] Мы будем предполагать, что является регулярным с начала следующего подраздела и до конца этого раздела, хотя принято [10] [11] [12] не включать это предположение. (Примечание для эксперта: таким образом, мы не определяем непрерывные по времени цепи Маркова в целом, а только невзрывные непрерывные по времени цепи Маркова.)
Определение вероятности перехода
Пусть будет (единственным) решением системы ( 0 ). (Единственность гарантируется нашим предположением, что является регулярной.) Мы говорим, что является марковским с начальным распределением и матрицей скоростей , что означает: для любого неотрицательного целого числа , для всех таких, что для всех
Используя индукцию и тот факт, что мы можем показать эквивалентность приведенного выше утверждения, содержащего ( 1 ), и следующего утверждения: для всех и для любого неотрицательного целого числа , для всех таких, что для всех таких, что (отсюда следует, что ),
Из непрерывности функций ( ) следует, что траектория почти наверняка непрерывна справа (относительно дискретной метрики на ): существует -нулевое множество такое, что . [13]
Определение прыжковой цепи/времени удержания
Последовательности, связанные с непрерывной справа функцией
Пусть будет непрерывным справа (при оснащении дискретной метрикой ). Определим
позволять
быть последовательностью времени удержания, связанной с , выберите и позвольте
быть « последовательностью состояний », связанной с .
Определение матрицы скачков Π
Матрица скачков , альтернативно записанная, если мы хотим подчеркнуть зависимость от , представляет собой матрицу
, где — нулевое множество функции [14]
Свойство цепочки переходов/времени удержания
Мы говорим, что является цепью Маркова с начальным распределением и матрицей скоростей , что означает: траектории почти наверняка непрерывны справа, пусть будет модификацией для того, чтобы иметь (везде) непрерывные справа траектории, почти наверняка (примечание для экспертов: это условие говорит о невзрывном характере), последовательность состояний является дискретной по времени цепью Маркова с начальным распределением (свойство цепи скачков) и матрицей переходов и (свойство времени удержания).
Определение бесконечно малых величин
Мы говорим , что Марков с начальным распределением и матрицей скоростей означает: для всех и для всех , для всех и для малых строго положительных значений , следующее справедливо для всех таких, что :
,
где термин есть если и в противном случае , а термин с маленькой буквой «о» зависит определенным образом от . [15] [16]
Приведенное выше уравнение показывает, что можно рассматривать как меру того, насколько быстро происходит переход от к для , и насколько быстро происходит переход от к для .
Характеристики
Общение классов
Взаимодействующие классы, транзитивность, повторяемость, а также положительная и нулевая повторяемость определяются так же, как и для дискретных по времени цепей Маркова .
где штрих обозначает дифференциацию по t . Решение этого уравнения задается матричной экспонентой
.
В простом случае, таком как CTMC на пространстве состояний {1,2}. Общая матрица Q для такого процесса — это следующая матрица 2 × 2 с α , β > 0
Вышеуказанное соотношение для прямой матрицы в этом случае можно решить явно, получив
.
Вычисление прямых решений усложняется в больших матрицах. Тот факт, что Q является генератором для полугруппы матриц
используется.
Стационарное распределение
Стационарное распределение для неприводимого рекуррентного CTMC — это распределение вероятностей, к которому сходится процесс для больших значений t . Заметим, что для двухуровневого процесса, рассмотренного ранее, с P( t ) заданным как
,
при t → ∞ распределение стремится к
.
Обратите внимание, что каждая строка имеет одинаковое распределение, поскольку это не зависит от начального состояния. Вектор строки π может быть найден путем решения
с ограничением
.
Пример 1
Изображение справа описывает непрерывную во времени цепь Маркова с пространством состояний {Бычий рынок, Медвежий рынок, Застойный рынок} и матрицей переходных скоростей.
Стационарное распределение этой цепи можно найти, решив , с учетом того ограничения, что элементы должны в сумме давать 1, чтобы получить
Пример 2
Изображение справа описывает дискретную цепь Маркова, моделирующую Pac-Man с пространством состояний {1,2,3,4,5,6,7,8,9}. Игрок управляет Pac-Man через лабиринт, поедая pac-dots. Тем временем за ним охотятся призраки. Для удобства лабиринт будет представлять собой небольшую сетку 3x3, а призраки будут перемещаться случайным образом в горизонтальном и вертикальном направлениях. Секретный проход между состояниями 2 и 8 может использоваться в обоих направлениях. Записи с вероятностью ноль удаляются в следующей матрице скорости перехода:
Эта цепь Маркова неприводима, потому что призраки могут перелетать из любого состояния в любое состояние за конечное время. Из-за секретного прохода цепь Маркова также апериодична, потому что призраки могут переходить из любого состояния в любое состояние как за четное, так и за нечетное число переходов состояний. Следовательно, существует уникальное стационарное распределение, которое можно найти, решив , с учетом ограничения, что элементы должны в сумме давать 1. Решение этого линейного уравнения с учетом ограничения:
Центральное состояние и пограничные состояния 2 и 8 смежного секретного прохода посещаются чаще всего, а угловые состояния посещаются реже всего.
Обращение времени
Для CTMC X t обратный во времени процесс определяется как . По лемме Келли этот процесс имеет то же стационарное распределение, что и прямой процесс.
Цепь называется обратимой, если обратный процесс такой же, как и прямой процесс. Критерий Колмогорова гласит, что необходимым и достаточным условием для обратимости процесса является то, что произведение скоростей перехода по замкнутому контуру должно быть одинаковым в обоих направлениях.
Встроенная цепь Маркова
Один из методов нахождения стационарного распределения вероятностей , π , эргодической непрерывной по времени цепи Маркова Q , заключается в том, чтобы сначала найти ее вложенную цепь Маркова (EMC) . Строго говоря, EMC является регулярной дискретной по времени цепью Маркова. Каждый элемент матрицы вероятности перехода за один шаг EMC, S , обозначается как s ij и представляет собой условную вероятность перехода из состояния i в состояние j . Эти условные вероятности могут быть найдены с помощью
Чтобы найти стационарный вектор распределения вероятностей, мы должны найти такой, что
причем является вектором-строкой, таким образом, что все элементы в нем больше 0 и = 1. Отсюда π можно найти как
( S может быть периодическим, даже если Q не является периодическим. После того, как π найдено, его необходимо нормализовать до единичного вектора .)
Другой дискретный процесс, который может быть получен из непрерывной цепи Маркова, — это δ-скелет — (дискретная) цепь Маркова, образованная путем наблюдения X ( t ) с интервалами в δ единиц времени. Случайные величины X (0), X (δ), X (2δ), ... дают последовательность состояний, посещаемых δ-скелетом.
А. А. Марков (1971). "Распространение предельных теорем теории вероятностей на сумму переменных, соединенных в цепь". перепечатано в Приложении B к: Р. Ховард. Динамические вероятностные системы, том 1: Цепи Маркова . John Wiley and Sons.
Марков, АА (2006). «Пример статистического исследования текста «Евгений Онегин» относительно связи образцов в цепях». Наука в контексте . 19 (4). Перевод Линка, Дэвида: 591–600. doi :10.1017/s0269889706001074. S2CID 144854176.
SP Meyn и RL Tweedie (1993) Markov Chains and Stochastic Stability . London: Springer-Verlag ISBN 0-387-19832-6 . online: MCSS. Второе издание выйдет в Cambridge University Press, 2009.
Кемени, Джон Г.; Хазлтон Миркил; Дж. Лори Снелл; Джеральд Л. Томпсон (1959). Конечные математические структуры (1-е изд.). Энглвуд Клиффс, Нью-Джерси: Prentice-Hall, Inc. Номер в каталоге карточек Библиотеки Конгресса 59-12841.Классический текст. см. Главу 6 Конечные цепи Маркова, стр. 384 и далее.
Сенета, Э. Неотрицательные матрицы и цепи Маркова . 2-е перераб. изд., 1981, XVI, 288 стр., Мягкая обложка Springer Series in Statistics. (Первоначально опубликовано Allen & Unwin Ltd., Лондон, 1973) ISBN 978-0-387-29765-1
Сухов, Юрий; Кельберт, Марк (2008). Цепи Маркова: учебник по случайным процессам и их приложениям . Cambridge University Press.
^ Например, рассмотрим пример и являющийся (уникальной) матрицей скорости перехода на такой, что . (Тогда все оставшиеся элементы будут равны нулю. Ср. процесс рождения .) Тогда является нерегулярным. Тогда для общего бесконечного , индексация неотрицательными целыми числами дает, что соответствующим образом измененная версия вышеуказанной матрицы будет нерегулярной. [9]