stringtranslate.com

Цепь Маркова с непрерывным временем

Непрерывная во времени цепь Маркова ( CTMC ) — это непрерывный стохастический процесс , в котором для каждого состояния процесс будет менять состояние в соответствии с экспоненциальной случайной величиной , а затем переходить в другое состояние, как указано вероятностями стохастической матрицы . Эквивалентная формулировка описывает процесс как изменяющееся состояние в соответствии с наименьшим значением набора экспоненциальных случайных величин, по одной для каждого возможного состояния, в которое он может перейти, с параметрами, определяемыми текущим состоянием.

Пример CTMC с тремя состояниями выглядит следующим образом: процесс совершает переход после промежутка времени, указанного временем удержания — экспоненциальной случайной величиной , где i — ее текущее состояние. Каждая случайная величина независима и такова, что , и . Когда необходимо совершить переход, процесс движется в соответствии с цепочкой скачков , дискретной по времени цепью Маркова со стохастической матрицей:

Эквивалентно, по свойству конкурирующих экспонент , этот CTMC изменяет состояние из состояния i в соответствии с минимумом двух случайных величин, которые являются независимыми и такими, что для где параметры заданы Q-матрицей

Каждый недиагональный элемент можно вычислить как вероятность того, что цепочка переходов перейдет из состояния i в состояние j , деленную на ожидаемое время удержания состояния i . Диагональные элементы выбираются так, чтобы сумма каждой строки равнялась 0.

CTMC удовлетворяет марковскому свойству , то есть его поведение зависит только от его текущего состояния, а не от его прошлого поведения из-за отсутствия памяти у экспоненциального распределения и дискретных по времени цепей Маркова.

Определение

Пусть будет вероятностным пространством, пусть будет счетным непустым множеством, и пусть ( для «времени»). Оснастим дискретной метрикой , так что мы можем понять правое непрерывность функций . Марковская цепь непрерывного времени определяется как: [1]

  1. для всех отдельных ,
  2. для всех (Даже если бесконечно, эта сумма априори хорошо определена (возможно, равна ), поскольку каждый член, появляющийся в сумме, неотрицателен. Апостериори мы знаем, что сумма также должна быть конечной (не равной ), поскольку мы предполагаем, что она равна и мы предположили, что имеет действительное значение. Некоторые авторы вместо этого используют определение, которое слово в слово совпадает, за исключением измененного условия , и говорят, что является стабильным или полностью стабильным, чтобы означать , т. е. каждая запись имеет действительное значение.) [2] [3] [4]

Обратите внимание, что суммы строк равны 0: или, короче говоря, . Эта ситуация контрастирует с ситуацией для дискретных по времени цепей Маркова , где все суммы строк матрицы перехода равны единице.

Теперь пусть такой, что -измерим . Существует три эквивалентных способа определить бытие Марковым с начальным распределением и матрицей скоростей : через вероятности перехода или через цепочку скачков и времена удержания. [5]

В качестве прелюдии к определению вероятности перехода мы сначала мотивируем определение регулярной матрицы скорости . Мы будем использовать матрицу скорости перехода для указания динамики цепи Маркова посредством генерации набора матриц перехода на ( ), с помощью следующей теоремы.

Теорема: Существование решения обратных уравнений Колмогорова . [6]  —  Существуеттакое, что для всехзаписьдифференцируема иудовлетворяет обратным уравнениям Колмогорова :

Мы говорим, что является регулярным , имея в виду, что у нас есть уникальность для указанной выше системы, т. е. что существует ровно одно решение. [7] [8] Мы говорим , что является нерегулярным , имея в виду, что не является регулярным. Если является конечным, то существует ровно одно решение, а именно и, следовательно, является регулярным. В противном случае является бесконечным, и существуют нерегулярные матрицы переходных скоростей на . [a] Если является регулярным, то для единственного решения , для каждого , будет стохастической матрицей . [6] Мы будем предполагать, что является регулярным с начала следующего подраздела и до конца этого раздела, хотя принято [10] [11] [12] не включать это предположение. (Примечание для эксперта: таким образом, мы не определяем непрерывные по времени цепи Маркова в целом, а только невзрывные непрерывные по времени цепи Маркова.)

Определение вероятности перехода

Пусть будет (единственным) решением системы ( 0 ). (Единственность гарантируется нашим предположением, что является регулярной.) Мы говорим, что является марковским с начальным распределением и матрицей скоростей , что означает: для любого неотрицательного целого числа , для всех таких, что для всех

Используя индукцию и тот факт, что мы можем показать эквивалентность приведенного выше утверждения, содержащего ( 1 ), и следующего утверждения: для всех и для любого неотрицательного целого числа , для всех таких, что для всех таких, что (отсюда следует, что ),

Из непрерывности функций ( ) следует, что траектория почти наверняка непрерывна справа (относительно дискретной метрики на ): существует -нулевое множество такое, что . [13]

Определение прыжковой цепи/времени удержания

Последовательности, связанные с непрерывной справа функцией

Пусть будет непрерывным справа (при оснащении дискретной метрикой ). Определим

позволять

быть последовательностью времени удержания, связанной с , выберите и позвольте

быть « последовательностью состояний », связанной с .

Определение матрицы скачков Π

Матрица скачков , альтернативно записанная, если мы хотим подчеркнуть зависимость от , представляет собой матрицу , где — нулевое множество функции [14]

Свойство цепочки переходов/времени удержания

Мы говорим, что является цепью Маркова с начальным распределением и матрицей скоростей , что означает: траектории почти наверняка непрерывны справа, пусть будет модификацией для того, чтобы иметь (везде) непрерывные справа траектории, почти наверняка (примечание для экспертов: это условие говорит о невзрывном характере), последовательность состояний является дискретной по времени цепью Маркова с начальным распределением (свойство цепи скачков) и матрицей переходов и (свойство времени удержания).

Определение бесконечно малых величин

Непрерывная во времени цепь Маркова характеризуется скоростями переходов — производными по времени вероятностей переходов между состояниями i и j.

Мы говорим , что Марков с начальным распределением и матрицей скоростей означает: для всех и для всех , для всех и для малых строго положительных значений , следующее справедливо для всех таких, что :

,

где термин есть если и в противном случае , а термин с маленькой буквой «о» зависит определенным образом от . [15] [16]

Приведенное выше уравнение показывает, что можно рассматривать как меру того, насколько быстро происходит переход от к для , и насколько быстро происходит переход от к для .

Характеристики

Общение классов

Взаимодействующие классы, транзитивность, повторяемость, а также положительная и нулевая повторяемость определяются так же, как и для дискретных по времени цепей Маркова .

Переходное поведение

Запишем P( t ) для матрицы с элементами p ij = P( X t  =  j  |  X 0  =  i ). Тогда матрица P( t ) удовлетворяет прямому уравнению, дифференциальному уравнению первого порядка

,

где штрих обозначает дифференциацию по t . Решение этого уравнения задается матричной экспонентой

.

В простом случае, таком как CTMC на пространстве состояний {1,2}. Общая матрица Q для такого процесса — это следующая матрица 2 × 2 с α , β  > 0

Вышеуказанное соотношение для прямой матрицы в этом случае можно решить явно, получив

.

Вычисление прямых решений усложняется в больших матрицах. Тот факт, что Q является генератором для полугруппы матриц

используется.

Стационарное распределение

Стационарное распределение для неприводимого рекуррентного CTMC — это распределение вероятностей, к которому сходится процесс для больших значений t . Заметим, что для двухуровневого процесса, рассмотренного ранее, с P( t ) заданным как

,

при t  → ∞ распределение стремится к

.

Обратите внимание, что каждая строка имеет одинаковое распределение, поскольку это не зависит от начального состояния. Вектор строки π может быть найден путем решения

с ограничением

.

Пример 1

Представление направленного графа непрерывной во времени цепи Маркова, описывающей состояние финансовых рынков (примечание: числа вымышлены).

Изображение справа описывает непрерывную во времени цепь Маркова с пространством состояний {Бычий рынок, Медвежий рынок, Застойный рынок} и матрицей переходных скоростей.

Стационарное распределение этой цепи можно найти, решив , с учетом того ограничения, что элементы должны в сумме давать 1, чтобы получить

Пример 2

Граф переходов с вероятностями переходов, пример для состояний 1, 5, 6 и 8. Между состояниями 2 и 8 имеется двунаправленный секретный проход.

Изображение справа описывает дискретную цепь Маркова, моделирующую Pac-Man с пространством состояний {1,2,3,4,5,6,7,8,9}. Игрок управляет Pac-Man через лабиринт, поедая pac-dots. Тем временем за ним охотятся призраки. Для удобства лабиринт будет представлять собой небольшую сетку 3x3, а призраки будут перемещаться случайным образом в горизонтальном и вертикальном направлениях. Секретный проход между состояниями 2 и 8 может использоваться в обоих направлениях. Записи с вероятностью ноль удаляются в следующей матрице скорости перехода:

Эта цепь Маркова неприводима, потому что призраки могут перелетать из любого состояния в любое состояние за конечное время. Из-за секретного прохода цепь Маркова также апериодична, потому что призраки могут переходить из любого состояния в любое состояние как за четное, так и за нечетное число переходов состояний. Следовательно, существует уникальное стационарное распределение, которое можно найти, решив , с учетом ограничения, что элементы должны в сумме давать 1. Решение этого линейного уравнения с учетом ограничения: Центральное состояние и пограничные состояния 2 и 8 смежного секретного прохода посещаются чаще всего, а угловые состояния посещаются реже всего.

Обращение времени

Для CTMC X t обратный во времени процесс определяется как . По лемме Келли этот процесс имеет то же стационарное распределение, что и прямой процесс.

Цепь называется обратимой, если обратный процесс такой же, как и прямой процесс. Критерий Колмогорова гласит, что необходимым и достаточным условием для обратимости процесса является то, что произведение скоростей перехода по замкнутому контуру должно быть одинаковым в обоих направлениях.

Встроенная цепь Маркова

Один из методов нахождения стационарного распределения вероятностей , π , эргодической непрерывной по времени цепи Маркова Q , заключается в том, чтобы сначала найти ее вложенную цепь Маркова (EMC) . Строго говоря, EMC является регулярной дискретной по времени цепью Маркова. Каждый элемент матрицы вероятности перехода за один шаг EMC, S , обозначается как s ij и представляет собой условную вероятность перехода из состояния i в состояние j . Эти условные вероятности могут быть найдены с помощью

Исходя из этого, S можно записать как

где Iединичная матрица , а diag( Q ) — диагональная матрица, образованная путем выбора главной диагонали из матрицы Q и установки всех остальных элементов в ноль.

Чтобы найти стационарный вектор распределения вероятностей, мы должны найти такой, что

причем является вектором-строкой, таким образом, что все элементы в нем больше 0 и = 1. Отсюда π можно найти как

( S может быть периодическим, даже если Q не является периодическим. После того, как π найдено, его необходимо нормализовать до единичного вектора .)

Другой дискретный процесс, который может быть получен из непрерывной цепи Маркова, — это δ-скелет — (дискретная) цепь Маркова, образованная путем наблюдения X ( t ) с интервалами в δ единиц времени. Случайные величины X (0),  X (δ),  X (2δ), ... дают последовательность состояний, посещаемых δ-скелетом.

Смотрите также

Примечания

  1. ^ Росс, SM (2010). Введение в вероятностные модели (10-е изд.). Elsevier. ISBN 978-0-12-375686-2.
  2. ^ Андерсон 1991, см. определение на стр. 64.
  3. ^ Чэнь и Мао 2021, Определение 2.2.
  4. ^ Чен 2004, Определение 0.1(4).
  5. ^ Норрис 1997, Теорема 2.8.4 и Теорема 2.8.2(b).
  6. ^ Андерсон 1991, Теорема 2.2.2(1), стр. 70.
  7. ^ Андерсон 1991, Определение на стр. 81.
  8. ^ Чэнь 2004, стр. 2.
  9. ^ Андерсон 1991, стр. 20.
  10. ^ ab Suhov & Kelbert 2008, Определение 2.6.3.
  11. ^ Чэнь и Мао 2021, Определение 2.1.
  12. ^ Чэнь 2004, Определение 0.1.
  13. ^ Чэнь и Мао 2021, стр. 56, чуть ниже Определения 2.2.
  14. Норрис 1997, стр. 87.
  15. ^ Сухов и Кельберт, 2008, Теорема 2.6.6.
  16. ^ Норрис 1997, Теорема 2.8.2(c).

Ссылки

  1. ^ Например, рассмотрим пример и являющийся (уникальной) матрицей скорости перехода на такой, что . (Тогда все оставшиеся элементы будут равны нулю. Ср. процесс рождения .) Тогда является нерегулярным. Тогда для общего бесконечного , индексация неотрицательными целыми числами дает, что соответствующим образом измененная версия вышеуказанной матрицы будет нерегулярной. [9]