В математике стохастическая матрица — это квадратная матрица, используемая для описания переходов цепи Маркова . Каждая из его записей представляет собой неотрицательное действительное число , представляющее вероятность . [1] [2] : 9–11 Ее также называют матрицей вероятности , матрицей перехода , матрицей замены или матрицей Маркова . [2] : 9–11 Стохастическая матрица была впервые разработана Андреем Марковым в начале 20 века и нашла применение в самых разных научных областях, включая теорию вероятностей , статистику, математические финансы и линейную алгебру , а также как информатика и популяционная генетика . [2] : 1–8 Существует несколько различных определений и типов стохастических матриц: [2] : 9–11.
Точно так же можно определить стохастический вектор (также называемый вектором вероятности ) как вектор , элементами которого являются неотрицательные действительные числа, сумма которых равна 1. Таким образом, каждая строка правой стохастической матрицы (или столбец левой стохастической матрицы) равна стохастический вектор. [2] : 9–11 В англоязычной математической литературе принято использовать векторы-строки вероятностей и правые стохастические матрицы, а не векторы-столбцы вероятностей и левые стохастические матрицы; эта статья следует этому соглашению. [2] : 1–8 Кроме того, субстохастическая матрица представляет собой действительную квадратную матрицу, все суммы строк которой равны
Стохастическая матрица была разработана наряду с цепью Маркова Андреем Марковым , русским математиком и профессором Санкт-Петербургского университета , который впервые опубликовал эту тему в 1906 году. [2] : 1–8 [3] Первоначально он предполагал использовать ее для лингвистического анализа. и другие математические предметы, такие как перетасовка карт , но и цепи Маркова, и матрицы быстро нашли применение в других областях. [2] : 1–8 [3] [4]
Стохастические матрицы были далее развиты такими учеными, как Андрей Колмогоров , которые расширили их возможности, допустив марковские процессы с непрерывным временем. [5] К 1950-м годам статьи с использованием стохастических матриц появились в области эконометрики [6] и теории цепей . [7] В 1960-х годах стохастические матрицы появились в еще более широком спектре научных работ, от поведенческой науки [8] до геологии [9] [10] и планирования жилых помещений . [11] Кроме того, за эти десятилетия была проделана большая математическая работа по расширению диапазона использования и функциональности стохастической матрицы и марковских процессов в целом.
С 1970-х годов по настоящее время стохастические матрицы нашли применение практически во всех областях, требующих формального анализа, от структурной науки [12] до медицинской диагностики [13] и управления персоналом . [14] Кроме того, стохастические матрицы нашли широкое применение в моделировании изменений земель , обычно под термином «матрица Маркова». [15]
Стохастическая матрица описывает цепь Маркова X t над конечным пространством состояний S мощности α .
Если вероятность перехода от i к j за один временной шаг равна Pr( j | i ) = Pi , j , стохастическая матрица P задается с использованием Pi , j в качестве элемента i -й строки и j -го столбца. , например,
Поскольку общая вероятность перехода из состояния i во все остальные состояния должна быть равна 1,
таким образом, эта матрица является правой стохастической матрицей. [2] : 1–8
Вышеупомянутую поэлементную сумму по каждой строке i из P можно более кратко записать как P 1 = 1 , где 1 представляет собой α -мерный вектор-столбец всех единиц. Используя это, можно видеть, что произведение двух правых стохастических матриц P ′ и P ” также является правым стохастическим: P ′ P ” 1 = P ′ ( P “ 1 ) = P ′ 1 = 1 . В общем, k -я степень P k правой стохастической матрицы P также является правостохастической. Тогда вероятность перехода от i к j за два шага определяется ( i , j ) -м элементом квадрата P :
В общем, вероятность перехода из любого состояния в другое состояние в конечной цепи Маркова, заданной матрицей P за k шагов, определяется как P k .
Начальное распределение вероятностей состояний, определяющее, где система может находиться изначально и с какими вероятностями, задается в виде вектора-строки .
Стационарный вектор вероятности π определяется как распределение, записанное в виде вектора-строки, которое не изменяется при применении матрицы перехода ; то есть оно определяется как распределение вероятностей на множестве {1,…, n } , которое также является собственным вектором строки матрицы вероятностей, связанным с собственным значением 1:
Можно показать, что спектральный радиус любой стохастической матрицы равен единице. По теореме Гершгорина о круге все собственные значения стохастической матрицы имеют абсолютные значения, меньшие или равные единице. Кроме того, каждая правая стохастическая матрица имеет «очевидный» собственный вектор-столбец, связанный с собственным значением 1: использованный выше вектор 1 , все координаты которого равны 1. Поскольку левые и правые собственные значения квадратной матрицы одинаковы, каждая стохастическая матрица имеет , по крайней мере, собственный вектор строки , связанный с собственным значением 1, и наибольшее абсолютное значение всех его собственных значений также равно 1. Наконец, теорема Брауэра о неподвижной точке (применяется к компактному выпуклому множеству всех вероятностных распределений конечного набора {1, …, n } ) подразумевает, что существует некоторый левый собственный вектор, который также является стационарным вектором вероятности.
С другой стороны, теорема Перрона-Фробениуса также гарантирует, что каждая неприводимая стохастическая матрица имеет такой стационарный вектор и что наибольшее абсолютное значение собственного значения всегда равно 1. Однако эту теорему нельзя применить непосредственно к таким матрицам, поскольку они требуют не быть неприводимым.
Вообще таких векторов может быть несколько. Однако для матрицы со строго положительными элементами (или, в более общем смысле, для неприводимой апериодической стохастической матрицы) этот вектор уникален и может быть вычислен, если заметить, что для любого i существует следующий предел:
где π j — j -й элемент вектора-строки π . Помимо прочего, это говорит о том, что долговременная вероятность пребывания в состоянии j не зависит от начального состояния i . То, что оба этих вычисления дают один и тот же стационарный вектор, является формой эргодической теоремы , которая в целом верна для широкого спектра диссипативных динамических систем : система со временем переходит в стационарное состояние .
Интуитивно стохастическая матрица представляет собой цепь Маркова; применение стохастической матрицы к распределению вероятностей перераспределяет вероятностную массу исходного распределения, сохраняя при этом его общую массу. Если этот процесс применяется неоднократно, распределение сходится к стационарному распределению цепи Маркова. [2] : 55–59
Предположим, есть таймер и ряд из пяти соседних ящиков. В нулевой момент времени в первом ящике находится кошка, а в пятом — мышь. Кошка и мышь прыгают в случайный соседний ящик по мере продвижения таймера. Например, если кошка находится во втором ящике, а мышь — в четвертом, вероятность того, что кот окажется в первом ящике , а мышь — в пятом после того, как таймер сдвинется вперед, равна одной четвертой. Если кошка находится в первом ящике, а мышь — в пятом, вероятность того, что кот окажется во втором ящике, а мышь — в четвертом, после того как таймер сдвинется с места, равна единице. Кот съедает мышь, если обе оказываются в одной коробке, и на этом игра заканчивается. Пусть случайная величина K — это время пребывания мыши в игре.
Цепь Маркова , представляющая эту игру, содержит следующие пять состояний, определяемых комбинацией позиций (кошка, мышь). Обратите внимание: хотя при простом перечислении состояний можно было бы перечислить 25 состояний, многие из них невозможны либо потому, что у мыши никогда не может быть индекс ниже, чем у кошки (поскольку это означало бы, что мышь заняла кошачий ящик и выжила, чтобы пройти мимо него), либо потому, что сумма двух индексов всегда будет иметь четность . При этом 3 возможных состояния, приводящие к гибели мыши, объединены в одно:
Мы используем стохастическую матрицу (ниже) для представления вероятностей перехода этой системы (строки и столбцы в этой матрице индексируются возможными состояниями, перечисленными выше, причем состояние перед переходом является строкой, а состояние после перехода — состоянием столбец). [2] : 1–8 Например, начиная с состояния 1 – 1-я строка – система не может оставаться в этом состоянии, поэтому ; система также не может перейти в состояние 2 – потому что кошка осталась бы в том же ящике – таким образом , и по аналогичному аргументу для мыши, . Переходы в состояния 3 или 5 разрешены, и, таким образом , .
Независимо от начального состояния, кошка в конечном итоге поймает мышь (с вероятностью 1), и стационарное состояние π = (0,0,0,0,1) рассматривается как предел. [2] : 55–59 Чтобы вычислить долгосрочное среднее или ожидаемое значение стохастической переменной , для каждого состояния и времени необходимо внести вклад . Выживание можно рассматривать как двоичную переменную для состояния выживания и состояния завершения. Государства с не вносят вклад в долгосрочный средний показатель.
Поскольку состояние 5 является поглощающим состоянием, распределение времени до поглощения является дискретным по фазовому типу . Предположим, что система запускается в состоянии 2, представленном вектором . Состояния, в которых мышь погибла, не влияют на среднее значение выживаемости, поэтому пятое состояние можно игнорировать. Начальное состояние и матрица перехода могут быть сведены к
и
где - единичная матрица и представляет собой матрицу-столбец всех единиц, которая действует как сумма по состояниям.
Поскольку каждое состояние занято в течение одного шага времени, ожидаемое время выживания мыши представляет собой просто сумму вероятности оккупации всех выживших состояний и шагов во времени.
Моменты более высокого порядка определяются выражением