Теория возобновления — это раздел теории вероятностей , который обобщает процесс Пуассона для произвольных времен удержания. Вместо экспоненциально распределенных времен удержания процесс возобновления может иметь любые независимые и идентично распределенные (IID) времена удержания, имеющие конечное среднее значение. Процесс возобновления-вознаграждения дополнительно имеет случайную последовательность вознаграждений, получаемых в каждое время удержания, которые являются IID, но не обязательно независимы от времен удержания.
Процесс восстановления имеет асимптотические свойства, аналогичные усиленному закону больших чисел и центральной предельной теореме . Функция восстановления (ожидаемое число поступлений) и функция вознаграждения (ожидаемое значение вознаграждения) имеют ключевое значение в теории восстановления. Функция восстановления удовлетворяет рекурсивному интегральному уравнению, уравнению восстановления. Ключевое уравнение восстановления дает предельное значение свертки с подходящей неотрицательной функцией. Суперпозицию процессов восстановления можно изучать как частный случай процессов восстановления Маркова .
Приложения включают расчет лучшей стратегии замены изношенного оборудования на заводе и сравнение долгосрочных выгод различных страховых полисов. Парадокс инспекции связан с тем фактом, что наблюдение за интервалом обновления в момент времени t дает интервал со средним значением, большим, чем средний интервал обновления.
Процесс восстановления является обобщением процесса Пуассона . По сути, процесс Пуассона является непрерывным во времени процессом Маркова на положительных целых числах (обычно начинающимся с нуля), который имеет независимые экспоненциально распределенные времена удержания для каждого целого числа перед переходом к следующему целому числу, . В процессе восстановления времена удержания не обязательно должны иметь экспоненциальное распределение; скорее, времена удержания могут иметь любое распределение на положительных числах, при условии, что времена удержания независимы и одинаково распределены ( IID ) и имеют конечное среднее значение.
Пусть — последовательность положительных независимых одинаково распределенных случайных величин с конечным ожидаемым значением
Мы называем случайную величину « -ым временем удержания».
Определим для каждого n > 0:
каждый из них называется « -м временем скачка», а интервалы называются «интервалами обновления».
Тогда задается случайной величиной
где индикаторная функция
представляет собой количество скачков, произошедших к моменту времени t , и называется процессом обновления.
Если рассматривать события, происходящие в случайные моменты времени, можно думать о времени удержания как о случайном времени, прошедшем между двумя последовательными событиями. Например, если процесс обновления моделирует количество поломок различных машин, то время удержания представляет собой время между поломкой одной машины до поломки другой.
Процесс Пуассона является уникальным процессом восстановления с марковским свойством , [1] поскольку экспоненциальное распределение является уникальной непрерывной случайной величиной со свойством отсутствия памяти.
Пусть будет последовательностью случайных величин IID ( вознаграждений ), удовлетворяющей
Тогда случайная величина
называется процессом возобновления-вознаграждения . Обратите внимание, что в отличие от , каждый может принимать как отрицательные, так и положительные значения.
Случайная величина зависит от двух последовательностей: времени удержания и вознаграждения . Эти две последовательности не обязательно должны быть независимыми. В частности, может быть функцией .
В контексте вышеприведенной интерпретации времени обслуживания как времени между последовательными неисправностями машины, «вознаграждения» (которые в данном случае оказываются отрицательными) можно рассматривать как последовательные затраты на ремонт, понесенные в результате последовательных неисправностей.
Альтернативная аналогия: у нас есть волшебный гусь, который несет яйца с интервалами (временами выдержки), распределенными как . Иногда он несет золотые яйца случайного веса, а иногда он несет токсичные яйца (также случайного веса), которые требуют ответственной (и дорогостоящей) утилизации. «Награды» — это последовательные (случайные) финансовые потери/прибыли, возникающие в результате последовательных яиц ( i = 1,2,3,...), и регистрирует общую финансовую «награду» в момент времени t .
Мы определяем функцию восстановления как ожидаемое значение числа скачков, наблюдаемых до некоторого момента времени :
Функция обновления удовлетворяет
Определим функцию вознаграждения :
Функция вознаграждения удовлетворяет
Функция обновления удовлетворяет
где — кумулятивная функция распределения , а — соответствующая функция плотности вероятности.
Пусть X — процесс обновления с функцией обновления и средним значением взаимного обновления . Пусть — функция, удовлетворяющая:
Ключевая теорема восстановления гласит, что, как : [3]
Рассматривая для любого дает как частный случай теорему восстановления: [4]
Результат может быть доказан с помощью интегральных уравнений или с помощью аргумента связи . [5] Хотя это и частный случай ключевой теоремы восстановления, его можно использовать для вывода полной теоремы, рассматривая ступенчатые функции и затем увеличивая последовательности ступенчатых функций. [3]
Процессы обновления и процессы обновления-вознаграждения имеют свойства, аналогичные сильному закону больших чисел , который можно вывести из той же теоремы. Если — процесс обновления и — процесс обновления-вознаграждения, то:
почти наверняка.
Процессы восстановления дополнительно обладают свойством, аналогичным центральной предельной теореме : [6]
Любопытной особенностью процессов обновления является то, что если мы подождем некоторое заранее определенное время t , а затем посмотрим, насколько велик интервал обновления, содержащий t , мы должны ожидать, что он, как правило, будет больше интервала обновления среднего размера.
Математически парадокс инспекции гласит: для любого t > 0 интервал обновления, содержащий t, стохастически больше первого интервала обновления. То есть для всех x > 0 и для всех t > 0:
где F S — кумулятивная функция распределения времени ожидания IID S i . Ярким примером является парадокс времени ожидания автобуса : при заданном случайном распределении прибытия автобусов среднестатистический пассажир на автобусной остановке наблюдает больше задержек, чем среднестатистический оператор автобусов.
Разрешение парадокса заключается в том, что наше выборочное распределение в момент времени t имеет смещение по размеру (см. смещение выборки ), в том смысле, что вероятность выбора интервала пропорциональна его размеру. Однако интервал обновления среднего размера не имеет смещения по размеру.
Если процесс восстановления не является пуассоновским процессом, суперпозиция (сумма) двух независимых процессов восстановления не является процессом восстановления. [7] Однако такие процессы могут быть описаны в рамках более широкого класса процессов, называемых процессами Марковского восстановления . [8] Однако кумулятивная функция распределения первого межсобытийного времени в процессе суперпозиции определяется как [9]
где R k ( t ) и α k > 0 — это CDF времен между событиями и скорости поступления процесса k . [10]
У Эрика-предпринимателя есть n машин, каждая из которых имеет равномерно распределенный срок службы от нуля до двух лет. Эрик может позволить каждой машине работать до тех пор, пока она не выйдет из строя, со стоимостью замены €2600; в качестве альтернативы он может заменить машину в любое время, пока она еще функционирует, со стоимостью €200.
Какова его оптимальная политика замены?
{{cite journal}}
: CS1 maint: multiple names: authors list (link)