В теории вероятностей , статистике и смежных областях точечный процесс Пуассона (также известный как: случайная мера Пуассона , поле случайных точек Пуассона и точечное поле Пуассона ) — это тип математического объекта , который состоит из точек, случайно расположенных на математическом пространстве, с существенной особенностью, что точки появляются независимо друг от друга. [1] Название процесса происходит от того факта, что число точек в любой заданной конечной области следует распределению Пуассона . Процесс и распределение названы в честь французского математика Симеона Дени Пуассона . Сам процесс был открыт независимо и неоднократно в нескольких условиях, включая эксперименты по радиоактивному распаду , поступлению телефонных звонков и актуарную науку . [2] [3]
Этот точечный процесс используется в качестве математической модели для, казалось бы, случайных процессов во многих дисциплинах, включая астрономию , [4] биологию , [5] экологию , [6] геологию , [7] сейсмологию , [8] физику , [9] экономику , [10] обработку изображений , [11] [12] и телекоммуникации . [13] [14]
Точечный процесс Пуассона часто определяется на числовой прямой, где его можно считать стохастическим процессом . Он используется, например, в теории очередей [15] для моделирования случайных событий, распределенных во времени, таких как прибытие клиентов в магазин, телефонные звонки на бирже или возникновение землетрясений. На плоскости точечный процесс, также известный как пространственный процесс Пуассона , [16] может представлять местоположения рассеянных объектов, таких как передатчики в беспроводной сети , [13] [17] [18] [19] частицы, сталкивающиеся с детектором или деревьями в лесу. [20] Процесс часто используется в математических моделях и в смежных областях пространственных точечных процессов, [21] стохастической геометрии , [1] пространственной статистики [21] [22] и теории просачивания континуума . [23]
Точечный процесс Пуассона может быть определен на более абстрактных пространствах. Помимо приложений, точечный процесс Пуассона является объектом математического изучения сам по себе. [24] Точечный процесс Пуассона обладает свойством, что каждая точка стохастически независима от всех других точек в процессе, поэтому его иногда называют чисто или полностью случайным процессом. [25] Моделирование системы как пуассоновского процесса недостаточно, когда взаимодействия точка-точка слишком сильны (то есть точки не являются стохастически независимыми). Такая система может быть лучше смоделирована с помощью другого точечного процесса. [26]
Точечный процесс зависит от одного математического объекта, который, в зависимости от контекста, может быть константой , локально интегрируемой функцией или, в более общих настройках, мерой Радона . [27] В первом случае константа, известная как скорость или интенсивность , является средней плотностью точек в процессе Пуассона, расположенных в некоторой области пространства. Результирующий точечный процесс называется однородным или стационарным точечным процессом Пуассона . [28] Во втором случае точечный процесс называется неоднородным или негомогенным точечным процессом Пуассона , и средняя плотность точек зависит от местоположения базового пространства точечного процесса Пуассона. [29] Слово точка часто опускается, [24] но существуют и другие пуассоновские процессы объектов, которые вместо точек состоят из более сложных математических объектов, таких как линии и многоугольники , и такие процессы могут быть основаны на точечном процессе Пуассона. [30] Как однородный, так и неоднородный точечный процесс Пуассона являются частными случаями обобщенного процесса восстановления .
В зависимости от настройки, процесс имеет несколько эквивалентных определений [31] , а также определения различной общности из-за его многочисленных приложений и характеристик. [32] Точечный процесс Пуассона может быть определен, изучен и использован в одном измерении, например, на действительной прямой, где он может быть интерпретирован как процесс подсчета или часть модели очереди; [33] [34] в более высоких измерениях, таких как плоскость, где он играет роль в стохастической геометрии [1] и пространственной статистике ; [35] или в более общих математических пространствах. [36] Следовательно, обозначения, терминология и уровень математической строгости, используемые для определения и изучения точечного процесса Пуассона и точечных процессов в целом, различаются в зависимости от контекста. [37]
Несмотря на все это, точечный процесс Пуассона имеет два ключевых свойства — свойство Пуассона и свойство независимости — которые играют существенную роль во всех ситуациях, где используется точечный процесс Пуассона. [27] [38] Эти два свойства не являются логически независимыми; действительно, распределение Пуассона количества точек подразумевает свойство независимости, [a] в то время как в обратном направлении требуются предположения, что: (i) точечный процесс прост, (ii) не имеет фиксированных атомов и (iii) является ограниченно конечным. [39]
Пуассоновский точечный процесс характеризуется с помощью распределения Пуассона . Распределение Пуассона — это распределение вероятностей случайной величины (называемой случайной величиной Пуассона ), такое, что вероятность того, что равно, определяется по формуле:
где обозначает факториал , а параметр определяет форму распределения. (Фактически, равен ожидаемому значению .)
По определению, точечный процесс Пуассона обладает тем свойством, что число точек в ограниченной области базового пространства процесса является случайной величиной, распределенной по закону Пуассона. [38]
Рассмотрим набор непересекающихся и ограниченных подобластей базового пространства. По определению, число точек пуассоновского точечного процесса в каждой ограниченной подобласти будет полностью независимым от всех остальных.
Это свойство известно под несколькими названиями, такими как полная случайность , полная независимость , [40] или независимое рассеяние [41] [42] и является общим для всех точечных процессов Пуассона. Другими словами, отсутствует взаимодействие между различными областями и точками в целом, [43] что мотивирует процесс Пуассона иногда называть чисто или полностью случайным процессом. [40]
Если точечный процесс Пуассона имеет параметр вида , где — мера Лебега (то есть, он назначает длина, площадь или объем множествам) и — константа, то точечный процесс называется однородным или стационарным точечным процессом Пуассона. Параметр, называемый скоростью или интенсивностью , связан с ожидаемым (или средним) числом точек Пуассона, существующих в некоторой ограниченной области, [44] [45] где скорость обычно используется, когда базовое пространство имеет одно измерение. [44] Параметр можно интерпретировать как среднее число точек на некоторую единицу протяженности, такую как длина , площадь, объем или время, в зависимости от базового математического пространства, и он также называется средней плотностью или средней скоростью ; [46] см. Терминология.
Однородный точечный процесс Пуассона, рассматриваемый на положительной полупрямой, может быть определен как процесс подсчета , тип стохастического процесса, который может быть обозначен как . [31] [34] Процесс подсчета представляет собой общее количество событий или явлений, которые произошли до и включая время . Процесс подсчета является однородным процессом подсчета Пуассона со скоростью, если он обладает следующими тремя свойствами: [31] [34]
Последнее свойство подразумевает:
Другими словами, вероятность того, что случайная величина равна, определяется по формуле:
Процесс подсчета Пуассона можно также определить, заявив, что временные разницы между событиями процесса подсчета являются экспоненциальными переменными со средним значением . [47] Временные разницы между событиями или прибытиями известны как время между прибытиями [48] или время между появлениями [47] .
Интерпретируемый как точечный процесс , точечный процесс Пуассона может быть определен на действительной прямой , рассматривая число точек процесса в интервале . Для однородного точечного процесса Пуассона на действительной прямой с параметром вероятность того, что это случайное число точек, записанное здесь как , будет равно некоторому счетному числу, определяется как: [49]
Для некоторого положительного целого числа однородный точечный процесс Пуассона имеет конечномерное распределение, заданное формулой: [49]
где реальные числа .
Другими словами, является случайной величиной Пуассона со средним значением , где . Кроме того, число точек в любых двух непересекающихся интервалах, скажем, и независимы друг от друга, и это распространяется на любое конечное число непересекающихся интервалов. [49] В контексте теории очередей можно рассматривать точку, существующую (в интервале), как событие , но это отличается от слова «событие» в смысле теории вероятностей. [b] Из этого следует, что является ожидаемым числом прибытий , которые происходят за единицу времени. [34]
Предыдущее определение имеет две важные особенности, общие для точечных процессов Пуассона в целом: [49] [27]
Более того, он имеет третью особенность, связанную только с однородным точечным процессом Пуассона: [50]
Другими словами, для любого конечного случайная величина не зависит от , поэтому ее также называют стационарным пуассоновским процессом. [49]
Величину можно интерпретировать как ожидаемое или среднее число точек, встречающихся в интервале , а именно:
где обозначает оператор ожидания . Другими словами, параметр процесса Пуассона совпадает с плотностью точек. Более того, однородный точечный процесс Пуассона придерживается своей собственной формы (сильного) закона больших чисел. [51] Более конкретно, с вероятностью единица:
где обозначает предел функции, а — ожидаемое число поступлений за единицу времени.
Расстояние между двумя последовательными точками точечного процесса на действительной прямой будет экспоненциальной случайной величиной с параметром (или, что эквивалентно, средним ). Это подразумевает, что точки обладают свойством отсутствия памяти : существование одной точки, существующей в конечном интервале, не влияет на вероятность (распределение) существования других точек, [52] [53] но это свойство не имеет естественной эквивалентности, когда процесс Пуассона определен на пространстве с более высокими размерностями. [54]
Точечный процесс со стационарными приращениями иногда называют упорядоченным [55] или регулярным , если: [56]
где используется обозначение little-o . Точечный процесс называется простым точечным процессом , когда вероятность совпадения любой из двух его точек в одной и той же позиции на базовом пространстве равна нулю. Для точечных процессов в целом на действительной прямой свойство упорядоченности подразумевает, что процесс является простым, [57] что имеет место для однородного точечного процесса Пуассона. [58]
На действительной прямой однородный точечный процесс Пуассона связан с теорией мартингалов посредством следующей характеристики: точечный процесс является однородным точечным процессом Пуассона тогда и только тогда, когда
это мартингал. [59] [60]
На действительной прямой процесс Пуассона является типом непрерывного во времени марковского процесса , известного как процесс рождения , частный случай процесса рождения-смерти (только с рождениями и нулевыми смертями). [61] [62] Более сложные процессы с марковским свойством , такие как марковские процессы прибытия , были определены, где процесс Пуассона является частным случаем. [47]
Если однородный процесс Пуассона рассматривается только на полупрямой , что может иметь место, когда представляет время [31], то полученный процесс не является истинно инвариантным относительно трансляции. [54] В этом случае процесс Пуассона больше не является стационарным, согласно некоторым определениям стационарности. [28]
Было много применений однородного процесса Пуассона на реальной прямой в попытке смоделировать, казалось бы, случайные и независимые события. Он играет фундаментальную роль в теории очередей , которая является вероятностным полем разработки подходящих стохастических моделей для представления случайного прибытия и отправления определенных явлений. [15] [47] Например, прибытие и обслуживание клиентов или телефонные звонки, поступающие на телефонную станцию, можно изучать с помощью методов из теории очередей.
Однородный процесс Пуассона на действительной прямой считается одним из простейших стохастических процессов для подсчета случайного числа точек. [63] [64] Этот процесс можно обобщить несколькими способами. Одним из возможных обобщений является расширение распределения времени между прибытиями с экспоненциального распределения на другие распределения, что вводит стохастический процесс, известный как процесс восстановления . Другое обобщение заключается в определении точечного процесса Пуассона на пространствах более высокой размерности, таких как плоскость. [65]
Пространственный пуассоновский процесс — это точечный пуассоновский процесс, определенный на плоскости . [59] [66] Для его математического определения сначала рассматривается ограниченная, открытая или замкнутая (или, точнее, измеримая по Борелю ) область плоскости. Число точек точечного процесса, существующих в этой области, является случайной величиной, обозначаемой . Если точки принадлежат однородному пуассоновскому процессу с параметром , то вероятность существования точек в определяется по формуле:
где обозначает площадь .
Для некоторого конечного целого числа мы можем задать конечномерное распределение однородного точечного процесса Пуассона, сначала рассмотрев набор непересекающихся, ограниченных борелевских (измеримых) множеств . Число точек точечного процесса, существующих в , можно записать как . Тогда однородный точечный процесс Пуассона с параметром имеет конечномерное распределение: [67]
Пространственный точечный процесс Пуассона играет видную роль в пространственной статистике , [21] [22] стохастической геометрии и теории перколяции континуума . [23] Этот точечный процесс применяется в различных физических науках, таких как модель, разработанная для обнаружения альфа-частиц. В последние годы он часто использовался для моделирования, казалось бы, неупорядоченных пространственных конфигураций определенных сетей беспроводной связи. [17] [18] [19] Например, были разработаны модели для сетей сотовой связи или мобильной телефонной связи, в которых предполагается, что передатчики телефонной сети, известные как базовые станции, располагаются в соответствии с однородным точечным процессом Пуассона.
Предыдущий однородный точечный процесс Пуассона немедленно распространяется на более высокие измерения, заменяя понятие площади (высокоразмерным) объемом. Для некоторой ограниченной области евклидова пространства , если точки образуют однородный процесс Пуассона с параметром , то вероятность существования точек в определяется как:
где теперь обозначает -мерный объем . Кроме того, для набора непересекающихся ограниченных борелевских множеств , пусть обозначает число точек из , существующих в . Тогда соответствующий однородный точечный процесс Пуассона с параметром имеет конечномерное распределение: [69]
Однородные точечные процессы Пуассона не зависят от положения базового пространства через его параметр , что подразумевает, что это как стационарный процесс (инвариантный к трансляции), так и изотропный (инвариантный к вращению) стохастический процесс. [28] Аналогично одномерному случаю, однородный точечный процесс ограничен некоторым ограниченным подмножеством , тогда в зависимости от некоторых определений стационарности процесс больше не является стационарным. [28] [54]
Если однородный точечный процесс определен на действительной прямой как математическая модель для появлений некоторого явления, то он имеет ту характеристику, что положения этих появлений или событий на действительной прямой (часто интерпретируемых как время) будут равномерно распределены. Более конкретно, если событие происходит (согласно этому процессу) в интервале, где , то его местоположение будет однородной случайной величиной, определенной на этом интервале. [67] Кроме того, однородный точечный процесс иногда называют однородным точечным процессом Пуассона (см. Терминология). Это свойство однородности распространяется на более высокие измерения в декартовых координатах, но не, например, в полярных координатах. [70] [71]
Неоднородный или негомогенный точечный процесс Пуассона (см. Терминология) — это точечный процесс Пуассона с параметром Пуассона, заданным как некоторая зависящая от местоположения функция в базовом пространстве, на котором определен процесс Пуассона. Для евклидова пространства это достигается путем введения локально интегрируемой положительной функции , такой, что для каждой ограниченной области ( -мерный) интеграл объема по области конечен. Другими словами, если этот интеграл, обозначенный как , равен: [45]
где - ( -мерный) элемент объема, [c] тогда для любого набора непересекающихся ограниченных измеримых по Борелю множеств неоднородный пуассоновский процесс с функцией (интенсивности) имеет конечномерное распределение: [69]
Кроме того, имеет интерпретацию как ожидаемое число точек процесса Пуассона, расположенных в ограниченной области , а именно
На вещественной прямой неоднородный или негомогенный точечный процесс Пуассона имеет среднюю меру, заданную одномерным интегралом. Для двух вещественных чисел и , где , обозначим через число точек неоднородного процесса Пуассона с функцией интенсивности, встречающихся в интервале . Вероятность существования точек в указанном выше интервале определяется как:
где среднее значение или мера интенсивности равна:
что означает, что случайная величина является пуассоновской случайной величиной со средним значением .
Особенностью одномерной постановки является то, что неоднородный пуассоновский процесс может быть преобразован в однородный с помощью монотонного преобразования или отображения, что достигается с помощью обратного преобразования . [72] [73]
Неоднородный точечный процесс Пуассона, рассматриваемый на положительной полупрямой, также иногда определяется как процесс подсчета. При такой интерпретации процесс, который иногда записывается как , представляет собой общее число событий или явлений, которые произошли до и включая время . Процесс подсчета называется неоднородным процессом подсчета Пуассона, если он обладает четырьмя свойствами: [34] [74]
где — асимптотическая или мало-о-обозначающая запись для . В случае точечных процессов с рефрактерностью (например, нейронных импульсных последовательностей) применяется более сильная версия свойства 4: [75] .
Вышеуказанные свойства подразумевают, что является случайной величиной Пуассона с параметром (или средним значением)
что подразумевает
Неоднородный процесс Пуассона, определенный на плоскости , называется пространственным процессом Пуассона [16]. Он определяется функцией интенсивности, а его мера интенсивности получается путем выполнения поверхностного интеграла его функции интенсивности по некоторой области. [20] [76] Например, его функция интенсивности (как функция декартовых координат и ) может быть
поэтому соответствующая мера интенсивности задается поверхностным интегралом
где — некоторая ограниченная область на плоскости .
На плоскости соответствует поверхностному интегралу, тогда как в интеграле становится ( -мерным) объемным интегралом.
Когда действительная линия интерпретируется как время, неоднородный процесс используется в областях счетных процессов и в теории очередей. [74] [77] Примеры явлений, которые были представлены или проявляются как неоднородный точечный процесс Пуассона, включают:
На плоскости точечный процесс Пуассона важен в смежных дисциплинах стохастической геометрии [1] [35] и пространственной статистики. [21] [22] Мера интенсивности этого точечного процесса зависит от местоположения базового пространства, что означает, что его можно использовать для моделирования явлений с плотностью, которая меняется в некоторой области. Другими словами, явления можно представить в виде точек, имеющих плотность, зависящую от местоположения. [20] Этот процесс использовался в различных дисциплинах и применяется в изучении лосося и морских вшей в океанах, [80] лесном хозяйстве [6] и задачах поиска. [81]
Функция интенсивности Пуассона имеет интерпретацию, считающуюся интуитивной, [20] с элементом объема в бесконечно малом смысле: это бесконечно малая вероятность того, что точка точечного процесса Пуассона существует в области пространства с объемом, расположенным в . [20]
Например, если задан однородный точечный процесс Пуассона на действительной прямой, вероятность нахождения единственной точки процесса в небольшом интервале ширины приблизительно равна . Фактически, такая интуиция — это то, как иногда вводится точечный процесс Пуассона и выводится его распределение. [82] [43] [83]
Если точечный процесс Пуассона имеет меру интенсивности, которая локально конечна и диффузна (или неатомична), то это простой точечный процесс . Для простого точечного процесса вероятность существования точки в одной точке или месте в базовом (состоянии) пространстве равна либо нулю, либо единице. Это означает, что с вероятностью единица никакие две (или более) точки точечного процесса Пуассона не совпадают по местоположению в базовом пространстве. [84] [18] [85]
Моделирование процесса точки Пуассона на компьютере обычно выполняется в ограниченной области пространства, известной как окно моделирования , и требует двух шагов: соответствующего создания случайного числа точек и последующего соответствующего размещения точек случайным образом. Оба эти шага зависят от конкретного процесса точки Пуассона, который моделируется. [86] [87]
Число точек в окне, обозначенное здесь как , необходимо смоделировать, что делается с помощью функции генерации (псевдо)случайных чисел , способной моделировать случайные величины Пуассона.
Для однородного случая с константой среднее значение случайной величины Пуассона устанавливается равным , где — длина, площадь или ( -мерный) объем .
Для неоднородного случая заменяется на ( -мерный) объемный интеграл
На втором этапе необходимо случайным образом разместить точки в окне .
Для однородного случая в одном измерении все точки равномерно и независимо размещаются в окне или интервале . Для более высоких измерений в декартовой системе координат каждая координата равномерно и независимо размещается в окне . Если окно не является подпространством декартова пространства (например, внутри единичной сферы или на поверхности единичной сферы), то точки не будут равномерно размещены в , и потребуется подходящее изменение координат (из декартовых). [86]
Для неоднородного случая можно использовать несколько различных методов в зависимости от природы функции интенсивности . [86] Если функция интенсивности достаточно проста, то можно сгенерировать независимые и случайные неоднородные (декартовы или другие) координаты точек. Например, моделирование точечного процесса Пуассона на круглом окне можно выполнить для изотропной функции интенсивности (в полярных координатах и ), подразумевая, что она вращательно-вариантна или независима от , но зависит от , путем замены переменной в , если функция интенсивности достаточно проста. [86]
Для более сложных функций интенсивности можно использовать метод принятия-отклонения , который заключается в использовании (или «принятии») только определенных случайных точек и неиспользовании (или «отклонении») других точек на основе соотношения:. [88]
где находится рассматриваемая точка для принятия или отклонения.
То есть, местоположение равномерно случайным образом выбирается для рассмотрения, затем, чтобы определить, следует ли помещать образец в это местоположение, равномерно случайно выбранное число сравнивается с функцией плотности вероятности , принимая его, если оно меньше функции плотности вероятности, и повторяя до тех пор, пока не будет извлечено ранее выбранное количество образцов.
В теории меры точечный процесс Пуассона может быть далее обобщен до того, что иногда называют общим точечным процессом Пуассона [20] [89] или общим процессом Пуассона [76] с помощью меры Радона , которая является локально конечной мерой . В общем случае эта мера Радона может быть атомарной, что означает, что несколько точек точечного процесса Пуассона могут существовать в одном и том же месте базового пространства. В этой ситуации число точек в является случайной величиной Пуассона со средним значением . [89] Но иногда предполагается обратное, поэтому мера Радона является диффузной или неатомарной. [20]
Точечный процесс является общим точечным процессом Пуассона с интенсивностью, если он обладает двумя следующими свойствами: [20]
Мера Радона сохраняет свою предыдущую интерпретацию как ожидаемое число точек, расположенных в ограниченной области , а именно
Более того, если является абсолютно непрерывным, таким образом, что имеет плотность (которая является плотностью Радона–Никодима или производной) относительно меры Лебега, то для всех борелевских множеств ее можно записать как:
где плотность известна, среди прочих терминов, как функция интенсивности.
Несмотря на свое название, точечный процесс Пуассона не был ни открыт, ни изучен его тезкой. Он приводится в качестве примера закона эпонимии Стиглера . [2] [3] Название возникает из неотъемлемой связи процесса с распределением Пуассона, выведенным Пуассоном как предельный случай биномиального распределения . [90] Он описывает вероятность суммы испытаний Бернулли с вероятностью , часто уподобляемой числу орлов (или решек) после необъективных подбрасываний монеты с вероятностью выпадения орла (или решки), равной . Для некоторой положительной константы , при увеличении к бесконечности и уменьшении к нулю таким образом, что произведение фиксировано, распределение Пуассона более точно приближается к биномиальному. [91]
Пуассон вывел распределение Пуассона, опубликованное в 1841 году, путем исследования биномиального распределения в пределе (к нулю ) и (к бесконечности). Оно появляется только один раз во всех работах Пуассона, [92] и результат не был хорошо известен в его время. В последующие годы другие использовали распределение, не ссылаясь на Пуассона, включая Филиппа Людвига фон Зайделя и Эрнста Аббе . [93] [2] В конце 19-го века Ладислав Борткевич изучал распределение, ссылаясь на Пуассона, используя реальные данные о количестве смертей от ударов лошади в прусской армии . [90] [94]
Существует ряд заявлений о ранних применениях или открытиях точечного процесса Пуассона. [2] [3] Например, Джон Мичелл в 1767 году, за десятилетие до рождения Пуассона, интересовался вероятностью нахождения звезды в определенной области другой звезды, ошибочно предполагая, что звезды были «разбросаны по чистой случайности», и изучал пример, состоящий из шести ярчайших звезд в Плеядах , не выводя распределение Пуассона. Эта работа вдохновила Саймона Ньюкомба на изучение проблемы и вычисление распределения Пуассона как приближения для биномиального распределения в 1860 году. [3]
В начале 20-го века процесс Пуассона (в одном измерении) возникал независимо в различных ситуациях. [2] [3] В Швеции в 1903 году Филипп Лундберг опубликовал диссертацию, содержащую работу, которая сейчас считается фундаментальной и новаторской, где он предложил моделировать страховые иски с помощью однородного процесса Пуассона. [95] [96]
В Дании А.К. Эрланг вывел распределение Пуассона в 1909 году при разработке математической модели для числа входящих телефонных звонков за конечный промежуток времени. Эрланг не знал о более ранней работе Пуассона и предположил, что число телефонных звонков, поступающих за каждый промежуток времени, не зависит друг от друга. Затем он нашел предельный случай, который фактически переформулирует распределение Пуассона как предел биномиального распределения. [2]
В 1910 году Эрнест Резерфорд и Ганс Гейгер опубликовали экспериментальные результаты по подсчету альфа-частиц. Их экспериментальная работа имела математический вклад Гарри Бейтмана , который вывел вероятности Пуассона как решение семейства дифференциальных уравнений, хотя решение было выведено ранее, что привело к независимому открытию процесса Пуассона. [2] После этого времени было много исследований и приложений процесса Пуассона, но его ранняя история сложна, что было объяснено различными приложениями процесса в многочисленных областях биологами, экологами, инженерами и различными физиками. [2]
Годы после 1909 года привели к ряду исследований и приложений точечного процесса Пуассона, однако его ранняя история сложна, что объясняется различными применениями процесса в многочисленных областях биологами , экологами, инженерами и другими специалистами, работающими в области физических наук . Ранние результаты были опубликованы на разных языках и в разных условиях, без использования стандартной терминологии и обозначений. [2] Например, в 1922 году шведский химик и лауреат Нобелевской премии Теодор Сведберг предложил модель, в которой пространственный точечный процесс Пуассона является базовым процессом для изучения того, как растения распределяются в растительных сообществах. [97] Ряд математиков начали изучать этот процесс в начале 1930-х годов, и важный вклад внесли Андрей Колмогоров , Уильям Феллер и Александр Хинчин , [2] и другие. [98] В области телетрафика математики и статистики изучали и использовали Пуассона и другие точечные процессы. [99]
Швед Конни Палм в своей диссертации 1943 года изучал пуассоновские и другие точечные процессы в одномерной обстановке, рассматривая их с точки зрения статистической или стохастической зависимости между точками во времени. [100] [99] В его работе впервые зафиксировано использование термина « точечные процессы» как Punktprozesse на немецком языке. [100] [3]
Считается [2] , что Уильям Феллер был первым, кто в печати назвал его процессом Пуассона в своей статье 1940 года. Хотя швед Уве Лундберг использовал термин « процесс Пуассона» в своей докторской диссертации 1940 года, [3] в которой было признано влияние Феллера, [101] утверждается, что Феллер придумал этот термин до 1940 года. [91] Было отмечено, что и Феллер, и Лундберг использовали этот термин так, как будто он был общеизвестным, подразумевая, что к тому времени он уже был в разговорной речи. [3] Феллер работал с 1936 по 1939 год вместе с Харальдом Крамером в Стокгольмском университете , где Лундберг был аспирантом Крамера, который не использовал термин « процесс Пуассона» в своей книге, законченной в 1936 году, но использовал его в последующих изданиях, что привело к предположению, что термин « процесс Пуассона» был придуман где-то между 1936 и 1939 годами в Стокгольмском университете. [3]
Терминология теории точечных процессов в целом подвергалась критике за излишнее разнообразие. [3] Помимо того, что слово «точка» часто опускается, [65] [24] однородный пуассоновский (точечный) процесс также называется стационарным пуассоновским (точечным) процессом, [49] а также равномерным пуассоновским (точечным) процессом. [44] Неоднородный пуассоновский точечный процесс, также называемый негомогенным , [49] также называется нестационарным пуассоновским процессом. [74] [102]
Термин точечный процесс подвергся критике, поскольку термин процесс может предполагать во времени и пространстве, так что случайное точечное поле , [103] в результате чего также используются термины пуассоновское случайное точечное поле или пуассоновское точечное поле . [104] Точечный процесс считается и иногда называется случайной счетной мерой, [105] поэтому пуассоновский точечный процесс также называют пуассоновской случайной мерой , [106] термин, используемый при изучении процессов Леви, [106] [107] но некоторые предпочитают использовать два термина для пуассоновских точечных процессов, определенных в двух различных базовых пространствах. [108]
Математическое пространство, лежащее в основе точечного процесса Пуассона , называется пространством носителей [109] [110] или пространством состояний , хотя последний термин имеет другое значение в контексте стохастических процессов. В контексте точечных процессов термин «пространство состояний» может означать пространство, на котором определен точечный процесс, например, действительную линию [111] [112], которая соответствует набору индексов [113] или набору параметров [114] в терминологии стохастических процессов.
Мера называется мерой интенсивности , [115] средней мерой , [38] или параметрической мерой , [69], поскольку стандартных терминов нет. [38] Если имеет производную или плотность, обозначаемую как , называется функцией интенсивности точечного процесса Пуассона. [20] Для однородного точечного процесса Пуассона производная меры интенсивности — это просто константа , которую можно называть скоростью , обычно когда базовым пространством является действительная линия, или интенсивностью . [44] Ее также называют средней скоростью или средней плотностью [116] или скоростью . [34] Для соответствующий процесс иногда называют стандартным (точечным) процессом Пуассона . [45] [59] [117]
Степень точечного процесса Пуассона иногда называют экспозицией . [118] [119]
Обозначение точечного процесса Пуассона зависит от его настройки и области, в которой он применяется. Например, на действительной прямой процесс Пуассона, как однородный, так и неоднородный, иногда интерпретируется как счетный процесс, а обозначение используется для представления процесса Пуассона. [31] [34]
Другая причина для изменения обозначений связана с теорией точечных процессов, которая имеет несколько математических интерпретаций. Например, простой точечный процесс Пуассона можно рассматривать как случайное множество, что предполагает обозначение , подразумевающее, что является случайной точкой, принадлежащей или являющейся элементом точечного процесса Пуассона . Другая, более общая, интерпретация заключается в том, чтобы рассматривать пуассоновский или любой другой точечный процесс как случайную счетную меру, поэтому можно записать количество точек точечного процесса Пуассона, найденных или расположенных в некоторой (измеримой по Борелю) области , как , что является случайной величиной. Эти различные интерпретации приводят к использованию обозначений из таких математических областей, как теория меры и теория множеств. [120]
Для общих точечных процессов иногда включается нижний индекс на символе точки, например , так что можно писать (с обозначением множества) вместо , и может использоваться для связанной переменной в интегральных выражениях, таких как теорема Кэмпбелла, вместо обозначения случайных точек. [18] Иногда заглавная буква обозначает точечный процесс, в то время как строчная обозначает точку из процесса, так, например, точка или принадлежит или является точкой точечного процесса и может быть записана с обозначением множества как или . [112]
Более того, обозначения теории множеств и интегральной или мерной теории могут использоваться взаимозаменяемо. Например, для точечного процесса, определенного на евклидовом пространстве состояний , и (измеримой) функции на , выражение
демонстрирует два различных способа записи суммирования по точечному процессу (см. также теорему Кэмпбелла (вероятность) ). Более конкретно, интегральная нотация в левой части интерпретирует точечный процесс как случайную счетную меру, тогда как сумма в правой части предполагает случайную интерпретацию множества. [120]
В теории вероятностей операции применяются к случайным величинам для различных целей. Иногда эти операции являются регулярными ожиданиями, которые производят среднее значение или дисперсию случайной величины. Другие, такие как характеристические функции (или преобразования Лапласа) случайной величины, могут использоваться для уникальной идентификации или характеристики случайных величин и доказательства результатов, таких как центральная предельная теорема. [121] В теории точечных процессов существуют аналогичные математические инструменты, которые обычно существуют в форме мер и функционалов вместо моментов и функций соответственно. [122] [123]
Для точечного процесса Пуассона с мерой интенсивности на некотором пространстве функционал Лапласа определяется как: [18]
Одна из версий теоремы Кэмпбелла включает функционал Лапласа точечного процесса Пуассона.
Вероятностная генерирующая функция неотрицательной целочисленной случайной величины приводит к тому, что вероятностный генерирующий функционал определяется аналогично любой неотрицательной ограниченной функции на такой, что . Для точечного процесса вероятностный генерирующий функционал определяется как: [124]
где произведение выполняется для всех точек в . Если мера интенсивности локально конечна, то хорошо определено для любой измеримой функции на . Для точечного процесса Пуассона с мерой интенсивности производящий функционал задается как:
что в однородном случае сводится к
Для общего точечного процесса Пуассона с мерой интенсивности мера первого момента является его мерой интенсивности: [18] [19]
что для однородного точечного процесса Пуассона с постоянной интенсивностью означает:
где — длина, площадь или объем (или, в более общем смысле, мера Лебега ) .
Уравнение Мекке характеризует точечный процесс Пуассона. Пусть будет пространством всех -конечных мер на некотором общем пространстве . Точечный процесс с интенсивностью на является точечным процессом Пуассона тогда и только тогда, когда для всех измеримых функций выполняется следующее
Для получения более подробной информации см. [125]
Для общего точечного процесса Пуассона с мерой интенсивности -я факториальная моментная мера задается выражением: [126]
где — мера интенсивности или мера первого момента , которая для некоторого борелевского множества задается выражением
Для однородного точечного процесса Пуассона -я факториальная моментная мера просто равна: [18] [19]
где - длина, площадь или объем (или, в более общем смысле, мера Лебега ) . Кроме того, -я факториальная плотность момента равна: [126]
Функция избегания [71] или вероятность пустоты [120] точечного процесса определяется относительно некоторого множества , которое является подмножеством базового пространства , как вероятность отсутствия точек в . Точнее, [127] для тестового множества функция избегания определяется как:
Для общего точечного процесса Пуассона с мерой интенсивности его функция избегания определяется выражением:
Простые точечные процессы полностью характеризуются их вероятностями пустоты. [128] Другими словами, полная информация о простом точечном процессе полностью фиксируется в его вероятностях пустоты, и два простых точечных процесса имеют одинаковые вероятности пустоты тогда и только тогда, когда они являются одними и теми же точечными процессами. Случай для процесса Пуассона иногда называют теоремой Реньи , которая названа в честь Альфреда Реньи, который открыл результат для случая однородного точечного процесса в одном измерении. [129]
В одной из форм [129] теорема Реньи гласит, что для диффузной (или неатомической) меры Радона на и множества , являющегося конечным объединением прямоугольников (то есть не борелевского [d] ), если есть счетное подмножество такого, что:
то есть точечный процесс Пуассона с мерой интенсивности .
Математические операции могут быть выполнены над точечными процессами для получения новых точечных процессов и разработки новых математических моделей для местоположений определенных объектов. Один из примеров операции известен как прореживание, которое влечет за собой удаление или изъятие точек некоторого точечного процесса в соответствии с правилом, создавая новый процесс с оставшимися точками (удаленные точки также образуют точечный процесс). [131]
Для процесса Пуассона независимые операции -прореживания приводят к другому точечному процессу Пуассона. Более конкретно, операция -прореживания, примененная к точечному процессу Пуассона с мерой интенсивности, дает точечный процесс удаленных точек, который также является точечным процессом Пуассона с мерой интенсивности , который для ограниченного борелевского множества задается как:
Этот результат прореживания точечного процесса Пуассона иногда называют теоремой Прекопы . [132] Более того, после случайного прореживания точечного процесса Пуассона, сохраненные или оставшиеся точки также образуют точечный процесс Пуассона, который имеет меру интенсивности
Два отдельных точечных процесса Пуассона, сформированных соответственно из удаленных и сохраненных точек, стохастически независимы друг от друга. [131] Другими словами, если известно, что область содержит сохраненные точки (из исходного точечного процесса Пуассона), то это не повлияет на случайное число удаленных точек в той же области. Эта способность случайным образом создавать два независимых точечных процесса Пуассона из одного иногда называется расщеплением [133] [134] точечного процесса Пуассона.
Если имеется счетный набор точечных процессов , то их суперпозиция или, на языке теории множеств, их объединение, которое есть [135]
также образует точечный процесс. Другими словами, любые точки, находящиеся в любом из точечных процессов, будут также находиться в суперпозиции этих точечных процессов .
Теорема о суперпозиции точечного процесса Пуассона гласит, что суперпозиция независимых точечных процессов Пуассона со средними мерами также будет точечным процессом Пуассона со средними мерами [136] [91]
Другими словами, объединение двух (или счетного числа) процессов Пуассона является другим процессом Пуассона. Если точка выбирается из счетного объединения процессов Пуассона, то вероятность того, что точка принадлежит процессу Пуассона, определяется как:
Для двух однородных пуассоновских процессов с интенсивностями два предыдущих выражения сводятся к
и
Операция кластеризации выполняется, когда каждая точка некоторого точечного процесса заменяется другим (возможно, иным) точечным процессом. Если исходный процесс является точечным процессом Пуассона, то результирующий процесс называется точечным процессом кластеризации Пуассона.
Математическая модель может потребовать случайного перемещения точек точечного процесса в другие места на базовом математическом пространстве, что приводит к операции точечного процесса, известной как смещение [137] или трансляция. [138] Пуассоновский точечный процесс использовался для моделирования, например, перемещения растений между поколениями, благодаря теореме о смещении [137] , которая в общих чертах гласит, что случайное независимое смещение точек точечного процесса Пуассона (на том же базовом пространстве) образует другой точечный процесс Пуассона.
Одна из версий теоремы о смещении [137] включает в себя точечный процесс Пуассона на с функцией интенсивности . Затем предполагается, что точки из случайным образом смещены в другое место в так, что смещение каждой точки независимо и что смещение точки, ранее находившейся в , является случайным вектором с плотностью вероятности . [e] Тогда новый точечный процесс также является точечным процессом Пуассона с функцией интенсивности
Если процесс Пуассона однороден при и если является функцией от , то
Другими словами, после каждого случайного и независимого перемещения точек исходный точечный процесс Пуассона все еще существует.
Теорему смещения можно расширить таким образом, что точки Пуассона будут случайным образом смещены из одного евклидова пространства в другое евклидово пространство , где не обязательно равно . [18]
Другим свойством, которое считается полезным, является способность отображать точечный процесс Пуассона из одного базового пространства в другое пространство. [139]
Если отображение (или преобразование) придерживается некоторых условий, то полученный отображенный (или преобразованный) набор точек также образует точечный процесс Пуассона, и этот результат иногда называют теоремой отображения . [139] [140] Теорема включает в себя некоторый точечный процесс Пуассона со средней мерой на некотором базовом пространстве. Если местоположения точек отображаются (то есть точечный процесс преобразуется) в соответствии с некоторой функцией в другое базовое пространство, то полученный точечный процесс также является точечным процессом Пуассона, но с другой средней мерой .
Более конкретно, можно рассмотреть (измеримую по Борелю) функцию , которая отображает точечный процесс с мерой интенсивности из одного пространства в другое пространство таким образом, что новый точечный процесс имеет меру интенсивности:
без атомов, где — борелевское множество, а обозначает обратную функцию . Если — точечный процесс Пуассона, то новый процесс также является точечным процессом Пуассона с мерой интенсивности .
Податливость процесса Пуассона означает, что иногда удобно аппроксимировать непуассоновский точечный процесс пуассоновским. Общая цель состоит в том, чтобы аппроксимировать как количество точек некоторого точечного процесса, так и местоположение каждой точки пуассоновским точечным процессом. [141] Существует ряд методов, которые можно использовать для обоснования, неформального или строгого, аппроксимации возникновения случайных событий или явлений подходящими пуассоновскими точечными процессами. Более строгие методы включают в себя вывод верхних границ метрик вероятности между пуассоновскими и непуассоновскими точечными процессами, в то время как другие методы могут быть обоснованы менее формальными эвристиками. [142]
Один из методов аппроксимации случайных событий или явлений с помощью пуассоновских процессов называется эвристикой сгущения . [143] Общая эвристика или принцип включает использование точечного процесса Пуассона (или распределения Пуассона) для аппроксимации событий, которые считаются редкими или маловероятными, некоторого стохастического процесса. В некоторых случаях эти редкие события близки к независимости, поэтому можно использовать точечный процесс Пуассона. Когда события не являются независимыми, но имеют тенденцию происходить в кластерах или кластерах , то если эти кластеры соответствующим образом определены так, что они приблизительно независимы друг от друга, то количество возникающих кластеров будет близко к случайной величине Пуассона [142] , а местоположения кластеров будут близки к процессу Пуассона. [143]
Метод Штейна — это математический метод, изначально разработанный для аппроксимации случайных величин, таких как гауссовские и пуассоновские, который также применялся к точечным процессам. Метод Штейна может быть использован для получения верхних границ метрик вероятности , которые позволяют количественно оценить, как два разных случайных математических объекта изменяются стохастически. [141] [144] Были получены верхние границы метрик вероятности, таких как общая вариация и расстояние Вассерштейна . [141]
Исследователи применили метод Штейна к точечным процессам Пуассона несколькими способами, [141] например, используя исчисление Пальма . [110] Методы, основанные на методе Штейна, были разработаны для учета в верхних границах эффектов определенных операций точечного процесса, таких как прореживание и суперпозиция. [145] [146] Метод Штейна также использовался для вывода верхних границ метрик Пуассона и других процессов, таких как точечный процесс Кокса , который является пуассоновским процессом со случайной мерой интенсивности. [141]
В общем случае, когда операция применяется к общему точечному процессу, результирующий процесс обычно не является точечным процессом Пуассона. Например, если точечный процесс, отличный от Пуассона, имеет свои точки, смещенные случайным и независимым образом, то этот процесс не обязательно будет точечным процессом Пуассона. Однако при определенных математических условиях как для исходного точечного процесса, так и для случайного смещения было показано с помощью предельных теорем, что если точки точечного процесса многократно смещаются случайным и независимым образом, то конечное распределение точечного процесса будет сходиться (слабо) к распределению точечного процесса Пуассона. [147]
Аналогичные результаты сходимости были получены для операций прореживания и суперпозиции [147] , которые показывают, что такие повторяющиеся операции над точечными процессами могут при определенных условиях привести к сходимости процесса к точечным процессам Пуассона, при условии подходящего перемасштабирования меры интенсивности (в противном случае значения меры интенсивности результирующих точечных процессов будут стремиться к нулю или бесконечности). Такая работа по сходимости напрямую связана с результатами, известными как уравнения Пальма–Хинчина [f] , которые берут свое начало в работе Конни Палма и Александра Хинчина , [148] и помогают объяснить, почему процесс Пуассона часто может использоваться в качестве математической модели различных случайных явлений. [147]
Процесс точки Пуассона может быть обобщен, например, путем изменения его меры интенсивности или определения на более общих математических пространствах. Эти обобщения могут быть изучены математически, а также использованы для математического моделирования или представления физических явлений.
Случайные меры пуассоновского типа (PT) представляют собой семейство из трех случайных счетных мер, которые замкнуты относительно ограничения на подпространство, т. е. замкнуты относительно операции точечного процесса # Прореживание . Эти случайные меры являются примерами смешанного биномиального процесса и разделяют свойство самоподобия распределения случайной меры пуассоновской . Они являются единственными членами канонического семейства неотрицательных степенных рядов распределений, обладающими этим свойством, и включают распределение пуассоновское , отрицательное биномиальное распределение и биномиальное распределение . Случайная мера пуассоновская независима от непересекающихся подпространств, тогда как другие случайные меры PT (отрицательное биномиальное и биномиальное) имеют положительные и отрицательные ковариации. Случайные меры PT обсуждаются [149] и включают случайную меру пуассоновскую , отрицательную биномиальную случайную меру и биномиальную случайную меру.
Для математических моделей точечный процесс Пуассона часто определяется в евклидовом пространстве, [1] [38], но был обобщен на более абстрактные пространства и играет фундаментальную роль в изучении случайных мер, [150] [151] , что требует понимания математических областей, таких как теория вероятностей, теория меры и топология. [152]
В целом, концепция расстояния представляет практический интерес для приложений, в то время как топологическая структура необходима для распределений Пальма, что означает, что точечные процессы обычно определяются на математических пространствах с метриками. [153] Более того, реализация точечного процесса может рассматриваться как счетная мера, поэтому точечные процессы являются типами случайных мер, известных как случайные счетные меры. [117] В этом контексте пуассоновские и другие точечные процессы изучались на локально компактном втором счетном хаусдорфовом пространстве. [154]
Точечный процесс Кокса , процесс Кокса или дважды стохастический процесс Пуассона является обобщением точечного процесса Пуассона, позволяя его мере интенсивности быть также случайной и независимой от лежащего в основе процесса Пуассона. Процесс назван в честь Дэвида Кокса , который ввел его в 1955 году, хотя другие процессы Пуассона со случайными интенсивностями были независимо введены ранее Люсьеном Ле Камом и Морисом Кенуйем. [3] Мера интенсивности может быть реализацией случайной величины или случайного поля. Например, если логарифм меры интенсивности является гауссовым случайным полем , то результирующий процесс известен как логарифмический гауссовский процесс Кокса . [155] В более общем смысле, меры интенсивности являются реализацией неотрицательной локально конечной случайной меры. Точечные процессы Кокса демонстрируют кластеризацию точек, которая, как можно математически показать, больше, чем у точечных процессов Пуассона. Общность и контролепригодность процессов Кокса привели к их использованию в качестве моделей в таких областях, как пространственная статистика [156] и беспроводные сети. [19]
Для данного точечного процесса каждая случайная точка точечного процесса может иметь случайный математический объект, известный как отметка , случайно назначенный ей. Эти отметки могут быть такими же разнообразными, как целые числа, действительные числа, линии, геометрические объекты или другие точечные процессы. [157] [158] Пара, состоящая из точки точечного процесса и соответствующей ей отметки, называется отмеченной точкой, и все отмеченные точки образуют отмеченный точечный процесс . [159] Часто предполагается, что случайные отметки независимы друг от друга и одинаково распределены, однако отметка точки все еще может зависеть от местоположения ее соответствующей точки в базовом (состоянии) пространстве. [160] Если базовый точечный процесс является точечным процессом Пуассона, то результирующий точечный процесс является отмеченным точечным процессом Пуассона . [161]
Если общий точечный процесс определен на некотором математическом пространстве , а случайные метки определены на другом математическом пространстве, то отмеченный точечный процесс определен на декартовом произведении этих двух пространств. Для отмеченного точечного процесса Пуассона с независимыми и одинаково распределенными метками теорема о маркировке [160] [162] утверждает, что этот отмеченный точечный процесс также является (неотмеченным) точечным процессом Пуассона, определенным на вышеупомянутом декартовом произведении двух математических пространств, что неверно для общих точечных процессов.
Составной точечный процесс Пуассона или составной пуассоновский процесс формируется путем добавления случайных значений или весов к каждой точке точечного процесса Пуассона, определенной на некотором базовом пространстве, так что процесс строится из отмеченного точечного процесса Пуассона, где метки образуют набор независимых и одинаково распределенных неотрицательных случайных величин. Другими словами, для каждой точки исходного процесса Пуассона существует независимая и одинаково распределенная неотрицательная случайная величина, а затем составной пуассоновский процесс формируется из суммы всех случайных величин, соответствующих точкам процесса Пуассона, расположенным в некоторой области базового математического пространства. [163]
Если имеется отмеченный точечный процесс Пуассона, образованный из точечного процесса Пуассона (определенного, например, на ) и набора независимых и одинаково распределенных неотрицательных отметок, таких, что для каждой точки процесса Пуассона существует неотрицательная случайная величина , то результирующий сложный процесс Пуассона будет следующим: [164]
где — измеримое по Борелю множество.
Если общие случайные величины принимают значения, например, в -мерном евклидовом пространстве , то полученный сложный пуассоновский процесс является примером процесса Леви при условии, что он образован из однородного точечного процесса, определенного на неотрицательных числах . [165]
Процесс отказа с экспоненциальным сглаживанием функций интенсивности (FP-ESI) является расширением неоднородного процесса Пуассона. Функция интенсивности FP-ESI является экспоненциальной сглаживающей функцией функций интенсивности в последних временных точках возникновения событий и превосходит другие девять стохастических процессов на 8 реальных наборах данных отказов, когда модели используются для подгонки наборов данных, [166] где производительность модели измеряется в терминах AIC ( информационный критерий Акаике ) и BIC ( информационный критерий Байеса ).