Эмпирическая вероятность

В теории вероятностей и статистике эмпирическое правдоподобие ( EL ) — непараметрический метод оценки параметров статистических моделей . Он требует меньше предположений о распределении ошибок , сохраняя при этом некоторые преимущества вывода, основанного на правдоподобии . Метод оценки требует, чтобы данные были независимыми и одинаково распределенными (iid). Он работает хорошо, даже когда распределение асимметрично или подвергается цензуре . ^[1] Методы EL также могут обрабатывать ограничения и априорную информацию о параметрах. Арт Оуэн стал пионером в этой области в своей статье 1988 года. ^[2]

Определение

Учитывая набор реализаций случайных величин iid , эмпирическая функция распределения равна , с индикаторной функцией и (нормализованными) весами . Тогда эмпирическая вероятность равна: ^[3] $п$ $y_{i}$ $Y_{i}$ ${\hat {F}}(y):=\sum _{i=1}^{n}\pi _{i}I(Y_{i}<y)$ $I$ $\pi _{i}$

L:=\prod _{i=1}^{n}{\frac {{\hat {F}}(y_{i})-{\hat {F}}(y_{i}-\ дельта y)}{\delta y}},

где – небольшое число (потенциально разница со следующей меньшей выборкой). $\delta y$

Эмпирическую оценку правдоподобия можно дополнить дополнительной информацией, используя дополнительные ограничения (аналогично подходу с использованием обобщенных уравнений оценки ) для эмпирической функции распределения. Например, ограничение, подобное следующему, может быть введено с использованием множителя Лагранжа , что подразумевает . $E[h(Y;\theta)]=\int _{-\infty }^{\infty }h(y;\theta)dF=0$ ${\hat {E}}[h(y;\theta)]=\sum _{i=1}^{n}h(y_{i};\theta)\pi _{i}=0$

С аналогичными ограничениями мы могли бы также смоделировать корреляцию.

Дискретные случайные величины

Метод эмпирического правдоподобия также можно использовать для дискретных распределений . ^[4] Учитывая , что $\ p_{i}:={\hat {F}}(y_{i})-{\hat {F}}(y_{i}-\delta y),\ i=1,... ,n$ $p_{i}\geq 0{\text{ and }}\sum _{i=1}^{n}\ p_{i}=1.$

Тогда эмпирическая вероятность снова равна . $L(p_{1},...,p_{n})=\prod _{i=1}^{n}\ p_{i}$

Используя метод множителей Лагранжа для максимизации логарифма эмпирического правдоподобия с учетом тривиального ограничения нормализации, мы находим максимум. Следовательно, – эмпирическая функция распределения . $p_{i}=1/n$ ${\шляпа {F}}$

Процедура оценки

Оценки EL рассчитываются путем максимизации эмпирической функции правдоподобия (см. выше) с учетом ограничений, основанных на оценочной функции и тривиальном предположении, что сумма вероятностных весов функции правдоподобия равна 1. ^[5] Эта процедура представляется как:

\max _{\pi _{i},\theta }\ln(L)=\max _{\pi _{i},\theta }\sum _{i=1}^{n}\ ln \pi _{i}

с учетом ограничений

st\sum _{i=1}^{n}\pi _{i}=1,\sum _{i=1}^{n}\pi _{i}h(y_{i}; \theta )=0,\forall i\in [1..n]\quad 0\leq \pi _{i}.

^[6]^{: Уравнение (73)}

Значение тета-параметра можно найти, решив функцию Лагранжа

{\mathcal {L}}=\sum _{i=1}^{n}\ln \pi _{i}+\mu (1-\sum _{i=1}^{n}\ pi _{i})-n\tau '\sum _{i=1}^{n}\pi _{i}h(y_{i};\theta ).

^[6]^{: Уравнение (74)}

Существует явная аналогия между этой задачей максимизации и проблемой, решенной для максимальной энтропии .

Параметры являются мешающими параметрами . $\pi _{i}$

Эмпирический коэффициент правдоподобия (ELR)

Эмпирическая функция отношения правдоподобия определяется и используется для получения интересующего параметра доверительных интервалов θ, аналогичного доверительным интервалам параметрического отношения правдоподобия. ^[7]^[8] Пусть L(F) будет эмпирическим правдоподобием функции , тогда ELR будет: $F$

$R(F)=L(F)/L(F_{n})$ .

Рассмотрим множества вида

$C=\{T(F)|R(F)\geq r\}$ .

В таких условиях тест отклоняет, когда t не принадлежит , то есть когда ни одно распределение F с не имеет правдоподобия . ${\ displaystyle T (F) = t}$ $C$ ${\ displaystyle T (F) = t}$ ${\ displaystyle L (F) \ geq rL (F_ {n})}$

Центральный результат касается среднего значения X. Очевидно, что необходимы некоторые ограничения на , иначе всякий раз, когда . Чтобы увидеть это, позвольте: $F$ $C=\mathbb {R} ^{p}$ $г<1$

$F=\epsilon \delta _{x}+(1-\epsilon)F_{n}$

Если достаточно мало и , то . $\epsilon$ $\epsilon >0$ ${\ displaystyle R (F) \ geq r}$

Но тогда, как проходит через , так же и среднее значение , выслеживая . Проблему можно решить, ограничившись распределениями F, которые поддерживаются в ограниченном множестве. Оказывается, можно ограничить внимание распределениями с поддержкой в выборке, другими словами, распределением . Такой метод удобен, поскольку статистик может не захотеть указать ограниченный носитель для и поскольку преобразует построение в конечномерную задачу. $x$ $\mathbb {R} ^{p}$ $F$ $C=\mathbb {R} ^{p}$ $F\ll F_{n}$ $F$ $t$ $C$

Другие приложения

Использование эмпирического правдоподобия не ограничивается доверительными интервалами. В эффективной квантильной регрессии процедура категоризации на основе EL ^[9] помогает определить форму истинного дискретного распределения на уровне p, а также обеспечивает способ формулирования непротиворечивой оценки. Кроме того, EL можно использовать вместо параметрического правдоподобия для формирования критериев выбора модели . ^[10] Эмпирическое правдоподобие может естественным образом применяться в анализе выживаемости ^[11] или в задачах регрессии ^[12]

Смотрите также

Литература

Нордман, Дэниел Дж. и Сумендра Н. Лахири. «Обзор методов эмпирического правдоподобия для временных рядов». Журнал статистического планирования и вывода 155 (2014): 1-18. https://doi.org/10.1016/j.jspi.2013.10.001