stringtranslate.com

L-момент

В статистике L-моменты представляют собой последовательность статистик, используемых для обобщения формы распределения вероятностей . [1] [2] [3] [4] Они являются линейными комбинациями порядковых статистик ( L-статистик ) , аналогичных обычным моментам , и могут использоваться для вычисления величин, аналогичных стандартному отклонению , асимметрии и эксцессу , называемых L-шкалой, L-асимметрией и L-эксцессом соответственно (L-среднее идентично обычному среднему ). Стандартизованные L-моменты называются отношениями L-моментов и аналогичны стандартизованным моментам . Так же, как и обычные моменты, теоретическое распределение имеет набор L-моментов популяции. Выборочные L-моменты могут быть определены для выборки из популяции и могут использоваться в качестве оценок L-моментов популяции.

Популяция L-моментов

Для случайной величины X r - й L-момент популяции равен [1]

где X k:n обозначает статистику порядка k ( k наименьшее значение) в независимой выборке размера n из распределения X и обозначает оператор ожидаемого значения . В частности, первые четыре L-моментов популяции равны

Обратите внимание, что коэффициенты r -го L-момента такие же, как в r -м члене биномиального преобразования , используемого в конечной разности r -го порядка (конечном аналоге производной).

Первые два из этих L-моментов имеют общепринятые названия:

это «среднее», «L-среднее» или «L-расположение»,
это «шкала L».

Шкала L равна половине средней абсолютной разницы . [5]

Примеры L-моментов

Выборочные L-моменты можно вычислить как популяционные L-моменты выборки, суммируя по r -элементным подмножествам выборки, а затем усредняя путем деления на биномиальный коэффициент :

Группировка этих данных по порядковой статистике подсчитывает количество способов, которыми элемент выборки из n  элементов может быть j -м элементом подмножества из r  элементов, и дает формулы вида ниже. Прямые оценки для первых четырех L-моментов в конечной выборке из n  наблюдений: [6]

где x ( i )статистика порядка i и — биномиальный коэффициент . Выборочные L-моменты также могут быть определены косвенно в терминах моментов, взвешенных по вероятности, [1] [7] [8], что приводит к более эффективному алгоритму их вычисления. [6] [9]

Коэффициенты L-моментов

Набор соотношений L-моментов или масштабированных L-моментов определяется как

Наиболее полезные из них называются L-асимметрией и L -эксцессом .

Отношения L-моментов лежат в интервале ( −1, 1 ) . Более строгие границы можно найти для некоторых конкретных отношений L-моментов; в частности, L-эксцесс лежит в [ ⁠−+ 1 /4 , 1 ) ,и

[1]

Также может быть определена величина, аналогичная коэффициенту вариации , но основанная на L-моментах: которая называется «коэффициентом L-вариации», или «L-CV». Для неотрицательной случайной величины это лежит в интервале (0, 1) [1] и идентично коэффициенту Джини . [10]

Связанные величины

L-моменты — это статистические величины, которые выводятся из вероятностно-взвешенных моментов [11] (PWM), которые были определены ранее (1979). [7] PWM используются для эффективной оценки параметров распределений, выражаемых в обратной форме, таких как распределения Гумбеля , [8] лямбда Тьюки и Уэйкби .

Использование

Существует два распространенных способа использования L-моментов, в обоих случаях аналогично обычным моментам:

  1. В качестве сводной статистики для данных.
  2. Вывести оценки параметров распределений вероятностей , применяя метод моментов к L-моментам вместо обычных моментов.

В дополнение к выполнению этих действий со стандартными моментами, последнее (оценка) чаще выполняется с использованием методов максимального правдоподобия ; однако использование L-моментов дает ряд преимуществ. В частности, L-моменты более надежны , чем обычные моменты, и существование более высоких L-моментов требует только, чтобы случайная величина имела конечное среднее значение. Одним из недостатков соотношений L-моментов для оценки является их обычно меньшая чувствительность. Например, распределение Лапласа имеет эксцесс 6 и слабые экспоненциальные хвосты, но большее отношение четвертого L-момента, чем, например, распределение Стьюдента с df=3, которое имеет бесконечный эксцесс и гораздо более тяжелые хвосты.

В качестве примера рассмотрим набор данных с несколькими точками данных и одним выпадающим значением данных. Если взять обычное стандартное отклонение этого набора данных, оно будет сильно зависеть от этой одной точки: однако, если взять L-шкалу, она будет гораздо менее чувствительна к этому значению данных. Следовательно, L-моменты гораздо более значимы при работе с выбросами в данных, чем обычные моменты. Однако есть и другие, более подходящие методы для достижения еще более высокой надежности, чем простая замена моментов L-моментами. Одним из примеров этого является использование L-моментов в качестве сводной статистики в теории экстремальных значений  (EVT). Это приложение показывает ограниченную надежность L-моментов, то есть L-статистика не является устойчивой статистикой , поскольку одно экстремальное значение может ее сбить, но поскольку они являются только линейными (не статистикой более высокого порядка ), они меньше подвержены влиянию экстремальных значений, чем обычные моменты.

Другое преимущество L-моментов перед обычными моментами заключается в том, что для их существования требуется только, чтобы случайная величина имела конечное среднее значение, поэтому L-моменты существуют, даже если не существуют более высокие обычные моменты (например, для распределения Стьюдента с низкими степенями свободы ). Кроме того, требуется конечная дисперсия для того, чтобы стандартные ошибки оценок L-моментов были конечными. [1]

Некоторые упоминания L-моментов в статистической литературе включают книгу Дэвида и Нагараджи (2003, раздел 9.9) [12] и ряд статей. [10] [13] [14] [15] [16] [17] Сообщалось о ряде благоприятных сравнений L-моментов с обычными моментами. [18] [19]

Значения для некоторых распространенных распределений

В таблице ниже приведены выражения для первых двух моментов L и числовые значения первых двух отношений L-моментов некоторых распространенных непрерывных распределений вероятностей с постоянными отношениями L-моментов. [1] [5] Более сложные выражения были выведены для некоторых дополнительных распределений, для которых отношения L-моментов изменяются в зависимости от одного или нескольких параметров распределения, включая логнормальное , гамма , обобщенное Парето , обобщенное экстремальное значение и обобщенные логистические распределения. [1]

Обозначения параметров каждого распределения такие же, как и в связанной статье. В выражении для среднего значения распределения Гумбеля γ eконстанта Эйлера–Маскерони 0,5772 1566 4901 ... .

Расширения

Урезанные L-моменты являются обобщениями L-моментов, которые придают экстремальным наблюдениям нулевой вес. Поэтому они более устойчивы к присутствию выбросов, и в отличие от L-моментов они могут быть хорошо определены для распределений, для которых не существует среднего значения, например, для распределения Коши . [20]

Смотрите также

Ссылки

  1. ^ abcdefgh Хоскинг, Дж. Р. М. (1990). «L-моменты: анализ и оценка распределений с использованием линейных комбинаций порядковых статистик». Журнал Королевского статистического общества, Серия B. 52 ( 1): 105–124. JSTOR  2345653.
  2. ^ Хоскинг, Дж. Р. М. (1992). «Моменты или L-моменты? Пример сравнения двух мер формы распределения». The American Statistician . 46 (3): 186–189. doi :10.2307/2685210. JSTOR  2685210.
  3. ^ Хоскинг, Дж. Р. М. (2006). «О характеристике распределений по их L-моментам». Журнал статистического планирования и вывода . 136 : 193–198. doi : 10.1016/j.jspi.2004.06.004.
  4. ^ Асквит, WH (2011) Распределительный анализ со статистикой L-моментов с использованием среды R для статистических вычислений , Create Space Independent Publishing Platform, [печать по запросу], ISBN 1-463-50841-7 
  5. ^ ab Jones, MC (2002). «Простейшее распределение Стьюдента». Журнал Королевского статистического общества, Серия D. 51 ( 1): 41–49. doi :10.1111/1467-9884.00297. JSTOR  3650389.
  6. ^ ab Wang, QJ (1996). «Прямые выборочные оценки L-моментов». Water Resources Research . 32 (12): 3617–3619. doi :10.1029/96WR02675.
  7. ^ ab Гринвуд, JA; Ландвер, JM; Маталас, NC; Уоллис, JR (1979). «Вероятностные взвешенные моменты: определение и связь с параметрами нескольких распределений, выраженных в обратной форме» (PDF) . Исследования водных ресурсов . 15 (5): 1049–1054. doi :10.1029/WR015i005p01049. S2CID  121955257. Архивировано из оригинала (PDF) 2020-02-10.
  8. ^ ab Ландвер, Дж. М.; Маталас, NC; Уоллис, Дж. Р. (1979). «Вероятностно-взвешенные моменты в сравнении с некоторыми традиционными методами оценки параметров и квантилей Гумбеля». Water Resources Research . 15 (5): 1055–1064. doi :10.1029/WR015i005p01055.
  9. ^ "L-моменты". NIST Dataplot. itl.nist.gov (документация). Национальный институт стандартов и технологий . 6 января 2006 г. Получено 19 января 2013 г.
  10. ^ ab Valbuena, R.; Maltamo, M.; Mehtätalo, L.; Packalen, P. (2017). «Ключевые структурные особенности бореальных лесов могут быть обнаружены напрямую с использованием L-моментов из данных бортового лидара». Дистанционное зондирование окружающей среды . 194 : 437–446. doi :10.1016/j.rse.2016.10.024.
  11. ^ Хоскинг, Дж. Р. М.; Уоллис, Дж. Р. (2005). Анализ региональных частот: подход, основанный на L-моментах. Cambridge University Press. стр. 3. ISBN 978-0521019408. Получено 22 января 2013 г.
  12. ^ Дэвид, HA; Нагараджа, Х.Н. (2003). Статистика заказов (3-е изд.). Уайли. ISBN 978-0-471-38926-2.
  13. ^ Серфлинг, Р.; Сяо, П. (2007). «Вклад в многомерные L-моменты: матрицы L-комментариев». Журнал многомерного анализа . 98 (9): 1765–1781. CiteSeerX 10.1.1.62.4288 . дои :10.1016/j.jmva.2007.01.008. 
  14. ^ Деликадо, П.; Гориа, МН (2008). "Небольшое сравнение методов максимального правдоподобия, моментов и L-моментов для асимметричного экспоненциального распределения мощности". Computational Statistics & Data Analysis . 52 (3): 1661–1673. doi :10.1016/j.csda.2007.05.021.
  15. ^ Alkasasbeh, MR; Raqab, MZ (2009). «Оценка обобщенных параметров логистического распределения: сравнительное исследование». Статистическая методология . 6 (3): 262–279. doi :10.1016/j.stamet.2008.10.001.
  16. ^ Джонс, MC (2004). «О некоторых выражениях для дисперсии, ковариации, асимметрии и L-моментов». Журнал статистического планирования и вывода . 126 (1): 97–106. doi :10.1016/j.jspi.2003.09.001.
  17. ^ Джонс, MC (2009). «Распределение Кумарасвами: распределение бета-типа с некоторыми преимуществами в плане управляемости». Статистическая методология . 6 (1): 70–81. doi :10.1016/j.stamet.2008.04.001.
  18. ^ Ройстон, П. (1992). «Какие меры асимметрии и эксцесса являются лучшими?». Статистика в медицине . 11 (3): 333–343. doi :10.1002/sim.4780110306. PMID  1609174.
  19. ^ Ulrych, TJ; Velis, DR; Woodbury, AD; Sacchi, MD (2000). «L-моменты и C-моменты». Стохастические экологические исследования и оценка рисков . 14 (1): 50–68. doi :10.1007/s004770050004. S2CID  120542594.
  20. ^ Эламир, Эльсаид AH; Сехельт, Аллан Х. (2003). «Усеченные L-моменты». Вычислительная статистика и анализ данных . 43 (3): 299–314. doi :10.1016/S0167-9473(02)00250-5.

Внешние ссылки