stringtranslate.com

Распределение Вейбулла

В теории вероятностей и статистике распределение Вейбулла / ˈ w b ʊ l / является непрерывным распределением вероятностей . Оно моделирует широкий диапазон случайных величин, в основном в природе времени до отказа или времени между событиями. Примерами являются максимальные однодневные осадки и время, которое пользователь проводит на веб-странице.

Распределение названо в честь шведского математика Валлодди Вейбулла , который подробно описал его в 1939 году [1] [2], хотя впервые оно было идентифицировано Рене Морисом Фреше и впервые применено Розином и Раммлером (1933) для описания распределения частиц по размерам .

Определение

Стандартная параметризация

Функция плотности вероятности случайной величины Вейбулла равна [3] [4]

где k > 0 — параметр формы , а λ > 0 — параметр масштаба распределения. Его дополнительная кумулятивная функция распределениярастянутая экспоненциальная функция . Распределение Вейбулла связано с рядом других распределений вероятностей; в частности, оно интерполирует между экспоненциальным распределением ( k = 1) и распределением Рэлея ( k = 2 и [5] ).

Если величина x является "временем до отказа", распределение Вейбулла дает распределение, для которого интенсивность отказов пропорциональна мощности времени. Параметр формы k равен этой мощности плюс один, и поэтому этот параметр можно интерпретировать непосредственно следующим образом: [6]

В области материаловедения параметр формы k распределения прочности известен как модуль Вейбулла . В контексте диффузии инноваций распределение Вейбулла является «чистой» моделью имитации/отторжения.

Альтернативные параметризации

Первая альтернатива

Приложения в медицинской статистике и эконометрике часто принимают другую параметризацию. [8] [9] Параметр формы k такой же, как и выше, в то время как параметр масштаба равен . В этом случае для x ≥ 0 функция плотности вероятности равна

кумулятивная функция распределения равна

функция квантиля равна

функция опасности - это

и среднее значение равно

Вторая альтернатива

Также можно найти вторую альтернативную параметризацию. [10] [11] Параметр формы k такой же, как и в стандартном случае, в то время как параметр масштаба λ заменяется параметром скорости β = 1/ λ . Тогда для x ≥ 0 функция плотности вероятности равна

кумулятивная функция распределения равна

функция квантиля равна

и функция опасности равна

Во всех трех параметризациях риск уменьшается при k < 1, увеличивается при k > 1 и постоянен при k = 1, в этом случае распределение Вейбулла сводится к экспоненциальному распределению.

Характеристики

Функция плотности

Форма функции плотности распределения Вейбулла радикально меняется со значением k . Для 0 < k < 1 функция плотности стремится к ∞, когда x приближается к нулю сверху, и строго убывает. Для k = 1 функция плотности стремится к 1/ λ, когда x приближается к нулю сверху, и строго убывает. Для k > 1 функция плотности стремится к нулю, когда x приближается к нулю сверху, увеличивается до своей моды и уменьшается после нее. Функция плотности имеет бесконечный отрицательный наклон при x = 0, если 0 < k < 1, бесконечный положительный наклон при x = 0, если 1 < k < 2, и нулевой наклон при x = 0, если k > 2. Для k = 1 плотность имеет конечный отрицательный наклон при x = 0. Для k = 2 плотность имеет конечный положительный наклон при x = 0. Когда k стремится к бесконечности, распределение Вейбулла сходится к дельта-распределению Дирака с центром в точке x = λ. При этом асимметрия и коэффициент вариации зависят только от параметра формы. Обобщением распределения Вейбулла является гиперболастическое распределение типа III .

Кумулятивная функция распределения

Кумулятивная функция распределения для распределения Вейбулла имеет вид

для x ≥ 0 и F ( x ; k ; λ) = 0 для x < 0.

Если x = λ, то F ( x ; k ; λ) = 1 −  e −1 ≈ 0,632 для всех значений  k . Наоборот: при F ( x ; k ; λ ) = 0,632 значение  x  ≈  λ .

Функция квантиля (обратного кумулятивного распределения) для распределения Вейбулла имеет вид

для 0 ≤ p < 1.

Интенсивность отказов h (или функция опасности) определяется по формуле

Среднее время между отказами MTBF составляет

Моменты

Функция генерации моментов логарифма случайной величины, распределенной по закону Вейбулла, определяется выражением [12]

где Γгамма-функция . Аналогично, характеристическая функция log X задается выражением

В частности, n- й сырой момент X определяется как

Среднее значение и дисперсию случайной величины Вейбулла можно выразить как

и

Асимметрия определяется как

где , что также может быть записано как

где среднее значение обозначается как μ , а стандартное отклонение обозначается как σ .

Избыточный эксцесс определяется по формуле

где . Эксцесс эксцесса может быть также записан как:

Функция создания момента

Для функции генерации моментов самого X доступны различные выражения . Как степенной ряд , поскольку исходные моменты уже известны, можно иметь

В качестве альтернативы можно попытаться иметь дело непосредственно с интегралом

Если параметр k предполагается рациональным числом, выраженным как k = p / q , где p и q — целые числа, то этот интеграл можно вычислить аналитически. [13] Заменив t на − t , можно найти

где GG-функция Мейера .

Характеристическая функция также была получена Муралидхараном и др. (2007). Характеристическая функция и функция генерации моментов 3-параметрического распределения Вейбулла также были получены Муралидхараном и Соаресом (2014) прямым подходом.

Минимумы

Пусть будут независимыми и одинаково распределенными случайными величинами Вейбулла с параметром масштаба и параметром формы . Если минимум этих случайных величин равен , то кумулятивное распределение вероятностей задается как

То есть, также будет распределено Вейбулл с параметром масштаба и параметром формы .

Трюки репараметризации

Зафиксируем некоторые . Пусть будут неотрицательными, и не все нулевыми, и пусть будут независимыми выборками , тогда [14]

энтропия Шеннона

Информационная энтропия определяется по формуле [15]

где — константа Эйлера–Маскерони . Распределение Вейбулла — это распределение максимальной энтропии для неотрицательной действительной случайной величины с фиксированным ожидаемым значением x k , равным λ k , и фиксированным ожидаемым значением ln( x k ), равным ln( λ k ) −  .

Расхождение Кульбака–Лейблера

Расхождение Кульбака –Лейблера между двумя распределениями Вейбулла определяется выражением [16]

Оценка параметров

Наименьший квадрат с использованием графика Вейбулла

График Вейбулла

Соответствие распределения Вейбулла данным можно визуально оценить с помощью графика Вейбулла. [17] График Вейбулла — это график эмпирической кумулятивной функции распределения данных по специальным осям в виде графика типа Q–Q . Оси представляют собой зависимость от . Причина такого изменения переменных заключается в том, что кумулятивную функцию распределения можно линеаризировать:

что можно увидеть в стандартной форме прямой линии. Таким образом, если данные получены из распределения Вейбулла, то на графике Вейбулла ожидается прямая линия.

Существуют различные подходы к получению эмпирической функции распределения из данных. Один из методов заключается в получении вертикальной координаты для каждой точки с помощью

,

где — ранг точки данных, а — количество точек данных. [18] [19] Другой распространенной оценкой [20] является

.

Линейная регрессия также может быть использована для численной оценки соответствия и оценки параметров распределения Вейбулла. Градиент напрямую информирует о параметре формы , а параметр масштаба также может быть выведен.

Метод моментов

Коэффициент вариации распределения Вейбулла зависит только от параметра формы: [21]

Приравнивая величины выборки к , моментную оценку параметра формы можно считать либо из таблицы поиска, либо из графика зависимости от . Более точную оценку можно найти, используя алгоритм поиска корня для решения

Оценку момента параметра масштаба можно затем найти с помощью уравнения первого момента как

Максимальная вероятность

Оценка максимального правдоподобия для данного параметра равна [21]

Оценка максимального правдоподобия для является решением для k следующего уравнения [22]

Это уравнение определяет только неявно, его обычно приходится решать численными методами.

Когда наибольшие наблюдаемые выборки из набора данных, состоящего из более чем выборок, то оценка максимального правдоподобия для заданного параметра равна [22]

Также, учитывая это условие, оценка максимального правдоподобия для равна [ необходима ссылка ]

Опять же, поскольку это неявная функция, ее обычно приходится решать численными методами.

Приложения

Используется распределение Вейбулла [ требуется ссылка ]

Подогнанное кумулятивное распределение Вейбулла к максимальному количеству осадков за один день с использованием CumFreq , см. также подгонку распределения [23]
Подогнанных кривых для данных временного ряда добычи нефти [24]

Связанные дистрибутивы

Смотрите также

Ссылки

  1. ^ В. Вейбулл (1939). «Статистическая теория сопротивления материалов». Академия Ingeniors Vetenskaps Handlingar (151). Стокгольм: Generalstabens Litografiska Anstalts Förlag: 1–45.
  2. ^ Боуэрс и др. (1997) Актуарная математика, 2-е изд. Общество актуариев.
  3. ^ Папулис, Афанасиос Папулис; Пиллаи, С. Унникришна (2002). Вероятность, случайные величины и стохастические процессы (4-е изд.). Бостон: McGraw-Hill. ISBN 0-07-366011-6.
  4. ^ Кизилерсу, Айсе; Креер, Маркус; Томас, Энтони В. (2018). «Распределение Вейбулла». Значимость . 15 (2): 10–11. doi : 10.1111/j.1740-9713.2018.01123.x .
  5. ^ «Распределение Рэлея – MATLAB и Simulink – MathWorks Australia». www.mathworks.com.au .
  6. ^ Цзян, Р.; Мурти, DNP (2011). «Исследование параметра формы Вейбулла: свойства и значение». Надежность техники и безопасность систем . 96 (12): 1619–26. doi :10.1016/j.ress.2011.09.003.
  7. ^ Элиазар, Иддо (ноябрь 2017 г.). «Закон Линди». Physica A: Статистическая механика и ее приложения . 486 : 797–805. Bibcode : 2017PhyA..486..797E. doi : 10.1016/j.physa.2017.05.077. S2CID  125349686.
  8. ^ Коллетт, Дэвид (2015). Моделирование данных о выживаемости в медицинских исследованиях (3-е изд.). Бока-Ратон: Chapman and Hall / CRC. ISBN 978-1439856789.
  9. ^ Кэмерон, AC; Триведи, PK (2005). Микроэконометрика: методы и приложения . Cambridge University Press. стр. 584. ISBN 978-0-521-84805-3.
  10. ^ Kalbfleisch, JD; Prentice, RL (2002). Статистический анализ данных о времени отказа (2-е изд.). Hoboken, NJ: J. Wiley. ISBN 978-0-471-36357-6. OCLC  50124320.
  11. ^ Терно, Т. (2020). «Пакет для анализа выживания в R». Версия пакета R 3.1.
  12. ^ abc Джонсон, Коц и Балакришнан 1994
  13. ^ См. (Cheng, Tellambura & Beaulieu 2004) для случая, когда k является целым числом, и (Sagias & Karagiannidis 2005) для рационального случая.
  14. ^ Балог, Матей; Трипуранени, Нилеш; Гахрамани, Зубин; Веллер, Адриан (2017-07-17). «Потерянные родственники трюка Гумбеля». Международная конференция по машинному обучению . PMLR: 371–379.
  15. ^ Чо, Ёнсык; Сан, Хокеун; Ли, Кёнджун (5 января 2015 г.). «Оценка энтропии распределения Вейбулла при обобщенном прогрессивном гибридном цензурировании». Энтропия . 17 (1): 102–122. doi : 10.3390/e17010102 . ISSN  1099-4300.
  16. ^ Bauckhage, Christian (2013). «Вычисление расхождения Кульбака-Лейблера между двумя распределениями Вейбулла». arXiv : 1310.3713 [cs.IT].
  17. ^ "1.3.3.30. График Вейбулла". www.itl.nist.gov .
  18. ^ Уэйн Нельсон (2004) Прикладной анализ данных о жизни . Wiley-Blackwell ISBN 0-471-64462-5 
  19. ^ Барнетт, В. (1975). «Методы построения вероятностных диаграмм и порядковая статистика». Журнал Королевского статистического общества. Серия C (Прикладная статистика) . 24 (1): 95–108. doi :10.2307/2346708. ISSN  0035-9254. JSTOR  2346708.
  20. ^ ISO 20501:2019 — Тонкая керамика (высококачественная керамика, высококачественная техническая керамика) — Статистика Вейбулла для определения прочностных характеристик.
  21. ^ ab Cohen, A. Clifford (ноябрь 1965 г.). «Оценка максимального правдоподобия в распределении Вейбулла на основе полных и цензурированных выборок» (PDF) . Technometrics . 7 (4): 579–588. doi :10.1080/00401706.1965.10490300.
  22. ^ ab Sornette, D. (2004). Критические явления в естественных науках: хаос, фракталы, самоорганизация и беспорядок ..
  23. ^ "CumFreq, Подгонка распределения вероятности, свободное программное обеспечение, кумулятивная частота".
  24. ^ ab Lee, Se Yoon; Mallick, Bani (2021). «Байесовское иерархическое моделирование: применение к результатам добычи в сланцевом месторождении Игл-Форд в Южном Техасе». Sankhya B . 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
  25. ^ «Распределение скорости ветра Вейбулла – REUK.co.uk». www.reuk.co.uk .
  26. ^ Лю, Чао; Уайт, Райен В.; Дюмейс, Сьюзан (2010-07-19). Понимание поведения при просмотре веб-страниц с помощью анализа времени пребывания по методу Вейбулла . ACM. стр. 379–386. doi :10.1145/1835449.1835513. ISBN 9781450301534. S2CID  12186028.
  27. ^ Шариф, М. Наваз; Ислам, М. Назрул (1980). «Распределение Вейбулла как общая модель для прогнозирования технологических изменений». Технологическое прогнозирование и социальные изменения . 18 (3): 247–56. doi :10.1016/0040-1625(80)90026-8.
  28. ^ Вычислительная оптимизация двигателя внутреннего сгорания, стр. 49
  29. ^ Остин, LG; Климпель, RR; Лаки, PT (1984). Технология процесса уменьшения размера . Хобокен, Нью-Джерси: Guinn Printing Inc. ISBN 0-89520-421-5.
  30. ^ Чандрашекар, С. (1943). «Стохастические проблемы в физике и астрономии». Обзоры современной физики . 15 (1): 86.
  31. ^ ECSS-E-ST-10-12C – Методы расчета полученного излучения и его эффектов, а также политика в отношении проектных запасов (Отчет). Европейское сотрудничество по космической стандартизации. 15 ноября 2008 г.
  32. ^ LD Edmonds; CE Barnes; LZ Scheick (май 2000 г.). «8.3 Подгонка кривой». Введение в эффекты космической радиации на микроэлектронику (PDF) (Отчет). Лаборатория реактивного движения NASA, Калифорнийский технологический институт. стр. 75–76.
  33. ^ "Эволюция систем и надежность систем". Sysev (Бельгия). 2010-01-01.
  34. ^ Монтгомери, Дуглас (2012-06-19). Введение в статистический контроль качества . [Sl]: John Wiley. стр. 95. ISBN 9781118146811.
  35. ^ Чатфилд, К.; Гудхардт, Г.Дж. (1973). «Модель потребительских покупок с интервалами между покупками Эрланга». Журнал Американской статистической ассоциации . 68 (344): 828–835. doi :10.1080/01621459.1973.10481432.

Библиография

Внешние ссылки