stringtranslate.com

Распределение Вейбулла

В теории вероятностей и статистике распределение Вейбулла / ˈ w b ʊ l / является непрерывным распределением вероятностей . Он моделирует широкий диапазон случайных величин, в основном таких как время до отказа или время между событиями. Примерами могут служить максимальное количество осадков за один день и время, которое пользователь проводит на веб-странице.

Распределение названо в честь шведского математика Валодди Вейбулла , который подробно описал его в 1939 году [1] , хотя впервые оно было идентифицировано Морисом Рене Фреше и впервые применено Розином и Раммлером (1933) для описания распределения частиц по размерам .

Определение

Стандартная параметризация

Функция плотности вероятности случайной величины Вейбулла равна [2] [3]

где k > 0 — параметр формы , а λ > 0 — параметр масштаба распределения. Его дополнительная кумулятивная функция распределения представляет собой растянутую экспоненциальную функцию . Распределение Вейбулла связано с рядом других распределений вероятностей; в частности, он интерполирует между экспоненциальным распределением ( k = 1) и распределением Рэлея ( k = 2 и [4] ).

Если величина X представляет собой «время до отказа», распределение Вейбулла дает распределение, для которого интенсивность отказов пропорциональна степени времени. Параметр формы k равен этой степени плюс единица, поэтому этот параметр можно интерпретировать непосредственно следующим образом: [5]

В области материаловедения параметр формы распределения сил известен как модуль Вейбулла . В контексте распространения инноваций распределение Вейбулла представляет собой «чистую» модель имитации/отвержения.

Альтернативные параметризации

Первая альтернатива

Приложения в медицинской статистике и эконометрике часто используют другую параметризацию. [7] [8] Параметр формы k такой же, как указано выше, а параметр масштаба равен . В этом случае для x ≥ 0 функция плотности вероятности равна

кумулятивная функция распределения

функция опасности

и среднее значение

Вторая альтернатива

Также можно найти вторую альтернативную параметризацию. [9] [10] Параметр формы k такой же, как и в стандартном случае, а параметр масштаба λ заменяется параметром скорости β = 1/ λ . Тогда для x ≥ 0 функция плотности вероятности равна

кумулятивная функция распределения

а функция опасности равна

Во всех трех параметризациях опасность уменьшается при k < 1, увеличивается при k > 1 и остается постоянной при k = 1, и в этом случае распределение Вейбулла сводится к экспоненциальному распределению.

Характеристики

Функция плотности

Вид функции плотности распределения Вейбулла резко меняется с изменением значения k . При 0 < k < 1 функция плотности стремится к ∞ при приближении x к нулю сверху и строго убывает. При k = 1 функция плотности стремится к 1/ λ при приближении x к нулю сверху и строго убывает. При k > 1 функция плотности стремится к нулю по мере приближения x к нулю сверху, возрастает до своей моды и убывает после нее. Функция плотности имеет бесконечный отрицательный наклон при x = 0, если 0 < k < 1, бесконечный положительный наклон при x = 0, если 1 < k < 2, и нулевой наклон при x = 0, если k > 2. Для k = 1 плотность имеет конечный отрицательный наклон при x = 0. Для k = 2 плотность имеет конечный положительный наклон при x = 0. Когда k стремится к бесконечности, распределение Вейбулла сходится к дельта-распределению Дирака с центром в точке x = λ. При этом асимметрия и коэффициент вариации зависят только от параметра формы. Обобщением распределения Вейбулла является гиперболатическое распределение типа III .

Кумулятивная функция распределения

Кумулятивная функция распределения для распределения Вейбулла равна

для x ≥ 0 и F ( x ; k ; λ) = 0 для x < 0.

Если x = λ, то F ( x ; k ; λ) = 1 −  e −1 ≈ 0,632 для всех значений  k . И наоборот: при F ( x ; k ; λ ) = 0,632 значение  x  ≈  λ .

Функция квантиля (обратного кумулятивного распределения) для распределения Вейбулла:

для 0 ≤ p < 1.

Интенсивность отказов h (или функция опасности) определяется выражением

Среднее время наработки на отказ составляет

Моменты

Моментная производящая функция логарифма распределенной случайной величины Вейбулла имеет вид [ 11]

где Γгамма-функция . Аналогично, характеристическая функция журнала X определяется выражением

В частности, n исходный момент X определяется выражением

Среднее значение и дисперсия случайной величины Вейбулла можно выразить как

и

Асимметрия определяется

где , что также можно записать как

где среднее значение обозначается µ , а стандартное отклонение обозначается σ .

Избыточный эксцесс определяется выражением

где . Избыток эксцесса также можно записать как:

Функция генерации момента

Для производящей функции момента самого X доступно множество выражений . В качестве степенного ряда , поскольку исходные моменты уже известны, мы имеем

Альтернативно можно попытаться разобраться непосредственно с интегралом

Если параметр k предполагается рациональным числом, выраженным как k = p / q , где p и q — целые числа, то этот интеграл можно вычислить аналитически. [12] Заменив t на − t , получим

где GG-функция Мейера .

Характеристическая функция также была получена Muraleedharan et al. (2007). Характеристическая функция и производящая момент функция трехпараметрического распределения Вейбулла также были получены Муралидхараном и Соаресом (2014) прямым подходом.

Минимумы

Пусть – независимые и одинаково распределенные случайные величины Вейбулла с параметром масштаба и параметром формы . Если минимум этих случайных величин равен , то кумулятивное распределение вероятностей, заданное формулой

То есть также будет распределение Вейбулла с параметром масштаба и параметром формы .

Трюки с репараметризацией

Исправьте некоторые . Пусть неотрицательны, а не все нули, и пусть независимые выборки , тогда [13]

Энтропия Шеннона

Информационная энтропия определяется выражением

где – постоянная Эйлера–Машерони . Распределение Вейбулла — это максимальное распределение энтропии для неотрицательной действительной случайной величины с фиксированным ожидаемым значением x k , равным λ k , и фиксированным ожидаемым значением ln( x k ), равным ln( λ k ) −  .

Оценка параметров

Максимальная вероятность

Оценка максимального правдоподобия для данного параметра равна

Оценка максимального правдоподобия является решением для k следующего уравнения [14]

Это уравнение определяет только неявно, его обычно приходится решать численными методами.

Когда самые большие наблюдаемые выборки из набора данных состоят из более чем выборок, тогда оценка максимального правдоподобия для данного параметра равна [14]

Также, учитывая это условие, оценка максимального правдоподобия для [ нужна ссылка ]

Опять же, поскольку это неявная функция, ее обычно приходится решать численными методами.

Расхождение Кульбака – Лейблера

Расхождение Кульбака –Лейблера между двумя распределениями Вейбулла определяется выражением [15]

сюжет Вейбулла

сюжет Вейбулла

Соответствие распределения Вейбулла данным можно оценить визуально с помощью графика Вейбулла. [16] График Вейбулла представляет собой график эмпирической кумулятивной функции распределения данных по специальным осям в виде графика Q – Q. Оси против . Причиной такой замены переменных является то, что кумулятивную функцию распределения можно линеаризовать:

которая, как можно видеть, имеет стандартную форму прямой линии. Следовательно, если данные получены из распределения Вейбулла, то на графике Вейбулла ожидается прямая линия.

Существуют различные подходы к получению эмпирической функции распределения на основе данных: один метод заключается в получении вертикальной координаты для каждой точки, используя где – ранг точки данных, а – количество точек данных. [17]

Линейную регрессию также можно использовать для численной оценки согласия и оценки параметров распределения Вейбулла. Градиент напрямую информирует о параметре формы , также можно вывести параметр масштаба .

Приложения

Используется распределение Вейбулла .

Подобрано кумулятивное распределение Вейбулла для максимального количества осадков за один день с использованием CumFreq , см. также подбор распределения [18]
Подогнанные кривые для данных временных рядов добычи нефти [19]

Связанные дистрибутивы

Смотрите также

Рекомендации

  1. ^ Бауэрс и др. ал. (1997) Актуарная математика, 2-е изд. Общество актуариев.
  2. ^ Папулис, Афанасиос Папулис; Пиллаи, С. Унникришна (2002). Вероятность, случайные величины и случайные процессы (4-е изд.). Бостон: МакГроу-Хилл. ISBN 0-07-366011-6.
  3. ^ Кизилерсу, Айше; Крир, Маркус; Томас, Энтони В. (2018). «Распределение Вейбулла». Значение . 15 (2): 10–11. дои : 10.1111/j.1740-9713.2018.01123.x .
  4. ^ «Распределение Рэлея – MATLAB и Simulink – MathWorks Australia». www.mathworks.com.au .
  5. ^ Цзян, Р.; Мурти, DNP (2011). «Исследование параметра формы Вейбулла: свойства и значение». Проектирование надежности и системная безопасность . 96 (12): 1619–26. дои : 10.1016/j.ress.2011.09.003.
  6. ^ Элиазар, Иддо (ноябрь 2017 г.). «Закон Линди». Физика А: Статистическая механика и ее приложения . 486 : 797–805. Бибкод : 2017PhyA..486..797E. doi :10.1016/j.physa.2017.05.077. S2CID  125349686.
  7. ^ Коллетт, Дэвид (2015). Моделирование данных о выживаемости в медицинских исследованиях (3-е изд.). Бока-Ратон: Чепмен и Холл / CRC. ISBN 978-1439856789.
  8. ^ Кэмерон, AC; Триведи, ПК (2005). Микроэконометрика: методы и приложения . п. 584. ИСБН 978-0-521-84805-3.
  9. ^ Калбфляйш, JD; Прентис, Р.Л. (2002). Статистический анализ данных о времени отказа (2-е изд.). Хобокен, Нью-Джерси: Дж. Уайли. ISBN 978-0-471-36357-6. ОСЛК  50124320.
  10. ^ Терно, Т. (2020). «Пакет для анализа выживания в R». Пакет R версии 3.1.
  11. ^ abc Джонсон, Коц и Балакришнан 1994 г.
  12. ^ См. (Cheng, Tellambura & Beaulieu 2004) случай, когда k является целым числом, и (Sagias & Karagiannidis 2005) для рационального случая.
  13. ^ Балог, Матей; Трипуранени, Нилеш; Гахрамани, Зубин; Веллер, Адриан (17 июля 2017 г.). «Потерянные родственники трюка с Гамбелем». Международная конференция по машинному обучению . ПМЛР: 371–379.
  14. ^ аб Сорнетт, Д. (2004). Критические явления в естествознании: хаос, фракталы, самоорганизация и беспорядок ..
  15. ^ Баукхаге, Кристиан (2013). «Вычисление расхождения Кульбака-Лейблера между двумя распределениями Вейбулла». arXiv : 1310.3713 [cs.IT].
  16. ^ "1.3.3.30. График Вейбулла" . www.itl.nist.gov .
  17. ^ Уэйн Нельсон (2004) Прикладной анализ жизненных данных . ISBN Уайли-Блэквелла 0-471-64462-5 
  18. ^ «CumFreq, Подбор распределения вероятности, бесплатное программное обеспечение, кумулятивная частота» .
  19. ^ Аб Ли, Се Юн; Маллик, Бани (2021). «Байесовское иерархическое моделирование: применение к результатам добычи в сланцах Игл Форд в Южном Техасе». Санкхья Б. 84 : 1–43. дои : 10.1007/s13571-020-00245-8 .
  20. ^ "Распределение скорости ветра Вейбулл - REUK.co.uk" . www.reuk.co.uk. _
  21. ^ Лю, Чао; Уайт, Райен В.; Дюмэ, Сьюзен (19 июля 2010 г.). Понимание поведения при просмотре веб-страниц посредством анализа времени пребывания по Вейбуллу . АКМ. стр. 379–386. дои : 10.1145/1835449.1835513. ISBN 9781450301534. S2CID  12186028.
  22. ^ Шариф, М. Наваз; Ислам, М.Назрул (1980). «Распределение Вейбулла как общая модель прогнозирования технологических изменений». Технологическое прогнозирование и социальные изменения . 18 (3): 247–56. дои : 10.1016/0040-1625(80)90026-8.
  23. ^ Вычислительная оптимизация двигателя внутреннего сгорания, стр. 49
  24. ^ Остин, LG; Климпель, Р.Р.; Лаки, ПТ (1984). Технология уменьшения габаритов . Хобокен, Нью-Джерси: ISBN Guinn Printing Inc. 0-89520-421-5.
  25. ^ Чандрашекар, С. (1943). «Стохастические проблемы физики и астрономии». Обзоры современной физики . 15 (1): 86.
  26. ^ ECSS-E-ST-10-12C - Методы расчета полученной радиации и ее последствий, а также политика расчетных пределов (Отчет). Европейское сотрудничество по космической стандартизации. 15 ноября 2008 г.
  27. ^ LD Эдмондс; CE Барнс; Л. З. Шейк (май 2000 г.). «8.3 Подгонка кривой». Введение в воздействие космического излучения на микроэлектронику (PDF) (Отчет). Лаборатория реактивного движения НАСА, Калифорнийский технологический институт. стр. 75–76.
  28. ^ «Эволюция системы и надежность систем». Сысев (Бельгия). 01.01.2010.
  29. ^ Монтгомери, Дуглас (19 июня 2012 г.). Введение в статистический контроль качества . [Sl]: Джон Уайли. п. 95. ИСБН 9781118146811.
  30. ^ Чатфилд, К.; Гудхардт, Дж.Дж. (1973). «Модель потребительских закупок с Эрлангом времени между покупками». Журнал Американской статистической ассоциации . 68 (344): 828–835. дои : 10.1080/01621459.1973.10481432.

Библиография

Внешние ссылки