В теории вероятностей и статистике распределение Вейбулла / ˈ w aɪ b ʊ l / является непрерывным распределением вероятностей . Он моделирует широкий диапазон случайных величин, в основном таких как время до отказа или время между событиями. Примерами могут служить максимальное количество осадков за один день и время, которое пользователь проводит на веб-странице.
Распределение названо в честь шведского математика Валодди Вейбулла , который подробно описал его в 1939 году [1] , хотя впервые оно было идентифицировано Морисом Рене Фреше и впервые применено Розином и Раммлером (1933) для описания распределения частиц по размерам .
Если величина X представляет собой «время до отказа», распределение Вейбулла дает распределение, для которого интенсивность отказов пропорциональна степени времени. Параметр формы k равен этой степени плюс единица, поэтому этот параметр можно интерпретировать непосредственно следующим образом: [5]
Значение указывает на то, что интенсивность отказов со временем уменьшается (как и в случае эффекта Линди , который, однако, соответствует распределениям Парето [6] , а не распределениям Вейбулла). Это происходит, если наблюдается значительная «детская смертность» или дефектные изделия выходят из строя рано, а частота отказов со временем снижается по мере того, как дефектные изделия отсеиваются из популяции. В контексте диффузии инноваций это означает негативную молву: функция риска представляет собой монотонно убывающую функцию доли усыновителей;
Значение указывает, что интенсивность отказов постоянна во времени. Это может означать, что случайные внешние события вызывают смертность или неудачу. Распределение Вейбулла сводится к экспоненциальному распределению;
Значение указывает на то, что интенсивность отказов увеличивается со временем. Это происходит, если существует процесс «старения» или детали, которые с большей вероятностью выходят из строя с течением времени. В контексте распространения инноваций это означает положительную молву: функция риска представляет собой монотонно возрастающую функцию доли последователей. Функция сначала выпуклая, затем вогнутая с точкой перегиба .
Приложения в медицинской статистике и эконометрике часто используют другую параметризацию. [7] [8] Параметр формы k такой же, как указано выше, а параметр масштаба равен . В этом случае для x ≥ 0 функция плотности вероятности равна
кумулятивная функция распределения
функция опасности
и среднее значение
Вторая альтернатива
Также можно найти вторую альтернативную параметризацию. [9] [10] Параметр формы k такой же, как и в стандартном случае, а параметр масштаба λ заменяется параметром скорости β = 1/ λ . Тогда для x ≥ 0 функция плотности вероятности равна
кумулятивная функция распределения
а функция опасности равна
Во всех трех параметризациях опасность уменьшается при k < 1, увеличивается при k > 1 и остается постоянной при k = 1, и в этом случае распределение Вейбулла сводится к экспоненциальному распределению.
Характеристики
Функция плотности
Вид функции плотности распределения Вейбулла резко меняется с изменением значения k . При 0 < k < 1 функция плотности стремится к ∞ при приближении x к нулю сверху и строго убывает. При k = 1 функция плотности стремится к 1/ λ при приближении x к нулю сверху и строго убывает. При k > 1 функция плотности стремится к нулю по мере приближения x к нулю сверху, возрастает до своей моды и убывает после нее. Функция плотности имеет бесконечный отрицательный наклон при x = 0, если 0 < k < 1, бесконечный положительный наклон при x = 0, если 1 < k < 2, и нулевой наклон при x = 0, если k > 2. Для k = 1 плотность имеет конечный отрицательный наклон при x = 0. Для k = 2 плотность имеет конечный положительный наклон при x = 0. Когда k стремится к бесконечности, распределение Вейбулла сходится к дельта-распределению Дирака с центром в точке x = λ. При этом асимметрия и коэффициент вариации зависят только от параметра формы. Обобщением распределения Вейбулла является гиперболатическое распределение типа III .
Для производящей функции момента самого X доступно множество выражений . В качестве степенного ряда , поскольку исходные моменты уже известны, мы имеем
Альтернативно можно попытаться разобраться непосредственно с интегралом
Если параметр k предполагается рациональным числом, выраженным как k = p / q , где p и q — целые числа, то этот интеграл можно вычислить аналитически. [12] Заменив t на − t , получим
Характеристическая функция также была получена Muraleedharan et al. (2007). Характеристическая функция и производящая момент функция трехпараметрического распределения Вейбулла также были получены Муралидхараном и Соаресом (2014) прямым подходом. harvtxt error: no target: CITEREFMuraleedharanSoares2014 (help)
Минимумы
Пусть – независимые и одинаково распределенные случайные величины Вейбулла с параметром масштаба и параметром формы . Если минимум этих случайных величин равен , то кумулятивное распределение вероятностей, заданное формулой
То есть также будет распределение Вейбулла с параметром масштаба и параметром формы .
Трюки с репараметризацией
Исправьте некоторые . Пусть неотрицательны, а не все нули, и пусть независимые выборки , тогда [13]
Оценка максимального правдоподобия для данного параметра равна
Оценка максимального правдоподобия является решением для k следующего уравнения [14]
Это уравнение определяет только неявно, его обычно приходится решать численными методами.
Когда самые большие наблюдаемые выборки из набора данных состоят из более чем выборок, тогда оценка максимального правдоподобия для данного параметра равна [14]
Также, учитывая это условие, оценка максимального правдоподобия для [ нужна ссылка ]
Опять же, поскольку это неявная функция, ее обычно приходится решать численными методами.
Расхождение Кульбака – Лейблера
Расхождение Кульбака –Лейблера между двумя распределениями Вейбулла определяется выражением [15]
сюжет Вейбулла
Соответствие распределения Вейбулла данным можно оценить визуально с помощью графика Вейбулла. [16] График Вейбулла представляет собой график эмпирической кумулятивной функции распределения данных по специальным осям в виде графика Q – Q. Оси против . Причиной такой замены переменных является то, что кумулятивную функцию распределения можно линеаризовать:
которая, как можно видеть, имеет стандартную форму прямой линии. Следовательно, если данные получены из распределения Вейбулла, то на графике Вейбулла ожидается прямая линия.
Существуют различные подходы к получению эмпирической функции распределения на основе данных: один метод заключается в получении вертикальной координаты для каждой точки, используя где – ранг точки данных, а – количество точек данных. [17]
Линейную регрессию также можно использовать для численной оценки согласия и оценки параметров распределения Вейбулла. Градиент напрямую информирует о параметре формы , также можно вывести параметр масштаба .
В прогнозировании технологических изменений (также известном как модель Шарифа-Ислама) [22]
В гидрологии распределение Вейбулла применяется к экстремальным явлениям, таким как годовое максимальное количество осадков за один день и речной сток.
При анализе кривой снижения для моделирования кривой дебита нефти из сланцевых скважин. [19]
При описании размера частиц , образующихся в результате операций измельчения, измельчения и дробления , используется двухпараметрическое распределение Вейбулла, которое в этих приложениях иногда называют распределением Розина – Раммлера. [23] В этом контексте он предсказывает меньше мелких частиц, чем логарифмически нормальное распределение, и, как правило, наиболее точен для узких распределений частиц по размерам. [24] Интерпретация кумулятивной функции распределения заключается в том, что она представляет собой массовую долю частиц с диаметром менее , где – средний размер частиц и является мерой разброса размеров частиц.
При описании случайных облаков точек (например, положений частиц в идеальном газе): вероятность найти ближайшую соседнюю частицу на расстоянии от данной частицы определяется распределением Вейбулла, имеющим плотность частиц и равную ей. [25]
При расчете скорости радиационно-индуцированных одиночных эффектов на борту космического корабля используется четырехпараметрическое распределение Вейбулла для согласования экспериментально измеренных данных вероятности поперечного сечения устройства со спектром линейной передачи энергии частиц . [26] Подбор Вейбулла первоначально использовался из-за убеждения, что уровни энергии частиц соответствуют статистическому распределению, но позже это убеждение оказалось ложным [ нужна цитация ] , и подгонка Вейбулла продолжает использоваться из-за множества настраиваемых параметров, а не из-за множества настраиваемых параметров. чем продемонстрированная физическая основа. [27]
Связанные дистрибутивы
Если , то переменная представляет собой Gumbel (минимум), распределенную с параметром местоположения и параметром масштаба . То есть, .
Транслированное распределение Вейбулла (или трехпараметрическое распределение Вейбулла) содержит дополнительный параметр. [11] Он имеет функцию плотности вероятности
для и для , где параметр формы , параметр масштаба и параметр местоположения распределения . Значение устанавливает начальное время безотказной работы перед началом обычного процесса Вейбулла. При , это сводится к 2-параметрическому распределению.
Распределение Вейбулла можно охарактеризовать как такое распределение случайной величины, что случайная величина
Это означает, что распределение Вейбулла также можно охарактеризовать с точки зрения равномерного распределения : если оно распределено равномерно на , то случайная величина является распределенной Вейбулла с параметрами и . Обратите внимание, что здесь эквивалентно приведенному выше. Это приводит к легко реализуемой численной схеме моделирования распределения Вейбулла.
Распределение Вейбулла интерполирует между экспоненциальным распределением интенсивности при и распределением Рэлея моды при .
Распределение Вейбулла является частным случаем обобщенного распределения экстремальных значений . Именно в этой связи распределение было впервые идентифицировано Морисом Фреше в 1927 году. [29] Близко родственное распределение Фреше , названное в честь этой работы, имеет функцию плотности вероятности.
Распределение случайной величины, определяемое как минимум из нескольких случайных величин, каждая из которых имеет различное распределение Вейбулла, является поли-распределением Вейбулла .
Распределение Вейбулла было впервые применено Розином и Раммлером (1933) для описания распределения частиц по размерам. Он широко используется в переработке полезных ископаемых для описания распределения частиц по размерам в процессах измельчения . В этом контексте кумулятивное распределение определяется выражением
где
размер частиц
представляет собой 80-й процентиль распределения частиц по размерам.
– параметр, описывающий разброс распределения
Из-за своей доступности в электронных таблицах он также используется там, где основное поведение на самом деле лучше моделируется с помощью распределения Эрланга . [30]
^ Бауэрс и др. ал. (1997) Актуарная математика, 2-е изд. Общество актуариев.
^ Папулис, Афанасиос Папулис; Пиллаи, С. Унникришна (2002). Вероятность, случайные величины и случайные процессы (4-е изд.). Бостон: МакГроу-Хилл. ISBN 0-07-366011-6.
^ Кизилерсу, Айше; Крир, Маркус; Томас, Энтони В. (2018). «Распределение Вейбулла». Значение . 15 (2): 10–11. дои : 10.1111/j.1740-9713.2018.01123.x .
^ Цзян, Р.; Мурти, DNP (2011). «Исследование параметра формы Вейбулла: свойства и значение». Проектирование надежности и системная безопасность . 96 (12): 1619–26. дои : 10.1016/j.ress.2011.09.003.
^ Элиазар, Иддо (ноябрь 2017 г.). «Закон Линди». Физика А: Статистическая механика и ее приложения . 486 : 797–805. Бибкод : 2017PhyA..486..797E. doi :10.1016/j.physa.2017.05.077. S2CID 125349686.
^ Коллетт, Дэвид (2015). Моделирование данных о выживаемости в медицинских исследованиях (3-е изд.). Бока-Ратон: Чепмен и Холл / CRC. ISBN978-1439856789.
^ Кэмерон, AC; Триведи, ПК (2005). Микроэконометрика: методы и приложения . п. 584. ИСБН978-0-521-84805-3.
^ Калбфляйш, JD; Прентис, Р.Л. (2002). Статистический анализ данных о времени отказа (2-е изд.). Хобокен, Нью-Джерси: Дж. Уайли. ISBN978-0-471-36357-6. ОСЛК 50124320.
^ Терно, Т. (2020). «Пакет для анализа выживания в R». Пакет R версии 3.1.
^ abc Джонсон, Коц и Балакришнан 1994 г.
^ См. (Cheng, Tellambura & Beaulieu 2004) случай, когда k является целым числом, и (Sagias & Karagiannidis 2005) для рационального случая. harv error: no target: CITEREFChengTellamburaBeaulieu2004 (help)
^ Балог, Матей; Трипуранени, Нилеш; Гахрамани, Зубин; Веллер, Адриан (17 июля 2017 г.). «Потерянные родственники трюка с Гамбелем». Международная конференция по машинному обучению . ПМЛР: 371–379.
^ аб Сорнетт, Д. (2004). Критические явления в естествознании: хаос, фракталы, самоорганизация и беспорядок ..
^ Баукхаге, Кристиан (2013). «Вычисление расхождения Кульбака-Лейблера между двумя распределениями Вейбулла». arXiv : 1310.3713 [cs.IT].
^ Аб Ли, Се Юн; Маллик, Бани (2021). «Байесовское иерархическое моделирование: применение к результатам добычи в сланцах Игл Форд в Южном Техасе». Санкхья Б. 84 : 1–43. дои : 10.1007/s13571-020-00245-8 .
^ "Распределение скорости ветра Вейбулл - REUK.co.uk" . www.reuk.co.uk. _
^ Лю, Чао; Уайт, Райен В.; Дюмэ, Сьюзен (19 июля 2010 г.). Понимание поведения при просмотре веб-страниц посредством анализа времени пребывания по Вейбуллу . АКМ. стр. 379–386. дои : 10.1145/1835449.1835513. ISBN9781450301534. S2CID 12186028.
^ Шариф, М. Наваз; Ислам, М.Назрул (1980). «Распределение Вейбулла как общая модель прогнозирования технологических изменений». Технологическое прогнозирование и социальные изменения . 18 (3): 247–56. дои : 10.1016/0040-1625(80)90026-8.
^ Вычислительная оптимизация двигателя внутреннего сгорания, стр. 49
^ Чандрашекар, С. (1943). «Стохастические проблемы физики и астрономии». Обзоры современной физики . 15 (1): 86.
^ ECSS-E-ST-10-12C - Методы расчета полученной радиации и ее последствий, а также политика расчетных пределов (Отчет). Европейское сотрудничество по космической стандартизации. 15 ноября 2008 г.
^ LD Эдмондс; CE Барнс; Л. З. Шейк (май 2000 г.). «8.3 Подгонка кривой». Введение в воздействие космического излучения на микроэлектронику (PDF) (Отчет). Лаборатория реактивного движения НАСА, Калифорнийский технологический институт. стр. 75–76.
^ «Эволюция системы и надежность систем». Сысев (Бельгия). 01.01.2010.
^ Монтгомери, Дуглас (19 июня 2012 г.). Введение в статистический контроль качества . [Sl]: Джон Уайли. п. 95. ИСБН9781118146811.
^ Чатфилд, К.; Гудхардт, Дж.Дж. (1973). «Модель потребительских закупок с Эрлангом времени между покупками». Журнал Американской статистической ассоциации . 68 (344): 828–835. дои : 10.1080/01621459.1973.10481432.
Библиография
Фреше, Морис (1927), «Sur la loi de probilité de l'écart max», Annales de la Société Polonaise de Mathématique, Cracovie , 6 : 93–116.
Джонсон, Норман Л.; Коц, Сэмюэл; Балакришнан, Н. (1994), Непрерывные одномерные распределения. Том. 1 , Серия Уайли по вероятности и математической статистике: прикладная теория вероятности и статистика (2-е изд.), Нью-Йорк: John Wiley & Sons, ISBN 978-0-471-58495-7, МР 1299979
Манн, Нэнси Р .; Шафер, Рэй Э.; Сингпурвалла, Нозер Д. (1974), Методы статистического анализа надежности и данных о жизни , Ряды Уайли по вероятности и математической статистике: прикладная вероятность и статистика (1-е изд.), Нью-Йорк: John Wiley & Sons, ISBN 978-0-471-56737-0
Муралидхаран, Г.; Рао, AD; Куруп, П.Г.; Наир, Н. Унникришнан; Синха, Мурани (2007), «Модифицированное распределение Вейбулла для моделирования и прогнозирования максимальной и значительной высоты волн», Coastal Engineering , 54 (8): 630–638, doi :10.1016/j.coastaleng.2007.05.001
Розин, П.; Раммлер, Э. (1933), «Законы, регулирующие крупность порошкообразного угля», Журнал Института топлива , 7 : 29–36..
Сагиас, Северная Каролина; Карагианнидис, ГК (2005). «Многомерные распределения Вейбулла гауссова класса: теория и приложения в каналах затухания». Транзакции IEEE по теории информации . 51 (10): 3608–19. дои : 10.1109/TIT.2005.855598. MR 2237527. S2CID 14654176.
Вейбулл, В. (1951), «Статистическая функция распределения широкой применимости» (PDF) , Journal of Applied Mechanics , 18 (3): 293–297, Бибкод : 1951JAM....18..293W, doi : 10.1115 /1,4010337.
Нельсон-младший, Ральф (5 февраля 2008 г.). «Диспергирование порошков в жидкостях, Часть 1, Глава 6: Распределение частиц по объему» . Проверено 5 февраля 2008 г.