В теории вероятностей и статистике распределение Вейбулла / ˈ w aɪ b ʊ l / является непрерывным распределением вероятностей . Оно моделирует широкий диапазон случайных величин, в основном в природе времени до отказа или времени между событиями. Примерами являются максимальные однодневные осадки и время, которое пользователь проводит на веб-странице.
Распределение названо в честь шведского математика Валлодди Вейбулла , который подробно описал его в 1939 году [1] [2], хотя впервые оно было идентифицировано Рене Морисом Фреше и впервые применено Розином и Раммлером (1933) для описания распределения частиц по размерам .
Если величина x является "временем до отказа", распределение Вейбулла дает распределение, для которого интенсивность отказов пропорциональна мощности времени. Параметр формы k равен этой мощности плюс один, и поэтому этот параметр можно интерпретировать непосредственно следующим образом: [6]
Значение указывает на то, что частота отказов уменьшается со временем (как в случае эффекта Линди , который, однако, соответствует распределениям Парето [7], а не распределениям Вейбулла). Это происходит, если существует значительная «детская смертность», или дефектные элементы выходят из строя на ранней стадии, а частота отказов уменьшается со временем, поскольку дефектные элементы отсеиваются из популяции. В контексте распространения инноваций это означает отрицательное сарафанное радио: функция риска является монотонно убывающей функцией доли последователей;
Значение указывает на то, что частота отказов постоянна с течением времени. Это может означать, что случайные внешние события вызывают смертность или отказ. Распределение Вейбулла сводится к экспоненциальному распределению;
Значение указывает на то, что частота отказов увеличивается со временем. Это происходит, если есть процесс «старения» или детали, которые с большей вероятностью выйдут из строя с течением времени. В контексте распространения инноваций это означает позитивную молву: функция риска является монотонно возрастающей функцией доли последователей. Функция сначала выпуклая, затем вогнутая с точкой перегиба в .
В области материаловедения параметр формы k распределения прочности известен как модуль Вейбулла . В контексте диффузии инноваций распределение Вейбулла является «чистой» моделью имитации/отторжения.
Альтернативные параметризации
Первая альтернатива
Приложения в медицинской статистике и эконометрике часто принимают другую параметризацию. [8] [9] Параметр формы k такой же, как и выше, в то время как параметр масштаба равен . В этом случае для x ≥ 0 функция плотности вероятности равна
кумулятивная функция распределения равна
функция квантиля равна
функция опасности - это
и среднее значение равно
Вторая альтернатива
Также можно найти вторую альтернативную параметризацию. [10] [11] Параметр формы k такой же, как и в стандартном случае, в то время как параметр масштаба λ заменяется параметром скорости β = 1/ λ . Тогда для x ≥ 0 функция плотности вероятности равна
кумулятивная функция распределения равна
функция квантиля равна
и функция опасности равна
Во всех трех параметризациях риск уменьшается при k < 1, увеличивается при k > 1 и постоянен при k = 1, в этом случае распределение Вейбулла сводится к экспоненциальному распределению.
Характеристики
Функция плотности
Форма функции плотности распределения Вейбулла радикально меняется со значением k . Для 0 < k < 1 функция плотности стремится к ∞, когда x приближается к нулю сверху, и строго убывает. Для k = 1 функция плотности стремится к 1/ λ, когда x приближается к нулю сверху, и строго убывает. Для k > 1 функция плотности стремится к нулю, когда x приближается к нулю сверху, увеличивается до своей моды и уменьшается после нее. Функция плотности имеет бесконечный отрицательный наклон при x = 0, если 0 < k < 1, бесконечный положительный наклон при x = 0, если 1 < k < 2, и нулевой наклон при x = 0, если k > 2. Для k = 1 плотность имеет конечный отрицательный наклон при x = 0. Для k = 2 плотность имеет конечный положительный наклон при x = 0. Когда k стремится к бесконечности, распределение Вейбулла сходится к дельта-распределению Дирака с центром в точке x = λ. При этом асимметрия и коэффициент вариации зависят только от параметра формы. Обобщением распределения Вейбулла является гиперболастическое распределение типа III .
Кумулятивная функция распределения
Кумулятивная функция распределения для распределения Вейбулла имеет вид
для x ≥ 0 и F ( x ; k ; λ) = 0 для x < 0.
Если x = λ, то F ( x ; k ; λ) = 1 − e −1 ≈ 0,632 для всех значений k . Наоборот: при F ( x ; k ; λ ) = 0,632 значение x ≈ λ .
Функция квантиля (обратного кумулятивного распределения) для распределения Вейбулла имеет вид
для 0 ≤ p < 1.
Интенсивность отказов h (или функция опасности) определяется по формуле
где . Эксцесс эксцесса может быть также записан как:
Функция создания момента
Для функции генерации моментов самого X доступны различные выражения . Как степенной ряд , поскольку исходные моменты уже известны, можно иметь
В качестве альтернативы можно попытаться иметь дело непосредственно с интегралом
Если параметр k предполагается рациональным числом, выраженным как k = p / q , где p и q — целые числа, то этот интеграл можно вычислить аналитически. [13] Заменив t на − t , можно найти
Характеристическая функция также была получена Муралидхараном и др. (2007). Характеристическая функция и функция генерации моментов 3-параметрического распределения Вейбулла также были получены Муралидхараном и Соаресом (2014) прямым подходом. harvtxt error: no target: CITEREFMuraleedharanSoares2014 (help)
Минимумы
Пусть будут независимыми и одинаково распределенными случайными величинами Вейбулла с параметром масштаба и параметром формы . Если минимум этих случайных величин равен , то кумулятивное распределение вероятностей задается как
То есть, также будет распределено Вейбулл с параметром масштаба и параметром формы .
Трюки репараметризации
Зафиксируем некоторые . Пусть будут неотрицательными, и не все нулевыми, и пусть будут независимыми выборками , тогда [14]
.
энтропия Шеннона
Информационная энтропия определяется по формуле [15]
Расхождение Кульбака –Лейблера между двумя распределениями Вейбулла определяется выражением [16]
Оценка параметров
Наименьший квадрат с использованием графика Вейбулла
Соответствие распределения Вейбулла данным можно визуально оценить с помощью графика Вейбулла. [17] График Вейбулла — это график эмпирической кумулятивной функции распределения данных по специальным осям в виде графика типа Q–Q . Оси представляют собой зависимость от . Причина такого изменения переменных заключается в том, что кумулятивную функцию распределения можно линеаризировать:
что можно увидеть в стандартной форме прямой линии. Таким образом, если данные получены из распределения Вейбулла, то на графике Вейбулла ожидается прямая линия.
Существуют различные подходы к получению эмпирической функции распределения из данных. Один из методов заключается в получении вертикальной координаты для каждой точки с помощью
,
где — ранг точки данных, а — количество точек данных. [18] [19] Другой распространенной оценкой [20] является
.
Линейная регрессия также может быть использована для численной оценки соответствия и оценки параметров распределения Вейбулла. Градиент напрямую информирует о параметре формы , а параметр масштаба также может быть выведен.
Метод моментов
Коэффициент вариации распределения Вейбулла зависит только от параметра формы: [21]
Приравнивая величины выборки к , моментную оценку параметра формы можно считать либо из таблицы поиска, либо из графика зависимости от . Более точную оценку можно найти, используя алгоритм поиска корня для решения
Оценку момента параметра масштаба можно затем найти с помощью уравнения первого момента как
Максимальная вероятность
Оценка максимального правдоподобия для данного параметра равна [21]
Оценка максимального правдоподобия для является решением для k следующего уравнения [22]
Это уравнение определяет только неявно, его обычно приходится решать численными методами.
Когда наибольшие наблюдаемые выборки из набора данных, состоящего из более чем выборок, то оценка максимального правдоподобия для заданного параметра равна [22]
Также, учитывая это условие, оценка максимального правдоподобия для равна [ необходима ссылка ]
Опять же, поскольку это неявная функция, ее обычно приходится решать численными методами.
В прогнозировании технологических изменений (также известном как модель Шарифа-Ислама) [27]
В гидрологии распределение Вейбулла применяется к экстремальным явлениям, таким как годовые максимальные однодневные осадки и речные стоки.
В анализе кривой падения для моделирования кривой дебита нефти скважин сланцевой нефти. [24]
При описании размера частиц, образующихся в результате операций измельчения, помола и дробления , используется 2-параметрическое распределение Вейбулла, и в этих приложениях его иногда называют распределением Розина–Раммлера. [28] В этом контексте оно предсказывает меньше мелких частиц, чем логарифмически нормальное распределение , и, как правило, является наиболее точным для узких распределений размеров частиц. [29] Интерпретация кумулятивной функции распределения заключается в том, что — это массовая доля частиц с диаметром, меньшим , где — средний размер частиц, а — мера разброса размеров частиц.
При описании случайных точечных облаков (таких как положения частиц в идеальном газе): вероятность нахождения ближайшей соседней частицы на расстоянии от данной частицы задается распределением Вейбулла с плотностью частиц и равной ей. [30]
При расчете скорости эффектов единичного события, вызванного радиацией на борту космического корабля, используется четырехпараметрическое распределение Вейбулла для подгонки экспериментально измеренных данных вероятности поперечного сечения устройства к линейному спектру передачи энергии частиц . [31] Подгонка Вейбулла изначально использовалась из-за убеждения, что уровни энергии частиц согласуются со статистическим распределением, но позже это убеждение было доказано ложным [ требуется ссылка ] , и подгонка Вейбулла продолжает использоваться из-за ее многочисленных регулируемых параметров, а не из-за продемонстрированной физической основы. [32]
Связанные дистрибутивы
Если , то переменная распределена по закону Гумбеля (минимум) с параметром местоположения и параметром масштаба . То есть, .
Переводимое распределение Вейбулла (или 3-параметрическое распределение Вейбулла) содержит дополнительный параметр. [12] Оно имеет функцию плотности вероятности
для и для , где — параметр формы , — параметр масштаба и — параметр местоположения распределения. значение задает начальное время безотказной работы до начала обычного процесса Вейбулла. Когда это сводится к 2-параметрическому распределению.
Распределение Вейбулла можно охарактеризовать как распределение случайной величины, при котором случайная величина
Это подразумевает, что распределение Вейбулла также можно охарактеризовать в терминах равномерного распределения : если равномерно распределено на , то случайная величина распределена по Вейбуллу с параметрами и . Обратите внимание, что здесь эквивалентно вышеприведенному. Это приводит к легко реализуемой числовой схеме для моделирования распределения Вейбулла.
Распределение Вейбулла интерполирует между экспоненциальным распределением с интенсивностью , когда и распределением Рэлея моды , когда .
Распределение случайной величины, определяемое как минимум нескольких случайных величин, каждая из которых имеет свое распределение Вейбулла, называется поли-распределением Вейбулла .
Распределение Вейбулла было впервые применено Розином и Раммлером (1933) для описания распределения размеров частиц. Оно широко используется в переработке полезных ископаемых для описания распределения размеров частиц в процессах измельчения . В этом контексте кумулятивное распределение задается как
где
размер частиц
это 80-й процентиль распределения размеров частиц
это параметр, описывающий разброс распределения
Благодаря своей доступности в электронных таблицах он также используется там, где базовое поведение на самом деле лучше моделируется распределением Эрланга . [35]
^ В. Вейбулл (1939). «Статистическая теория сопротивления материалов». Академия Ingeniors Vetenskaps Handlingar (151). Стокгольм: Generalstabens Litografiska Anstalts Förlag: 1–45.
^ Боуэрс и др. (1997) Актуарная математика, 2-е изд. Общество актуариев.
^ Папулис, Афанасиос Папулис; Пиллаи, С. Унникришна (2002). Вероятность, случайные величины и стохастические процессы (4-е изд.). Бостон: McGraw-Hill. ISBN0-07-366011-6.
^ Кизилерсу, Айсе; Креер, Маркус; Томас, Энтони В. (2018). «Распределение Вейбулла». Значимость . 15 (2): 10–11. doi : 10.1111/j.1740-9713.2018.01123.x .
^ Цзян, Р.; Мурти, DNP (2011). «Исследование параметра формы Вейбулла: свойства и значение». Надежность техники и безопасность систем . 96 (12): 1619–26. doi :10.1016/j.ress.2011.09.003.
^ Элиазар, Иддо (ноябрь 2017 г.). «Закон Линди». Physica A: Статистическая механика и ее приложения . 486 : 797–805. Bibcode : 2017PhyA..486..797E. doi : 10.1016/j.physa.2017.05.077. S2CID 125349686.
^ Коллетт, Дэвид (2015). Моделирование данных о выживаемости в медицинских исследованиях (3-е изд.). Бока-Ратон: Chapman and Hall / CRC. ISBN978-1439856789.
^ Кэмерон, AC; Триведи, PK (2005). Микроэконометрика: методы и приложения . Cambridge University Press. стр. 584. ISBN978-0-521-84805-3.
^ Kalbfleisch, JD; Prentice, RL (2002). Статистический анализ данных о времени отказа (2-е изд.). Hoboken, NJ: J. Wiley. ISBN978-0-471-36357-6. OCLC 50124320.
^ Терно, Т. (2020). «Пакет для анализа выживания в R». Версия пакета R 3.1.
^ abc Джонсон, Коц и Балакришнан 1994
^ См. (Cheng, Tellambura & Beaulieu 2004) для случая, когда k является целым числом, и (Sagias & Karagiannidis 2005) для рационального случая. harv error: no target: CITEREFChengTellamburaBeaulieu2004 (help)
^ Чо, Ёнсык; Сан, Хокеун; Ли, Кёнджун (5 января 2015 г.). «Оценка энтропии распределения Вейбулла при обобщенном прогрессивном гибридном цензурировании». Энтропия . 17 (1): 102–122. doi : 10.3390/e17010102 . ISSN 1099-4300.
^ Bauckhage, Christian (2013). «Вычисление расхождения Кульбака-Лейблера между двумя распределениями Вейбулла». arXiv : 1310.3713 [cs.IT].
^ "1.3.3.30. График Вейбулла". www.itl.nist.gov .
^ Уэйн Нельсон (2004) Прикладной анализ данных о жизни . Wiley-Blackwell ISBN 0-471-64462-5
^ Барнетт, В. (1975). «Методы построения вероятностных диаграмм и порядковая статистика». Журнал Королевского статистического общества. Серия C (Прикладная статистика) . 24 (1): 95–108. doi :10.2307/2346708. ISSN 0035-9254. JSTOR 2346708.
^ ISO 20501:2019 — Тонкая керамика (высококачественная керамика, высококачественная техническая керамика) — Статистика Вейбулла для определения прочностных характеристик.
^ ab Cohen, A. Clifford (ноябрь 1965 г.). «Оценка максимального правдоподобия в распределении Вейбулла на основе полных и цензурированных выборок» (PDF) . Technometrics . 7 (4): 579–588. doi :10.1080/00401706.1965.10490300.
^ ab Sornette, D. (2004). Критические явления в естественных науках: хаос, фракталы, самоорганизация и беспорядок ..
^ ab Lee, Se Yoon; Mallick, Bani (2021). «Байесовское иерархическое моделирование: применение к результатам добычи в сланцевом месторождении Игл-Форд в Южном Техасе». Sankhya B . 84 : 1–43. doi : 10.1007/s13571-020-00245-8 .
^ «Распределение скорости ветра Вейбулла – REUK.co.uk». www.reuk.co.uk .
^ Лю, Чао; Уайт, Райен В.; Дюмейс, Сьюзан (2010-07-19). Понимание поведения при просмотре веб-страниц с помощью анализа времени пребывания по методу Вейбулла . ACM. стр. 379–386. doi :10.1145/1835449.1835513. ISBN9781450301534. S2CID 12186028.
^ Шариф, М. Наваз; Ислам, М. Назрул (1980). «Распределение Вейбулла как общая модель для прогнозирования технологических изменений». Технологическое прогнозирование и социальные изменения . 18 (3): 247–56. doi :10.1016/0040-1625(80)90026-8.
^ Вычислительная оптимизация двигателя внутреннего сгорания, стр. 49
^ Остин, LG; Климпель, RR; Лаки, PT (1984). Технология процесса уменьшения размера . Хобокен, Нью-Джерси: Guinn Printing Inc. ISBN0-89520-421-5.
^ Чандрашекар, С. (1943). «Стохастические проблемы в физике и астрономии». Обзоры современной физики . 15 (1): 86.
^ ECSS-E-ST-10-12C – Методы расчета полученного излучения и его эффектов, а также политика в отношении проектных запасов (Отчет). Европейское сотрудничество по космической стандартизации. 15 ноября 2008 г.
^ LD Edmonds; CE Barnes; LZ Scheick (май 2000 г.). «8.3 Подгонка кривой». Введение в эффекты космической радиации на микроэлектронику (PDF) (Отчет). Лаборатория реактивного движения NASA, Калифорнийский технологический институт. стр. 75–76.
^ "Эволюция систем и надежность систем". Sysev (Бельгия). 2010-01-01.
^ Монтгомери, Дуглас (2012-06-19). Введение в статистический контроль качества . [Sl]: John Wiley. стр. 95. ISBN9781118146811.
^ Чатфилд, К.; Гудхардт, Г.Дж. (1973). «Модель потребительских покупок с интервалами между покупками Эрланга». Журнал Американской статистической ассоциации . 68 (344): 828–835. doi :10.1080/01621459.1973.10481432.
Библиография
Фреше, Морис (1927), «Sur la loi de probilité de l'écart max», Annales de la Société Polonaise de Mathématique, Cracovie , 6 : 93–116.
Джонсон, Норман Л.; Коц, Сэмюэл; Балакришнан, Н. (1994), Непрерывные одномерные распределения. Том 1 , Серия Wiley по теории вероятностей и математической статистике: прикладная теория вероятностей и статистики (2-е изд.), Нью-Йорк: John Wiley & Sons, ISBN 978-0-471-58495-7, г-н 1299979
Манн, Нэнси Р.; Шефер, Рэй Э.; Сингпурвалла, Нозер Д. (1974), Методы статистического анализа надежности и данных о сроке службы , серия Wiley по вероятности и математической статистике: прикладная вероятность и статистика (1-е изд.), Нью-Йорк: John Wiley & Sons, ISBN 978-0-471-56737-0
Muraleedharan, G.; Rao, AD; Kurup, PG; Nair, N. Unnikrishnan; Sinha, Mourani (2007), «Модифицированное распределение Вейбулла для моделирования и прогнозирования максимальной и значительной высоты волны», Coastal Engineering , 54 (8): 630–638, doi :10.1016/j.coastaleng.2007.05.001
Розин, П.; Раммлер, Э. (1933), «Законы, управляющие тонкостью измельченного угля», Журнал Института топлива , 7 : 29–36.
Sagias, NC; Karagiannidis, GK (2005). "Многомерные распределения Вейбулла гауссовского класса: теория и применение в каналах с замиранием". IEEE Transactions on Information Theory . 51 (10): 3608–19. doi :10.1109/TIT.2005.855598. MR 2237527. S2CID 14654176.
Вейбулл, В. (1951), «Статистическая функция распределения широкой применимости» (PDF) , Журнал прикладной механики , 18 (3): 293–297, Bibcode : 1951JAM....18..293W, doi : 10.1115/1.4010337.