stringtranslate.com

Теория экстремальных ценностей

Теория экстремальных значений используется для моделирования риска экстремальных и редких событий, таких как землетрясение в Лиссабоне 1755 года .

Теория экстремальных значений или анализ экстремальных значений ( EVA ) — это раздел статистики , занимающийся экстремальными отклонениями от медианы вероятностных распределений . Он стремится оценить на основе заданной упорядоченной выборки данной случайной величины вероятность событий, которые являются более экстремальными, чем любые ранее наблюдавшиеся. Анализ экстремальных значений широко используется во многих дисциплинах, таких как структурное проектирование , финансы , экономика , науки о Земле , прогнозирование дорожного движения и геологическая инженерия . Например, EVA может использоваться в области гидрологии для оценки вероятности необычно крупного наводнения, такого как 100-летнее наводнение . Аналогичным образом, при проектировании волнолома береговой инженер должен попытаться оценить 50-летнюю волну и соответствующим образом спроектировать конструкцию.

Анализ данных

Существуют два основных подхода к практическому анализу экстремальных значений.

Первый метод основан на получении блочного ряда максимумов (минимумов) в качестве предварительного шага. Во многих ситуациях обычно и удобно извлекать годовые максимумы (минимумы), создавая годовой ряд максимумов (AMS).

Второй метод основан на извлечении из непрерывной записи пиковых значений, достигнутых за любой период, в течение которого значения превышают определенный порог (падают ниже определенного порога). Этот метод обычно называют методом пика над порогом (POT). [1]

Для данных AMS анализ может частично опираться на результаты теоремы Фишера-Типпета-Гнеденко , что приводит к выбору обобщенного распределения экстремальных значений для аппроксимации. [2] [3] Однако на практике для выбора между более широким диапазоном распределений применяются различные процедуры. Теорема здесь относится к предельным распределениям минимума или максимума очень большого набора независимых случайных величин из одного и того же распределения. Учитывая, что количество соответствующих случайных событий в течение года может быть довольно ограниченным, неудивительно, что анализ наблюдаемых данных AMS часто приводит к выбору распределений, отличных от обобщенного распределения экстремальных значений (GEVD). [4]

Для данных POT анализ может включать подбор двух распределений: одно для количества событий за рассматриваемый период времени, а второе для размера превышений.

Распространенным предположением для первого является распределение Пуассона с обобщенным распределением Парето, используемым для превышений. Подгонка хвоста может быть основана на теореме Пикандса – Балкемы – де Хаана . [5] [6]

Новак (2011) оставляет термин «метод POT» для случая, когда порог неслучайен, и отличает его от случая, когда речь идет о превышении случайного порога. [7]

Приложения

Приложения теории экстремальных значений включают прогнозирование распределения вероятностей:

История

Пионер теории экстремальных ценностей был Л. Типпетом (1902–1985). Типпетт работал в Британской ассоциации исследований хлопчатобумажной промышленности , где работал над повышением прочности хлопковой нити. В своих исследованиях он понял, что прочность нити зависит от прочности ее самых слабых волокон. С помощью Р. А. Фишера Типпет получил три асимптотических предела, описывающих распределения экстремумов в предположении независимых переменных. Э. Дж. Гамбель (1958) [22] систематизировал эту теорию. Эти результаты можно расширить, чтобы учесть небольшие корреляции между переменными, но классическая теория не распространяется на сильные корреляции порядка дисперсии. Особый интерес представляет один класс универсальности — логарифмически коррелированные поля, в которых корреляции логарифмически затухают с расстоянием.

Одномерная теория

Теория экстремальных значений одной переменной регулируется теоремой об экстремальных значениях , также называемой теоремой Фишера-Типпета-Гнеденко , которая описывает, какое из трех возможных распределений экстремальных значений применимо для конкретной статистической переменной , которая кратко изложена в этом разделе. .

Пусть это выборка независимых и одинаково распределенных случайных величин с кумулятивной функцией распределения , и пусть обозначает выборочный максимум.

Теоретически точное распределение максимума можно получить:

Значение связанной индикаторной функции представляет собой процесс Бернулли с вероятностью успеха , которая зависит от величины экстремального события. Таким образом , количество экстремальных событий в испытаниях следует биномиальному распределению , а количество испытаний до наступления события следует геометрическому распределению с ожидаемым значением и стандартным отклонением того же порядка.

На практике у нас может не быть функции распределения, но теорема Фишера-Типпета-Гнеденко дает асимптотический результат. Если существуют последовательности парных констант с и такие, что

как тогда

где параметр зависит от того, насколько круто уменьшаются хвосты распределения (называемые «обычными» хвостами , «тонкими» хвостами и «толстыми» хвостами ) , при этом нормальное распределение помещается в « «тонкохвостая» группа вместо «обычной» для этого контекста, по крайней мере). При нормализации принадлежит к одному из следующих невырожденных семейств распределений :

Тип 1: Распределение Gumbel , для
когда распределение имеет «обычный» экспоненциально убывающий хвост.


Тип 2: Распределение Фреше , для
когда распределение имеет тяжелый хвост (в том числе полиномиальное затухание).


Тип 3: Распределение Вейбулла ,
для
когда распределение имеет тонкий хвост с конечной верхней границей.

Многомерная теория

Теория экстремальных значений более чем одной переменной ставит дополнительные проблемы, которые необходимо решить. Одна из возникающих проблем заключается в том, что необходимо указать, что представляет собой экстремальное событие. [23] Хотя в одномерном случае это просто, в многомерном случае не существует однозначного способа сделать это. Фундаментальная проблема заключается в том, что, хотя и возможно упорядочить набор действительных чисел, не существует естественного способа упорядочить набор векторов.

Например, в одномерном случае при наличии набора наблюдений легко найти наиболее экстремальное событие, просто взяв максимум (или минимум) наблюдений. Однако в двумерном случае при наличии набора наблюдений не сразу понятно, как найти наиболее экстремальное событие. Предположим, что кто-то измерил значения в определенное время, а значения - в более позднее время. Какое из этих событий можно было бы считать более экстремальным? На этот вопрос не существует универсального ответа.

Другая проблема в многомерном случае заключается в том, что ограничивающая модель не так полностью задана, как в одномерном случае. В одномерном случае модель ( распределение GEV ) содержит три параметра, значения которых не предсказываются теорией и должны быть получены путем подгонки распределения к данным. В многомерном случае модель содержит не только неизвестные параметры, но и функцию, точный вид которой не предписывается теорией. Однако эта функция должна подчиняться определенным ограничениям. [24] [25] Непросто разработать оценщики, которые подчиняются таким ограничениям, хотя некоторые из них были построены недавно. [26] [27] [28]

В качестве примера применения к исследованию океана была применена двумерная теория экстремальных значений. [23] [29]

Нестационарные экстремумы

Статистическое моделирование нестационарных временных рядов было разработано в 1990-х годах. [30] Совсем недавно были введены методы определения нестационарных многомерных экстремумов. [31] Последнее можно использовать для отслеживания того, как зависимость между экстремальными значениями меняется с течением времени или по другой ковариате. [32] [33] [34]

Смотрите также

Распределения экстремальных значений


Рекомендации

  1. ^ Ледбеттер, MR (1991). «На основе моделирования пиков превышения порога». Статистика и вероятностные буквы . 12 (4): 357–362. дои : 10.1016/0167-7152(91)90107-3.
  2. ^ Фишер и Типпетт (1928)
  3. ^ Гнеденко (1943)
  4. ^ Эмбрехтс, Клуппельберг и Микош (1997)
  5. ^ Пикандс (1975)
  6. ^ Балкема и де Хаан (1974)
  7. ^ Новак (2011)
  8. ^ Типпетт, Лепор и Коэн (2016)
  9. ^ Батт, Райан Д.; Карпентер, Стивен Р.; Айвз, Энтони Р. (март 2017 г.). «Экстремальные события во временных рядах экосистемы озера». Письма по лимнологии и океанографии . 2 (3): 63. Бибкод : 2017LimOL...2...63B. дои : 10.1002/lol2.10037 .
  10. ^ Альварадо, Сандберг и Пикфорд (1998), стр. 68
  11. ^ Макконен (2008)
  12. ^ Эйнмал, JHJ; Смитс, SGWR (2009). Окончательные мировые рекорды на дистанции 100 метров с помощью теории экстремальных значений (PDF) (Отчет). Дискуссионный документ Центра. Том. 57. Тилбургский университет. Архивировано из оригинала (PDF) 12 марта 2016 г. Проверено 12 августа 2009 г.
  13. ^ Гембрис, Д.; Тейлор, Дж.; Сутер, Д. (2002). «Тенденции и случайные колебания в легкой атлетике». Природа . 417 (6888): 506. Бибкод : 2002Natur.417..506G. дои : 10.1038/417506a . hdl : 2003/25362. PMID  12037557. S2CID  13469470.
  14. ^ Гембрис, Д.; Тейлор, Дж.; Сутер, Д. (2007). «Эволюция спортивных рекордов: статистические эффекты против реальных улучшений». Журнал прикладной статистики . 34 (5): 529–545. Бибкод : 2007JApSt..34..529G. дои : 10.1080/02664760701234850. hdl : 2003/25404. S2CID  55378036.
  15. ^ Спиринг, Х.; Тон, Дж.; Айронс, Д.; Полден, Т.; Беннетт, Г. (2021). «Рейтинг и другие характеристики элитных пловцов с использованием теории экстремальных ценностей». Журнал Королевского статистического общества . Серия А (Статистика в обществе). 184 (1): 368–395. arXiv : 1910.10070 . дои : 10.1111/rssa.12628 . S2CID  204823947.
  16. ^ Сонгчитрукша, П.; Тарко, АП (2006). «Подход теории экстремальных значений к оценке безопасности». Анализ и предотвращение несчастных случаев . 38 (4): 811–822. doi :10.1016/j.aap.2006.02.003. ПМИД  16546103.
  17. ^ Орсини, Ф.; Геккеле, Г.; Гастальди, М.; Росси, Р. (2019). «Прогнозирование столкновений на кольцевых развязках: сравнительное исследование подходов теории экстремальных значений». Транспортметрика . Серия А: Транспортная наука. 15 (2): 556–572. дои : 10.1080/23249935.2018.1515271. S2CID  158343873.
  18. ^ Цинос, К.Г.; Фукалас, Ф.; Хаттаб, Т.; Лай, Л. (февраль 2018 г.). «О выборе каналов для систем агрегации несущих». Транзакции IEEE в области коммуникаций . 66 (2): 808–818. дои : 10.1109/TCOMM.2017.2757478. S2CID  3405114.
  19. ^ Вонг, Феликс; Коллинз, Джеймс Дж. (2 ноября 2020 г.). «Доказательства того, что суперраспространение коронавируса носит толстый хвост». Труды Национальной академии наук США . 117 (47): 29416–29418. Бибкод : 2020PNAS..11729416W. дои : 10.1073/pnas.2018490117 . ISSN  0027-8424. ПМЦ 7703634 . ПМИД  33139561. 
  20. ^ Баснаяке, Канишка; Мазо, Дэвид; Бемельманс, Алексис; Руаш, Натали; Коркотян, Эдуард; Холькман, Дэвид (4 июня 2019 г.). «Быстрые переходные процессы кальция в дендритных шипиках, вызванные экстремальной статистикой». ПЛОС Биология . 17 (6): e2006202. дои : 10.1371/journal.pbio.2006202 . ISSN  1545-7885. ПМК 6548358 . ПМИД  31163024. 
  21. ^ Юнис, Абубакер; Абдельджалил, Анвар; Омер, Али (1 января 2023 г.). «Определение коэффициента генерации панели с использованием метода пиков над порогом и краткосрочных данных для автономной фотоэлектрической системы в Судане: пример города Хартум». Солнечная энергия . 249 : 242–249. Бибкод : 2023SoEn..249..242Y. doi :10.1016/j.solener.2022.11.039. ISSN  0038-092X. S2CID  254207549.
  22. ^ Гамбель (2004)
  23. ^ Аб Мортон, ID; Бауэрс, Дж. (декабрь 1996 г.). «Анализ экстремальных значений в многомерной морской среде». Прикладные исследования океана . 18 (6): 303–317. Бибкод : 1996AppOR..18..303M. дои : 10.1016/s0141-1187(97)00007-2. ISSN  0141-1187.
  24. ^ Бейрлант, Ян; Гёгебер, Юрий; Тойгельс, Йозеф; Сегерс, Йохан (27 августа 2004 г.). Статистика экстремумов: теория и приложения . Ряд Уайли по вероятности и статистике. Чичестер, Великобритания: John Wiley & Sons, Ltd., номер документа : 10.1002/0470012382. ISBN 978-0-470-01238-3.
  25. ^ Коулз, Стюарт (2001). Введение в статистическое моделирование экстремальных значений . Серия Спрингера по статистике. дои : 10.1007/978-1-4471-3675-0. ISBN 978-1-84996-874-4. ISSN  0172-7397.
  26. ^ де Карвалью, М.; Дэвисон, AC (2014). «Модели отношения спектральной плотности для многомерных экстремумов» (PDF) . Журнал Американской статистической ассоциации . 109 : 764–776. дои : 10.1016/j.spl.2017.03.030. hdl : 20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID  53338058.
  27. ^ Хэнсон, Т.; де Карвалью, М.; Чен, Юхуэй (2017). «Угловые плотности полинома Бернштейна многомерных распределений экстремальных значений» (PDF) . Статистика и вероятностные буквы . 128 : 60–66. дои : 10.1016/j.spl.2017.03.030. hdl : 20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID  53338058.
  28. ^ де Карвальо, М. (2013). «Евклидова оценка правдоподобия для зависимости от двумерного хвоста» (PDF) . Коммуникации в статистике – теория и методы . 42 (7): 1176–1192. arXiv : 1204.3524 . дои : 10.1080/03610926.2012.709905. S2CID  42652601.
  29. ^ Закари, С.; Фельд, Г.; Уорд, Г.; Вольфрам, Дж. (октябрь 1998 г.). «Многомерная экстраполяция в морской среде». Прикладные исследования океана . 20 (5): 273–295. Бибкод : 1998AppOR..20..273Z. дои : 10.1016/s0141-1187(98)00027-3. ISSN  0141-1187.
  30. ^ Дэвисон, AC; Смит, Ричард (1990). «Модели превышения высоких пороговых значений». Журнал Королевского статистического общества . Серия Б (Методическая). 52 (3): 393–425. doi :10.1111/j.2517-6161.1990.tb01796.x.
  31. ^ де Карвалью, М. (2016). «Статистика крайностей: вызовы и возможности». Справочник по EVT и его применению в финансах и страховании (PDF) . Хобокен, Нью-Джерси: Сыновья Джона Уайли. стр. 195–214. ISBN 978-1-118-65019-6.
  32. ^ Кастро, Д.; де Карвалью, М.; Уодсворт, Дж. (2018). «Изменяющаяся во времени чрезвычайная зависимость стоимости применительно к ведущим европейским фондовым рынкам» (PDF) . Анналы прикладной статистики . 12 : 283–309. дои : 10.1214/17-AOAS1089. S2CID  33350408.
  33. ^ Мхалла, Л.; де Карвалью, М.; Чавес-Демулен, В. (2019). «Модели типа регрессии для экстремальной зависимости» (PDF) . Скандинавский статистический журнал . 46 (4): 1141–1167. дои : 10.1111/sjos.12388. S2CID  53570822.
  34. ^ Мхалла, Л.; де Карвалью, М.; Чавес-Демулен, В. (2018). «Локальная робастная оценка функции зависимости Пикандса». Анналы статистики . 46 (6А): 2806–2843. дои : 10.1214/17-AOS1640 . S2CID  59467614.

Источники

Программное обеспечение

Внешние ссылки