stringtranslate.com

Теория экстремальных значений

Теория экстремальных значений используется для моделирования риска экстремальных, редких событий, таких как Лиссабонское землетрясение 1755 года .

Теория экстремальных значений или анализ экстремальных значений ( EVA ) — это изучение экстремальных значений в статистических распределениях.

Он широко используется во многих дисциплинах, таких как структурная инженерия , финансы , экономика , науки о Земле , прогнозирование дорожного движения и геологическая инженерия . Например, EVA может использоваться в области гидрологии для оценки вероятности необычно большого наводнения, такого как 100-летнее наводнение . Аналогично, для проектирования волнолома , инженер по береговой охране будет стремиться оценить 50-летнюю волну и спроектировать конструкцию соответствующим образом.

Анализ данных

Существуют два основных подхода к практическому анализу экстремальных значений.

Первый метод основан на извлечении серий блоковых максимумов (минимумов) в качестве предварительного шага. Во многих ситуациях обычно и удобно извлекать годовые максимумы (минимумы), генерируя серию годовых максимумов (AMS).

Второй метод основан на извлечении из непрерывной записи пиковых значений, достигнутых за любой период, в течение которого значения превышают определенный порог (падают ниже определенного порога). Этот метод обычно называют методом пика над порогом (POT). [1]

Для данных AMS анализ может частично полагаться на результаты теоремы Фишера–Типпета–Гнеденко , что приводит к выбору обобщенного распределения экстремальных значений для подгонки. [2] [3] Однако на практике применяются различные процедуры для выбора между более широким диапазоном распределений. Теорема здесь относится к предельным распределениям для минимума или максимума очень большого набора независимых случайных величин из одного и того же распределения. Учитывая, что количество соответствующих случайных событий в течение года может быть довольно ограниченным, неудивительно, что анализ наблюдаемых данных AMS часто приводит к выбору распределений, отличных от обобщенного распределения экстремальных значений (GEVD). [4]

Для данных POT анализ может включать подгонку двух распределений: одно для количества событий за рассматриваемый период времени, а второе — для размера превышений.

Распространенным предположением для первого является распределение Пуассона , а обобщенное распределение Парето используется для превышений. Подгонка хвоста может быть основана на теореме Пикандса–Балкема–де Хаана . [5] [6]

Новак (2011) резервирует термин «метод POT» для случая, когда порог не является случайным, и отличает его от случая, когда речь идет о превышении случайного порога. [7]

Приложения

Приложения теории экстремальных значений включают прогнозирование распределения вероятностей:

История

Область теории экстремальных значений была пионером Л. Типпетта (1902–1985). Типпетт работал в Британской ассоциации исследований хлопковой промышленности , где он работал над тем, чтобы сделать хлопковую нить более прочной. В своих исследованиях он понял, что прочность нити контролируется прочностью ее самых слабых волокон. С помощью RA Fisher Типпет получил три асимптотических предела, описывающих распределения экстремальных значений, предполагающих независимость переменных. EJ Gumbel (1958) [25] кодифицировал эту теорию. Эти результаты можно расширить, чтобы допустить слабые корреляции между переменными, но классическая теория не распространяется на сильные корреляции порядка дисперсии. Один класс универсальности, представляющий особый интерес, — это класс логарифмически коррелированных полей, где корреляции логарифмически убывают с расстоянием.

Одномерная теория

Теория экстремальных значений одной переменной регулируется теоремой об экстремальных значениях , также называемой теоремой Фишера–Типпета–Гнеденко , которая описывает, какое из трех возможных распределений экстремальных значений применимо к конкретной статистической переменной , которая обобщена в этом разделе.

Многомерная теория

Теория экстремальных значений в более чем одной переменной вводит дополнительные вопросы, которые необходимо решить. Одна из возникающих проблем заключается в том, что необходимо указать, что представляет собой экстремальное событие. [26] Хотя это просто в одномерном случае, нет однозначного способа сделать это в многомерном случае. Основная проблема заключается в том, что хотя можно упорядочить набор действительных чисел, нет естественного способа упорядочить набор векторов.

Например, в одномерном случае, если задан набор наблюдений, легко найти самое экстремальное событие, просто взяв максимум (или минимум) наблюдений. Однако в двумерном случае, если задан набор наблюдений , не сразу понятно, как найти самое экстремальное событие. Предположим, что были измерены значения в определенное время и значения в более позднее время. Какое из этих событий будет считаться более экстремальным? Универсального ответа на этот вопрос нет.

Другая проблема в многомерном случае заключается в том, что ограничивающая модель не так полно предписана, как в одномерном случае. В одномерном случае модель ( распределение GEV ) содержит три параметра, значения которых не предсказываются теорией и должны быть получены путем подгонки распределения к данным. В многомерном случае модель содержит не только неизвестные параметры, но и функцию, точная форма которой не предписана теорией. Однако эта функция должна подчиняться определенным ограничениям. [27] [28] Непросто разработать оценщики, которые подчиняются таким ограничениям, хотя некоторые из них были недавно построены. [29] [30] [31]

В качестве примера применения двумерной теории экстремальных значений можно привести ее применение в исследовании океана. [26] [32]

Нестационарные экстремумы

Статистическое моделирование нестационарных временных рядов было разработано в 1990-х годах. [33] Методы для нестационарных многомерных экстремальных значений были введены позднее. [34] Последние могут быть использованы для отслеживания того, как зависимость между экстремальными значениями изменяется с течением времени или по другой ковариате. [35] [36] [37]

Смотрите также

Распределения экстремальных значений


Ссылки

  1. ^ Лидбеттер, М. Р. (1991). «На основе моделирования «пиков сверх порога». Statistics and Probability Letters . 12 (4): 357–362. doi :10.1016/0167-7152(91)90107-3.
  2. Фишер и Типпетт (1928)
  3. ^ Гнеденко (1943)
  4. ^ Эмбрехтс, Клуппельберг и Микош (1997)
  5. ^ Пикандс (1975)
  6. ^ Балкема и де Хаан (1974)
  7. ^ Новак (2011)
  8. ^ Типпетт, Лепор и Коэн (2016)
  9. ^ Batt, Ryan D.; Carpenter, Stephen R.; Ives, Anthony R. (март 2017 г.). «Экстремальные события во временном ряду экосистемы озера». Limnology and Oceanography Letters . 2 (3): 63. Bibcode : 2017LimOL...2...63B. doi : 10.1002/lol2.10037 .
  10. ^ Альварадо, Сандберг и Пикфорд (1998), стр. 68
  11. ^ Макконен (2008)
  12. ^ Einmahl, JHJ; Smeets, SGWR (2009). Ultimate 100m world records through extreme-value theory (PDF) (Report). CentER Discussion Paper. Vol. 57. Tilburg University. Архивировано из оригинала (PDF) 2016-03-12 . Получено 2009-08-12 .
  13. ^ Гембрис, Д.; Тейлор, Дж.; Сутер, Д. (2002). «Тенденции и случайные колебания в легкой атлетике». Nature . 417 (6888): 506. Bibcode :2002Natur.417..506G. doi : 10.1038/417506a . hdl :2003/25362. PMID  12037557. S2CID  13469470.
  14. ^ Gembris, D.; Taylor, J.; Suter, D. (2007). «Эволюция спортивных рекордов: статистические эффекты против реальных улучшений». Журнал прикладной статистики . 34 (5): 529–545. Bibcode : 2007JApSt..34..529G. doi : 10.1080/02664760701234850. hdl : 2003/25404. PMC 11134017. S2CID 55378036  . 
  15. ^ Спиринг, Х.; Тон, Дж.; Айронс, Д.; Полден, Т.; Беннетт, Г. (2021). «Ранжирование и другие свойства элитных пловцов с использованием теории экстремальных значений». Журнал Королевского статистического общества . Серия A (Статистика в обществе). 184 (1): 368–395. arXiv : 1910.10070 . doi : 10.1111/rssa.12628 . S2CID  204823947.
  16. ^ Songchitruksa, P.; Tarko, AP (2006). «Подход теории экстремальных значений к оценке безопасности». Анализ и предотвращение аварий . 38 (4): 811–822. doi :10.1016/j.aap.2006.02.003. PMID  16546103.
  17. ^ Орсини, Ф.; Геччеле, Г.; Гастальди, М.; Росси, Р. (2019). «Прогнозирование столкновений на кольцевых перекрестках: сравнительное исследование подходов теории экстремальных значений». Transportmetrica . Серия A: Транспортная наука. 15 (2): 556–572. doi :10.1080/23249935.2018.1515271. S2CID  158343873.
  18. ^ Tsinos, CG; Foukalas, F.; Khattab, T.; Lai, L. (февраль 2018 г.). «О выборе канала для систем агрегации несущих». IEEE Transactions on Communications . 66 (2): 808–818. doi :10.1109/TCOMM.2017.2757478. S2CID  3405114.
  19. ^ Вонг, Феликс; Коллинз, Джеймс Дж. (2 ноября 2020 г.). «Доказательства того, что суперраспространение коронавируса имеет толстый хвост». Труды Национальной академии наук США . 117 (47): 29416–29418. Bibcode : 2020PNAS..11729416W. doi : 10.1073/pnas.2018490117 . ISSN  0027-8424. PMC 7703634. PMID 33139561  . 
  20. ^ Баснаяке, Канишка; Мазо, Дэвид; Бемельманс, Алексис; Руах, Натали; Коркотян, Эдуард; Холкман, Дэвид (4 июня 2019 г.). «Быстрые кальциевые переходы в дендритных шипиках, обусловленные экстремальной статистикой». PLOS Biology . 17 (6): e2006202. doi : 10.1371/journal.pbio.2006202 . ISSN  1545-7885. PMC 6548358. PMID 31163024  . 
  21. ^ Юнис, Абубакер; Абдельджалил, Анвар; Омер, Али (1 января 2023 г.). «Определение коэффициента генерации панели с использованием метода пиков сверх порогового значения и краткосрочных данных для автономной фотоэлектрической системы в Судане: случай города Хартум». Солнечная энергия . 249 : 242–249. Bibcode : 2023SoEn..249..242Y. doi : 10.1016/j.solener.2022.11.039. ISSN  0038-092X. S2CID  254207549.
  22. ^ Фогг, Александра Рут (2023). "Анализ экстремальных значений наблюдений наземного магнитометра в обсерватории Валентия, Ирландия". Космическая погода . 21 (e2023SW003565). doi :10.1029/2023SW003565.
  23. ^ Элвидж, Шон (2020). «Оценка возникновения геомагнитной активности с использованием преобразования Гильберта-Хуанга и теории экстремальных значений». Космическая погода . 17 (e2020SW002513). doi :10.1029/2020SW002513.
  24. ^ Бергин, Эйслинг (2023). "Статистика экстремальных событий в геомагнитных индексах Dst, SYM-H и SMR". Космическая погода . 21 (e2022SW003304). doi :10.1029/2022SW003304. hdl : 10037/30641 .
  25. ^ Гамбел (2004)
  26. ^ ab Morton, ID; Bowers, J. (декабрь 1996 г.). «Анализ экстремальных значений в многомерной морской среде». Applied Ocean Research . 18 (6): 303–317. Bibcode : 1996AppOR..18..303M. doi : 10.1016/s0141-1187(97)00007-2. ISSN  0141-1187.
  27. ^ Бейрлант, Ян; Гёгебер, Юрий; Тёгельс, Йозеф; Сегерс, Йохан (27 августа 2004 г.). Статистика экстремальных значений: теория и приложения . Wiley Series in Probability and Statistics. Чичестер, Великобритания: John Wiley & Sons, Ltd. doi : 10.1002/0470012382. ISBN 978-0-470-01238-3.
  28. ^ Коулз, Стюарт (2001). Введение в статистическое моделирование экстремальных значений . Springer Series in Statistics. doi :10.1007/978-1-4471-3675-0. ISBN 978-1-84996-874-4. ISSN  0172-7397.
  29. ^ de Carvalho, M.; Davison, AC (2014). "Модели отношения спектральной плотности для многомерных экстремальных значений" (PDF) . Журнал Американской статистической ассоциации . 109 : 764‒776. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID  53338058.
  30. ^ Хансон, Т.; де Карвальо, М.; Чен, Юхуэй (2017). «Полиномиальные угловые плотности многомерных распределений экстремальных значений Бернштейна» (PDF) . Statistics and Probability Letters . 128 : 60–66. doi :10.1016/j.spl.2017.03.030. hdl :20.500.11820/9e2f7cff-d052-452a-b6a2-dc8095c44e0c. S2CID  53338058.
  31. ^ де Карвальо, М. (2013). "Эвклидова оценка правдоподобия для двумерной хвостовой зависимости" (PDF) . Сообщения по статистике – Теория и методы . 42 (7): 1176–1192. arXiv : 1204.3524 . doi :10.1080/03610926.2012.709905. S2CID  42652601.
  32. ^ Захари, С.; Фельд, Г.; Уорд, Г.; Вольфрам, Дж. (октябрь 1998 г.). «Многомерная экстраполяция в условиях шельфа». Applied Ocean Research . 20 (5): 273–295. Bibcode :1998AppOR..20..273Z. doi :10.1016/s0141-1187(98)00027-3. ISSN  0141-1187.
  33. ^ Дэвисон, А.С.; Смит, Ричард (1990). «Модели превышений высоких порогов». Журнал Королевского статистического общества . Серия B (Методологическая). 52 (3): 393–425. doi :10.1111/j.2517-6161.1990.tb01796.x.
  34. ^ де Карвальо, М. (2016). «Статистика экстремальных ситуаций: проблемы и возможности». Справочник EVT и его применение в финансах и страховании (PDF) . Хобокен, Нью-Джерси: John Wiley's Sons. стр. 195–214. ISBN 978-1-118-65019-6.
  35. ^ Кастро, Д.; де Карвальо, М.; Уодсворт, Дж. (2018). «Изменяющаяся во времени зависимость экстремальных значений с применением к ведущим европейским фондовым рынкам» (PDF) . Annals of Applied Statistics . 12 : 283–309. doi :10.1214/17-AOAS1089. S2CID  33350408.
  36. ^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2019). «Модели регрессионного типа для экстремальной зависимости» (PDF) . Scandinavian Journal of Statistics . 46 (4): 1141–1167. doi :10.1111/sjos.12388. S2CID  53570822.
  37. ^ Mhalla, L.; de Carvalho, M.; Chavez-Demoulin, V. (2018). «Локальная надежная оценка функции зависимости Пиканда». Annals of Statistics . 46 (6A): 2806–2843. doi : 10.1214/17-AOS1640 . S2CID  59467614.

Источники

Программное обеспечение

Внешние ссылки