stringtranslate.com

поправка Бонферрони

В статистике поправка Бонферрони — это метод решения проблемы множественных сравнений .

Фон

Метод назван так из-за использования неравенств Бонферрони . [1] Применение метода к доверительным интервалам было описано Олив Джин Данн . [2]

Статистическая проверка гипотез основана на отклонении нулевой гипотезы , когда вероятность наблюдаемых данных была бы низкой, если бы нулевая гипотеза была истинной. Если проверяется несколько гипотез, вероятность наблюдения редкого события увеличивается, и, следовательно, увеличивается вероятность неправильного отклонения нулевой гипотезы (т. е. совершения ошибки типа I ). [3]

Поправка Бонферрони компенсирует это увеличение путем проверки каждой отдельной гипотезы на уровне значимости , где — желаемый общий уровень альфа, а — количество гипотез. [4] Например, если испытание проверяет гипотезы с желаемым общим , то поправка Бонферрони будет проверять каждую отдельную гипотезу на уровне .

Поправка Бонферрони также может применяться как корректировка p-значения: при использовании этого подхода вместо корректировки уровня альфа каждое p-значение умножается на количество тестов (при этом скорректированные p-значения, превышающие 1, затем уменьшаются до 1), а уровень альфа остается неизменным. Решения о значимости с использованием этого подхода будут такими же, как и при использовании подхода корректировки уровня альфа.

Определение

Пусть будет семейством нулевых гипотез и пусть будет их соответствующими p-значениями . Пусть будет общим числом нулевых гипотез, и пусть будет числом истинных нулевых гипотез (которое предположительно неизвестно исследователю). Коэффициент ошибок по семейству (FWER) — это вероятность отклонения хотя бы одной истинной , то есть совершения хотя бы одной ошибки первого типа . Поправка Бонферрони отвергает нулевую гипотезу для каждого , тем самым контролируя FWER при . Доказательство этого контроля следует из неравенства Буля следующим образом:

Этот контроль не требует никаких предположений о зависимости между p-значениями или о том, сколько нулевых гипотез верны. [5]

Расширения

Обобщение

Вместо того чтобы проверять каждую гипотезу на уровне, гипотезы можно проверять на любой другой комбинации уровней, которые в сумме составляют , при условии, что уровень каждого теста определяется до рассмотрения данных. [6] Например, для двух тестов гипотез общий результат 0,05 можно поддерживать, проводя один тест на уровне 0,04, а другой на уровне 0,01.

Доверительные интервалы

Процедура, предложенная Данном [2], может быть использована для корректировки доверительных интервалов . Если установить доверительные интервалы и получить общий уровень достоверности , каждый отдельный доверительный интервал можно скорректировать до уровня . [2]

Постоянные проблемы

При поиске сигнала в непрерывном параметрическом пространстве также может возникнуть проблема множественных сравнений или эффекта поиска в другом месте. Например, физик может попытаться обнаружить частицу неизвестной массы, рассматривая большой диапазон масс; так было во время Нобелевской премии по обнаружению бозона Хиггса . В таких случаях можно применить непрерывное обобщение поправки Бонферрони, используя байесовскую логику, чтобы связать эффективное число испытаний, , с отношением предшествующего к последующему объему. [7]

Альтернативы

Существуют альтернативные способы контроля частоты ошибок по семействам . Например, метод Холма–Бонферрони и коррекция Шидака являются универсально более мощными процедурами, чем коррекция Бонферрони, что означает, что они всегда по крайней мере столь же эффективны. Но в отличие от процедуры Бонферрони, эти методы не контролируют ожидаемое количество ошибок типа I на семейство (частоту ошибок типа I на семейство). [8]

Критика

Что касается контроля FWER , поправка Бонферрони может быть консервативной, если имеется большое количество тестов и/или статистика тестов положительно коррелирует. [9]

Коррекции с множественным тестированием, включая процедуру Бонферрони, увеличивают вероятность ошибок типа II , когда нулевые гипотезы ложны, т. е. они снижают статистическую мощность . [10] [9]

Ссылки

  1. ^ Бонферрони, CE, Теория статистики классов и расчет вероятностей, Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze, 1936 г.
  2. ^ abc Dunn, Olive Jean (1961). "Множественные сравнения средних" (PDF) . Журнал Американской статистической ассоциации . 56 (293): 52–64. CiteSeerX  10.1.1.309.1277 . doi :10.1080/01621459.1961.10482090.
  3. ^ Миттельхаммер, Рон К .; Джадж, Джордж Г .; Миллер, Дуглас Дж. (2000). Основы эконометрики. Cambridge University Press. С. 73–74. ISBN 978-0-521-62394-0.
  4. ^ Миллер, Руперт Г. (1966). Одновременный статистический вывод. Springer. ISBN 9781461381228.
  5. ^ Goeman, Jelle J.; Solari, Aldo (2014). «Проверка множественных гипотез в геномике». Статистика в медицине . 33 (11): 1946–1978. doi :10.1002/sim.6082. PMID  24399688. S2CID  22086583.
  6. ^ Нойвальд, А. Ф.; Грин, П. (1994). «Обнаружение закономерностей в последовательностях белков». J. Mol. Biol . 239 (5): 698–712. doi :10.1006/jmbi.1994.1407. PMID  8014990.
  7. ^ Байер, Адриан Э.; Сельяк, Урош (2020). «Эффект взгляда в другое место с единой байесовской и частотной точки зрения». Журнал космологии и астрочастичной физики . 2020 (10): 009. arXiv : 2007.13821 . doi : 10.1088/1475-7516/2020/10/009. S2CID  220830693.
  8. ^ Фрейн, Эндрю (2015). «Являются ли показатели ошибок типа I для каждой семьи значимыми в социальных и поведенческих науках?». Журнал современных прикладных статистических методов . 14 (1): 12–23. doi : 10.22237/jmasm/1430453040 .
  9. ^ ab Moran, Matthew (2003). «Аргументы в пользу отказа от последовательного Бонферрони в экологических исследованиях». Oikos . 100 (2): 403–405. doi :10.1034/j.1600-0706.2003.12010.x.
  10. ^ Накагава, Шиничи (2004). «Прощание с Бонферрони: проблемы низкой статистической мощности и смещения публикаций». Поведенческая экология . 15 (6): 1044–1045. doi : 10.1093/beheco/arh107 .

Внешние ссылки