stringtranslate.com

Уровень ложного обнаружения

В статистике уровень ложных открытий ( FDR ) — это метод концептуализации частоты ошибок типа I при проверке нулевой гипотезы при проведении множественных сравнений . Процедуры контроля FDR предназначены для контроля FDR, который представляет собой ожидаемую долю «открытий» (отклоненных нулевых гипотез ), которые являются ложными (неверными отклонениями нулевых гипотез). [1] Аналогично, FDR — это ожидаемое отношение количества ложноположительных классификаций (ложных открытий) к общему количеству положительных классификаций (отклонений нуля). Общее количество отклонений нуля включает в себя как количество ложных срабатываний (FP), так и количество истинных срабатываний (TP). Проще говоря, ФДР = ФП/(ФП+ТП). Процедуры контроля FDR обеспечивают менее строгий контроль ошибок типа I по сравнению с процедурами контроля частоты ошибок по семейству (FWER) (такими как поправка Бонферрони ), которые контролируют вероятность хотя бы одной ошибки типа I. Таким образом, процедуры контроля FDR обладают большей эффективностью за счет увеличения количества ошибок первого рода. [2]

История

Технологические мотивы

Считается, что современное широкое использование FDR обусловлено и мотивировано развитием технологий, которые позволили собирать и анализировать большое количество различных переменных у нескольких людей (например, уровень экспрессии каждого из 10 000 различных генов). у 100 разных людей). [3] К концу 1980-х и 1990-м годам развитие «высокопроизводительных» наук, таких как геномика , позволило быстро собирать данные. Это, в сочетании с ростом вычислительной мощности, позволило беспрепятственно выполнять очень большое количество статистических тестов на заданном наборе данных. Технология микрочипов была прототипным примером, поскольку она позволяла одновременно тестировать тысячи генов на дифференциальную экспрессию в двух биологических условиях. [4]

По мере распространения высокопроизводительных технологий технологические и/или финансовые ограничения заставили исследователей собирать наборы данных с относительно небольшими размерами выборок (например, небольшое количество тестируемых людей) и большим количеством переменных, измеряемых на одну выборку (например, тысячи уровней экспрессии генов). В этих наборах данных слишком немногие из измеренных переменных показали статистическую значимость после классической поправки на множественные тесты со стандартными процедурами множественного сравнения . Это создало необходимость во многих научных сообществах отказаться от FWER и нескорректированного тестирования множественных гипотез в пользу других способов выделить и ранжировать в публикациях те переменные, которые демонстрируют заметные эффекты для отдельных лиц или методов лечения, которые в противном случае были бы отклонены как несущественные после стандартной поправки для множественных тестов. В ответ на это были предложены различные коэффициенты ошибок (и они стали широко использоваться в публикациях), которые менее консервативны, чем FWER, при выделении потенциально примечательных наблюдений. FDR полезен, когда исследователи ищут «открытия», которые дадут им возможность последующей работы (например, обнаружение многообещающих генов для последующих исследований), и заинтересованы в контроле доли «ложных версий», которые они готовы принять.

Литература

Концепция FDR была формально описана Йоавом Беньямини и Йосефом Хохбергом в 1995 году [1] (процедура BH) как менее консервативный и, возможно, более подходящий подход для выявления немногих важных из тривиального множества протестированных эффектов. Рузвельт оказал особое влияние, поскольку он стал первой альтернативой FWER, получившей широкое признание во многих научных областях (особенно в науках о жизни, от генетики до биохимии, онкологии и наук о растениях). [3] В 2005 году статья Беньямини и Хохберга 1995 года была признана одной из 25 наиболее цитируемых статистических статей. [5]

До появления в 1995 году концепции Рузвельта в статистической литературе рассматривались различные идеи-предшественники. В 1979 году Холм предложил процедуру Холма [6] — пошаговый алгоритм управления FWER, который по крайней мере столь же мощный, как и известная корректировка Бонферрони . Этот пошаговый алгоритм сортирует p -значения и последовательно отклоняет гипотезы, начиная с наименьших p -значений.

Бенджамини (2010) сказал, что уровень ложных открытий [3] и статья Бенджамини и Хохберг (1995) берут свое начало в двух статьях, посвященных множественному тестированию:

В ходе независимых испытаний в 1995 году Бенджамини и Хохберг доказали, что процедура BH контролирует FDR. [1] В 1986 году Р. Дж. Саймс предложил ту же процедуру, что и «процедура Саймса», для управления FWER в слабом смысле (в соответствии с нулевой гипотезой пересечения), когда статистика независимы. [10]

Определения

Основываясь на приведенных ниже определениях, мы можем определить Q как долю ложных открытий среди открытий (отклонений нулевой гипотезы):

.

где – количество ложных открытий и – количество истинных открытий.

Тогда уровень ложного обнаружения ( FDR ) будет выглядеть просто: [1]

где ожидаемое значение .​ Цель состоит в том, чтобы поддерживать FDR ниже заданного порога q . Чтобы избежать деления на ноль , определяется как 0, когда . Формально, . [1]

Классификация множественных проверок гипотез

В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть количество m нулевых гипотез, обозначенных: H 1H 2 , ...,  H m . Используя статистический тест , мы отвергаем нулевую гипотезу, если тест признан значимым. Мы не отвергаем нулевую гипотезу, если тест незначим. Суммирование результатов каждого типа по всем H i   дает следующие случайные величины:

В m тестах гипотез, которые являются истинными нулевыми гипотезами, R — наблюдаемая случайная величина, а S , T , U и V — ненаблюдаемые случайные величины .

Процедуры контроля

Настройки для многих процедур таковы, что мы проверяем нулевые гипотезы и соответствующие им значения p . Перечислим эти p -значения в порядке возрастания и обозначим их . Процедура, которая переходит от маленькой тестовой статистики к большой, будет называться повышающей процедурой. Аналогичным образом, в процедуре «понижения» мы переходим от большой соответствующей тестовой статистики к меньшей.

Процедура Бенджамини – Хохберга

Процедура Беньямини-Хохберга применяется к набору из m = 20 упорядоченных по возрастанию значений p с уровнем контроля ложного обнаружения α = 0,05. P-значения отвергнутой нулевой гипотезы (т.е. заявленных открытий) окрашены в красный цвет. Обратите внимание, что существуют отклоненные значения p, которые находятся выше линии отклонения (синего цвета), поскольку все нулевые гипотезы значений p, которые ранжированы до значения p последнего пересечения, отклоняются. Здесь аппроксимации MFDR = 0,02625 и AFDR = 0,00730.

Процедура Беньямини-Хохберга (процедура повышения BH) контролирует FDR на уровне . [1] Это работает следующим образом:

  1. Для данного найдите наибольшее k такое, что
  2. Отклонить нулевую гипотезу (т. е. объявить открытия) для всех

Геометрически это соответствует построению графика зависимости от k (по осям y и x соответственно), рисованию линии через начало координат с наклоном и объявлению открытий для всех точек слева, вплоть до последней точки, которая не находится выше, включительно. линия.

Процедура BH действительна, когда m тестов независимы , а также при различных сценариях зависимости, но не является универсальной. [11] Он также удовлетворяет неравенству:

Если в процедуру BH вставлена ​​оценка , то уже не гарантируется достижение контроля FDR на желаемом уровне. [3] В оценщике могут потребоваться корректировки, и было предложено несколько модификаций. [12] [13] [14] [15]

Обратите внимание, что среднее значение для этих m тестов равно , Mean(FDR ) или MFDR, с поправкой на m независимых или положительно коррелированных тестов (см. AFDR ниже). Выражение MFDR здесь предназначено для одного перевычисленного значения и не является частью метода Бенджамини и Хохберга.

Процедура Бенджамини-Екутиэли

Процедура Бенджамини – Йекутиэли контролирует частоту ложных открытий при предположениях о произвольной зависимости. [11] Это уточнение изменяет порог и находит наибольшее значение k такое, что:

Обратите внимание, что это можно аппроксимировать, используя разложение в ряд Тейлора и константу Эйлера – Маскерони ( ):

Используя MFDR и приведенные выше формулы, скорректированный MFDR (или AFDR) представляет собой минимум среднего значения для m зависимых тестов ,  т.е. Другой способ справиться с зависимостью — это загрузка и повторная рандомизация. [4] [16] [17]

Процедура Стори-Тибширани

Схематическое изображение процедуры Стори-Тибширани для поправки на проверку множественных гипотез при условии правильно рассчитанных значений p. ось Y — частота.

В процедуре Стори-Тибширани значения q используются для управления FDR.

Характеристики

Адаптивный и масштабируемый

Использование процедуры множественности, которая контролирует критерий FDR, является адаптивным и масштабируемым . Это означает, что контроль FDR может быть очень либеральным (если данные это оправдывают) или консервативным (действующим, близким к контролю FWER для разреженной проблемы) - все в зависимости от количества проверенных гипотез и уровня значимости. [3]

Критерий FDR адаптируется таким образом, что одно и то же количество ложных открытий (V) будет иметь разные последствия в зависимости от общего количества открытий (R). Это контрастирует с семейным критерием частоты ошибок. Например, если проверить 100 гипотез (скажем, 100 генетических мутаций или SNP на предмет ассоциации с некоторым фенотипом в некоторой популяции):

Критерий FDR является масштабируемым , поскольку одна и та же доля ложных открытий от общего числа открытий (Q) остается разумной для различного числа общих открытий (R). Например:

Зависимость между тестовой статистикой

Управление FDR с помощью процедуры линейного повышения BH на уровне q имеет несколько свойств, связанных со структурой зависимостей между тестовыми статистиками m нулевых гипотез, которые корректируются. Если статистика теста:

Доля истинных гипотез

Если все нулевые гипотезы верны ( ), то контроль FDR на уровне q гарантирует контроль над FWER (это еще называют «слабым контролем FWER» ): просто потому, что событие отклонения хотя бы одной истинной нулевой гипотезы — это именно событие , а событие — это именно событие (когда по определению). [1] Но если необходимо сделать несколько истинных открытий ( ​​), тогда FWER ≥ FDR . В этом случае появится возможность улучшить мощность обнаружения. Это также означает, что любая процедура, которая контролирует FWER, будет также контролировать FDR.

Средняя мощность

Средняя мощность процедуры Беньямини-Хохберга может быть вычислена аналитически [18]

Связанные понятия

Открытию FDR предшествовало и последовало множество других типов ошибок. К ним относятся:

Ложный уровень покрытия

Коэффициент ложного покрытия (FCR) в некотором смысле является аналогом доверительного интервала FDR . FCR указывает средний уровень ложного покрытия, а именно не покрытия истинных параметров, среди выбранных интервалов. FCR дает одновременный охват на уровне всех параметров, рассматриваемых в задаче. Интервалы с вероятностью одновременного покрытия 1-q могут контролировать FCR, который будет ограничен q . Существует множество процедур FCR, таких как: выбранный Бонферрони – скорректированный Бонферрони, [ нужна ссылка ] Скорректированные CI, выбранные по BH (Benjamini and Yekutieli (2005)), [24] Bayes FCR (Yekutieli (2008)), [ нужна ссылка ] и другие методы Байеса. [25]

Байесовский подход

Были установлены связи между FDR и байесовским подходом (включая эмпирические методы Байеса), [21] [26] [27] пороговыми коэффициентами вейвлетов и выбором модели , [28] [29] [30] [31] и обобщением доверительного интервала. в коэффициент ложных заявлений о покрытии (FCR). [24]

Смотрите также

Рекомендации

  1. ^ abcdefghi Бенджамини Ю., Хохберг Ю. (1995). «Контроль количества ложных обнаружений: практичный и мощный подход к множественному тестированию». Журнал Королевского статистического общества, серия B. 57 (1): 289–300. МР  1325392.
  2. ^ Шаффер, JP (январь 1995 г.). «Множественная проверка гипотез». Ежегодный обзор психологии . 46 (1): 561–584. doi : 10.1146/annurev.ps.46.020195.003021. S2CID  7696063. Гейл  A16629837.
  3. ^ abcdefg Бенджамини Ю (2010). «Обнаружение уровня ложных открытий». Журнал Королевского статистического общества, серия B. 72 (4): 405–416. дои : 10.1111/j.1467-9868.2010.00746.x .
  4. ^ аб Стори Дж. Д., Тибширани Р. (август 2003 г.). «Статистическая значимость для полногеномных исследований». Труды Национальной академии наук Соединенных Штатов Америки . 100 (16): 9440–5. Бибкод : 2003PNAS..100.9440S. дои : 10.1073/pnas.1530509100 . ПМК 170937 . ПМИД  12883005. 
  5. ^ Райан Т.П., Вудалл WH (2005). «Самые цитируемые статистические статьи». Журнал прикладной статистики . 32 (5): 461–474. Бибкод : 2005JApSt..32..461R. дои : 10.1080/02664760500079373. S2CID  109615204.
  6. ^ Холм С. (1979). «Простая процедура последовательного отбраковывания множественных испытаний». Скандинавский статистический журнал . 6 (2): 65–70. JSTOR  4615733. MR  0538597.
  7. ^ Шведер Т., Спьётволл Э. (1982). «Графики P-значений для одновременной оценки множества тестов». Биометрика . 69 (3): 493–502. дои : 10.1093/biomet/69.3.493.
  8. ^ Хохберг Ю., Бенджамини Ю. (июль 1990 г.). «Более мощные процедуры для проверки множественной значимости». Статистика в медицине . 9 (7): 811–8. дои : 10.1002/sim.4780090710. ПМИД  2218183.
  9. ^ ab Soric B (июнь 1989 г.). «Статистические «открытия» и оценка размера эффекта». Журнал Американской статистической ассоциации . 84 (406): 608–610. дои : 10.1080/01621459.1989.10478811. JSTOR  2289950.
  10. ^ Саймс Р.Дж. (1986). «Улучшенная процедура Бонферрони для множественных тестов значимости». Биометрика . 73 (3): 751–754. дои : 10.1093/biomet/73.3.751.
  11. ^ abcde Бенджамини Ю., Йекутиэли Д. (2001). «Контроль уровня ложных обнаружений при множественном тестировании с зависимостями». Анналы статистики . 29 (4): 1165–1188. дои : 10.1214/aos/1013699998 . МР  1869245.
  12. ^ Стори Дж.Д., Тейлор Дж.Э., Зигмунд Д. (2004). «Строгий контроль, консервативная точечная оценка и одновременная консервативная последовательность показателей ложного обнаружения: единый подход». Журнал Королевского статистического общества, серия B. 66 : 187–205. дои : 10.1111/j.1467-9868.2004.00439.x . S2CID  12646251.
  13. ^ Бенджамини Ю., Кригер А.М., Йекутиэли Д. (2006). «Адаптивные линейные процедуры повышения, контролирующие частоту ложных обнаружений». Биометрика . 93 (3): 491–507. дои : 10.1093/biomet/93.3.491.
  14. ^ Гаврилов Ю., Бенджамини Ю., Саркар С.К. (2009). «Адаптивная процедура понижения с проверенным контролем FDR в условиях независимости». Анналы статистики . 37 (2): 619. arXiv : 0903.5373 . дои : 10.1214/07-AOS586. S2CID  16913244.
  15. ^ Бланшар Дж., Рокен Э (2008). «Два простых достаточных условия для контроля Рузвельта». Электронный статистический журнал . 2 : 963–992. arXiv : 0802.1406 . дои : 10.1214/08-EJS180. S2CID  16662020.
  16. ^ Екутиэли Д., Бенджамини Ю. (1999). «Процедура управления частотой ложного обнаружения на основе повторной выборки для статистики зависимых испытаний». Дж. Статист. Планирование Инф . 82 (1–2): 171–196. дои : 10.1016/S0378-3758(99)00041-5.
  17. ^ ван дер Лаан MJ, Дудуа С (2007). Множественные процедуры тестирования с применением в геномике . Нью-Йорк: Спрингер.
  18. ^ Глюк, Дебора Х; Мандель, Ян; Каримпур-Фард, Анис; Хантер, Лоуренс; Мюллер, Кейт Э. (30 января 2008 г.). «Точные расчеты средней мощности для процедуры Беньямини-Хохберга». Международный журнал биостатистики . 4 (1): Статья 11. doi :10.2202/1557-4679.1103. ПМК 3020656 . ПМИД  21243075. 
  19. ^ Саркар СК (2007). «Пошаговые процедуры, управляющие обобщенным FWER и обобщенным FDR». Анналы статистики . 35 (6): 2405–20. arXiv : 0803.2934 . дои : 10.1214/009053607000000398. S2CID  14784911.
  20. ^ Саркар СК, Го В (июнь 2009 г.). «Об обобщенной частоте ложных открытий». Анналы статистики . 37 (3): 1545–65. arXiv : 0906.3091 . дои : 10.1214/08-AOS617. JSTOR  30243677. S2CID  15746841.
  21. ^ аб Эфрон Б (2008). «Микрочипы, эмпирический Байес и модель двух групп». Статистическая наука . 23 : 1–22. arXiv : 0808.0603 . дои : 10.1214/07-STS236. S2CID  8417479.
  22. ^ аб Стори JD (2002). «Прямой подход к уровню ложного обнаружения» (PDF) . Журнал Королевского статистического общества, серия B. 64 (3): 479–498. CiteSeerX 10.1.1.320.7131 . дои : 10.1111/1467-9868.00346. S2CID  122987911. 
  23. ^ Бенджамини Ю (декабрь 2010 г.). «Одновременный и выборочный вывод: текущие успехи и будущие проблемы». Биометрический журнал. Биометрическая газета . 52 (6): 708–21. дои : 10.1002/bimj.200900299. PMID  21154895. S2CID  8806192.
  24. ^ аб Бенджамини Ю, Екутиэли Ю (2005). «Коэффициент ложного обнаружения, контролирующий доверительные интервалы для выбранных параметров». Журнал Американской статистической ассоциации . 100 (469): 71–80. дои : 10.1198/016214504000001907. S2CID  23202143.
  25. ^ Чжао З., Джин Хван Дж.Т. (2012). «Эмпирический коэффициент байесовского ложного покрытия, контролирующий доверительные интервалы». Журнал Королевского статистического общества, серия B. 74 (5): 871–891. дои : 10.1111/j.1467-9868.2012.01033.x. hdl : 10.1111/j.1467-9868.2012.01033.x . S2CID  111420152.
  26. ^ Стори Джей Ди (2003). «Положительная частота ложных открытий: байесовская интерпретация и значение q». Анналы статистики . 31 (6): 2013–2035. дои : 10.1214/aos/1074290335 .
  27. ^ Эфрон Б (2010). Крупномасштабный вывод . Издательство Кембриджского университета . ISBN 978-0-521-19249-1.
  28. ^ Абрамович Ф., Бенджамини Ю., Донохо Д., Джонстон И.М. (2006). «Адаптация к неизвестной разреженности путем контроля частоты ложных открытий». Анналы статистики . 34 (2): 584–653. arXiv : math/0505374 . Бибкод : 2005math......5374A. дои : 10.1214/009053606000000074. S2CID  7581060.
  29. ^ Донохо Д., Джин Дж. (2006). «Асимптотическая минимаксность порога ложного обнаружения для разреженных экспоненциальных данных». Анналы статистики . 34 (6): 2980–3018. arXiv : математика/0602311 . Бибкод : 2006math......2311D. дои : 10.1214/009053606000000920. S2CID  9080115.
  30. ^ Бенджамини Ю., Гаврилов Ю. (2009). «Простая процедура прямого выбора, основанная на контроле частоты ложных обнаружений». Анналы прикладной статистики . 3 (1): 179–198. arXiv : 0905.2819 . Бибкод : 2009arXiv0905.2819B. дои : 10.1214/08-AOAS194. S2CID  15719154.
  31. ^ Донохо Д., Джин Дж.С. (2004). «Высшая критика за обнаружение разреженных гетерогенных смесей». Анналы статистики . 32 (3): 962–994. arXiv : math/0410072 . Бибкод : 2004math.....10072D. дои : 10.1214/009053604000000265. S2CID  912325.

Внешние ссылки