stringtranslate.com

Ложноположительный процент

В статистике при выполнении множественных сравнений отношение ложных положительных результатов (также известное как отношение выпадений или ложных тревог) представляет собой вероятность ложного отклонения нулевой гипотезы для конкретного теста . Показатель ложных положительных результатов рассчитывается как отношение между числом отрицательных событий, ошибочно классифицированных как положительные ( ложные положительные результаты ), и общим числом фактических отрицательных событий (независимо от классификации).

Коэффициент ложных срабатываний (или «коэффициент ложной тревоги») обычно относится к ожидаемому показателю ложноположительного результата .

Определение

Ложноположительный процент составляет

где — количество ложных положительных результатов, — количество истинно отрицательных результатов, — общее количество истинно отрицательных результатов.

Уровень значимости, используемый для проверки каждой гипотезы, устанавливается на основе формы вывода ( одновременный вывод или выборочный вывод ) и его подтверждающих критериев (например, FWER или FDR ), которые были заранее определены исследователем.

При выполнении множественных сравнений в статистической структуре, такой как выше, отношение ложных положительных результатов (также известное как отношение ложных тревог , в отличие от отношения ложных положительных результатов / коэффициента ложных тревог ) обычно относится к вероятности ложного отклонения нулевой гипотезы для конкретного теста . Используя предложенную здесь терминологию, это просто .

Поскольку V является случайной величиной и является константой ( ), отношение ложных срабатываний также является случайной величиной, изменяющейся в диапазоне от 0 до 1. Коэффициент ложных срабатываний (или «коэффициент ложной тревоги») обычно относится к ожиданию отношения ложных срабатываний , выраженному как .

Стоит отметить, что два определения («false positive ratio» / «false positive rate») в некоторой степени взаимозаменяемы. Например, в указанной статье [1] выступает в качестве «rate» ложноположительных результатов, а не в качестве «ratio».

Классификация множественных проверок гипотез

Следующая таблица определяет возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть число m нулевых гипотез, обозначенных как: H 1H 2 , ...,  H m . Используя статистический тест , мы отвергаем нулевую гипотезу, если тест объявлен значимым. Мы не отвергаем нулевую гипотезу, если тест незначим. Суммирование каждого типа результата по всем H i   дает следующие случайные величины:

В m гипотезах, проверка которых является истинной нулевой гипотезой, R является наблюдаемой случайной величиной, а S , T , U и V являются ненаблюдаемыми случайными величинами .

Сравнение с другими показателями ошибок

Хотя частота ложноположительных результатов математически равна частоте ошибок первого типа , она рассматривается как отдельный термин по следующим причинам: [ необходима ссылка ]

В противоположность этому, частота ложных положительных результатов связана с пост-априорным результатом, который представляет собой ожидаемое число ложных положительных результатов, деленное на общее число гипотез при реальной комбинации истинных и неистинных нулевых гипотез (без учета «глобальной нулевой» гипотезы). Поскольку частота ложных положительных результатов является параметром, который не контролируется исследователем, ее нельзя отождествить с уровнем значимости.

Ложноположительный уровень также не следует путать с семейным уровнем ошибок , который определяется как . По мере роста числа тестов семейный уровень ошибок обычно стремится к 1, в то время как ложноположительный уровень остается фиксированным.

Наконец, важно отметить существенную разницу между показателем ложноположительных результатов и показателем ложных результатов : в то время как первый определяется как , второй определяется как .

Смотрите также

Ссылки

  1. ^ Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение частоты ложноположительных результатов в программе скрининга инфекций вируса иммунодефицита человека». The New England Journal of Medicine . 319 (15): 961–964. doi :10.1056/NEJM198810133191501. PMID  3419477.